Opening
- OCR 기술을 일상에서 얼마나 많이 사용하고 있나요? 주변에 OCR을 활용해서 우리의 삶을 편리하게 해주는 서비스를 찾아서 그 목록을 리스트 해봅시다. 어떤 서비스가 가장 성능이 좋은지도 토론해 봅시다.
- [예시 답안]
- Microsoft OfficeLens(평점 4.7, 천만이상 다운로드)
- Voyagerx vflat(평점 4.5, 백만이상 다운로드)
- Adobe Scan (평점 4.7, 천만이상 다운로드)
- Naver CLOVA OCR 등
Check-up 항목
- 최근에 많이 활용되고 있는 여러가지 OCR 기능을 간단히 활용하고 비교해 봅시다.
- [예시 답안]
- 아래 3가지 OCR 기능의 특장점 및 주로 사용하기에 좋은 사례를 생각해 봅시다.
- Google OCR API
- keras-ocr
- Tesseract
Closing
- 프로젝트 결과물의 OCR 성능이 그렇게 마음에 쏙 들지는 않을 겁니다. OCR SOTA 논문을 찾아보고 어떤 점을 개선했는지 이해하고 이에 대해서 함께 토론해 봅시다.
- [예시 답안]
- 이미지에서 텍스트 인식을 위해서는 아래 2단계가 필요합니다.
- Text Detection(텍스트 감지) : 이미지에서 텍스트 인스턴스를 찾습니다.
- Text Recognition(텍스트 인식) : 감지된 텍스트 인스턴스의 각 문자를 디코딩합니다.
- OCR SOTA 논문으로 아래 3개를 다루고 있습니다.
- Textsnake [Long et al., 2018]: , 매우 복잡한 텍스트 모양을 처리하는 특이성을 가진 Text Detection(텍스트 감지) 알고리즘.
- MORAN [Luo et al., 2019], Rectification Network와 Attention 메커니즘을 사용하여 복잡한 텍스트 상자를 수정하고 읽는 Text Recognition(텍스트 인식) 알고리즘.
- FOTS [Liu et al., 2018], Robustness(견고성)과 Efficiency(효율성)을 개선하기 위해 Text Detection(텍스트 탐지) 단계와 Text Recognition(텍스트 인식) 단계 사이의 Convolution을 공유하는 End-to-end 접근 방식.
참고자료
- FOTS와 Textsnake를 혼합 한 실험의 흥미로운 결과도 소개되어 있으니 아래 링크를 한번 읽어보세요.
'성장하기' 카테고리의 다른 글
[E-20] 난 스케치를 할테니 너는 채색을 하거라 (0) | 2021.03.18 |
---|---|
[E-19] BERT로 영화리뷰 감성분류하기 (0) | 2021.03.16 |
[E-17] 다음에 볼 영화 예측하기 (0) | 2021.03.09 |
[E-16] 흐린 사진을 선명하게 (0) | 2021.03.04 |
[E-15] 트랜스포머로 만드는 대화형 챗봇 (0) | 2021.03.01 |
댓글