본문 바로가기
성장하기

[E-18] 문자를 읽을 수 있는 딥러닝

by 예시카의 일상 블로그 2021. 3. 11.

Opening


  • OCR 기술을 일상에서 얼마나 많이 사용하고 있나요? 주변에 OCR을 활용해서 우리의 삶을 편리하게 해주는 서비스를 찾아서 그 목록을 리스트 해봅시다. 어떤 서비스가 가장 성능이 좋은지도 토론해 봅시다.
    • [예시 답안]
    • Microsoft OfficeLens(평점 4.7, 천만이상 다운로드)
    • Voyagerx vflat(평점 4.5, 백만이상 다운로드)
    • Adobe Scan (평점 4.7, 천만이상 다운로드)
    • Naver CLOVA OCR 등

Check-up 항목


  • 최근에 많이 활용되고 있는 여러가지 OCR 기능을 간단히 활용하고 비교해 봅시다. 
    • [예시 답안]
    • 아래 3가지 OCR 기능의 특장점 및 주로 사용하기에 좋은 사례를 생각해 봅시다.
      • Google OCR API
      • keras-ocr
      • Tesseract

 

Closing


  • 프로젝트 결과물의 OCR 성능이 그렇게 마음에 쏙 들지는 않을 겁니다. OCR SOTA 논문을 찾아보고 어떤 점을 개선했는지 이해하고 이에 대해서 함께 토론해 봅시다.
    • [예시 답안]
    • 이미지에서 텍스트 인식을 위해서는 아래 2단계가 필요합니다.
      • Text Detection(텍스트 감지) : 이미지에서 텍스트 인스턴스를 찾습니다.
      • Text Recognition(텍스트 인식) : 감지된 텍스트 인스턴스의 각 문자를 디코딩합니다.
    • OCR SOTA 논문으로 아래 3개를 다루고 있습니다.
      • Textsnake [Long et al., 2018]: , 매우 복잡한 텍스트 모양을 처리하는 특이성을 가진 Text Detection(텍스트 감지) 알고리즘.
      • MORAN [Luo et al., 2019], Rectification Network와 Attention 메커니즘을 사용하여 복잡한 텍스트 상자를 수정하고 읽는 Text Recognition(텍스트 인식) 알고리즘.
      • FOTS [Liu et al., 2018], Robustness(견고성)과 Efficiency(효율성)을 개선하기 위해 Text Detection(텍스트 탐지) 단계와 Text Recognition(텍스트 인식) 단계 사이의 Convolution을 공유하는 End-to-end 접근 방식.

 

참고자료


 

OCR in Natural Images SOTA in Text Detection and Recognition | Sicara

Review of 3 papers in Scene Text Detection and Recognition introducing a detection, a recognition and an end-to-end approach.

www.sicara.ai

 

Road Sign OCR reading example

댓글