Publications
금융권 유일의 연구 조직으로 다양한 신기술 영역에서 하나금융그룹의 위상을 높이고
세계적 권위의 학회에서 대외 성과를 달성하고 있습니다.
Patents
텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법
- 등록일자
- 2025.08.29
- 등록번호
- 10-2854771
- 출원인
- 주식회사 하나금융티아이
- 링크
내용
본 발명은 학습 데이터의 생성 기술에 관한 것으로서, 상세하게는 이미지 내에 존재하는 텍스트를 검출 및 인식
하는 모델을 학습할 때 학습 데이터로 사용되는 문서 이미지를 새롭게 추가하는 경우 그 추가되는 문서 이미지로
부터 빠르게 추가 정답 데이터를 생성할 수 있는 문서 이미지의 레이블링 장치 및 방법에 관한 것이다. 이를 위
해, 본 발명에 따른 문서 이미지의 레이블링 방법은 컴퓨팅 장치에서 수행되는 문서 이미지의 레이블링 방법으로
서, 기 학습된 텍스트 검출 및 인식 모델을 이용해 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열
을 유추하여 자동 레이블링된 제1 학습 데이터를 생성하는 단계와, 상기 제1 학습 데이터에 대한 선택적 레이블
링을 수행하여 제2 학습 데이터를 생성하는 단계를 포함한다.
본 발명은 텍스트 검출 및 인식을 위한 심층신경망 학습에 사용되는 다양한 학습 데이터
빠르고 정확하게 생성할 수 있는 효과가 있다
본 발명에 따르면 기존 학습한 심층신경망(DNN)을 통해 유추된 단어 박스와 글자열을 그대로 이용하기 때문에
종래 수작업으로 처음부터 정답 데이터를 만들어야 하는 수고와 그에 따라 소요되는 작업 시간을 현저히 줄일
수 있으며, 필요에 따라 선택적 레이블링이 가능하기 때문에 보정된 데이터를 통해 더욱 향상된 학습 모델을 생
성할 수 있다.