Publications

금융권 유일의 연구 조직으로 다양한 신기술 영역에서 하나금융그룹의 위상을 높이고
세계적 권위의 학회에서 대외 성과를 달성하고 있습니다.

Patents

텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법

등록일자
2025.08.29
등록번호
10-2854771
출원인
주식회사 하나금융티아이
링크

내용

본 발명은 학습 데이터의 생성 기술에 관한 것으로서, 상세하게는 이미지 내에 존재하는 텍스트를 검출 및 인식

하는 모델을 학습할 때 학습 데이터로 사용되는 문서 이미지를 새롭게 추가하는 경우 그 추가되는 문서 이미지로

부터 빠르게 추가 정답 데이터를 생성할 수 있는 문서 이미지의 레이블링 장치 및 방법에 관한 것이다. 이를 위

해, 본 발명에 따른 문서 이미지의 레이블링 방법은 컴퓨팅 장치에서 수행되는 문서 이미지의 레이블링 방법으로

서, 기 학습된 텍스트 검출 및 인식 모델을 이용해 정답 데이터가 없는 문서 이미지로부터 단어 박스 및 글자열

을 유추하여 자동 레이블링된 제1 학습 데이터를 생성하는 단계와, 상기 제1 학습 데이터에 대한 선택적 레이블

링을 수행하여 제2 학습 데이터를 생성하는 단계를 포함한다. 

 

 본 발명은 텍스트 검출 및 인식을 위한 심층신경망 학습에 사용되는 다양한 학습 데이터 

빠르고 정확하게 생성할 수 있는 효과가 있다

 

본 발명에 따르면 기존 학습한 심층신경망(DNN)을 통해 유추된 단어 박스와 글자열을 그대로 이용하기 때문에

종래 수작업으로 처음부터 정답 데이터를 만들어야 하는 수고와 그에 따라 소요되는 작업 시간을 현저히 줄일

수 있으며, 필요에 따라 선택적 레이블링이 가능하기 때문에 보정된 데이터를 통해 더욱 향상된 학습 모델을 생

성할 수 있다.