Publications
금융권 유일의 연구 조직으로 다양한 신기술 영역에서 하나금융그룹의 위상을 높이고
세계적 권위의 학회에서 대외 성과를 달성하고 있습니다.
Patents
텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블 조절 장치 및 방법
- 등록일자
- 2024.10.10
- 등록번호
- 10-2022-0045352, 10-2717407
- 출원인
- 주식회사 하나금융티아이
- 링크
내용
본 발명은 학습 데이터의 생성 기술에 관한 것으로서, 상세하게는 이미지 내에 존재하는 텍스트를 검출 및 인식
하는 모델을 학습할 때 학습 데이터로 사용되는 문서 이미지의 레이블을 최적화할 수 있는 문서 이미지의 레이블
조절 장치 및 방법에 관한 것이다. 이를 위해, 본 발명에 따른 문서 이미지의 레이블 조절 방법은 컴퓨팅 장치에서
수행되는 문서 이미지의 레이블 조절 방법으로서, 문서 이미지를 그레이 스케일로 변환하는 제1 단계와, 상기
문서 이미지의 단어 박스로부터 외곽으로 k 픽셀 떨어진 외곽 단어 박스를 설정하는 제2 단계와, 상기 외곽 단어
박스에서 상기 단어 박스 영역을 제외한 부분의 픽셀 색상들의 제1 평균값을 계산하는 제3 단계와, 상기 단어 박
스 영역의 픽셀 색상들의 제2 평균값을 계산하는 제4 단계와, 상기 단어 박스 영역을 제2 평균값보다 밝은 제1
영역 및 제2 평균값보다 어두운 제2 영역으로 구분하는 제5 단계와, 제2 평균값이 제1 평균값보다 크면 제1 영역
을 글자 영역으로 설정하고 그렇지 않으면 제2 영역을 글자 영역으로 설정하는 제6 단계와, 상기 설정한 글자 영
역을 포함하는 최소 영역 사각형을 설정하는 제7 단계와, 상기 최소 영역 사각형을 네 방향으로 n 픽셀만큼 늘린
단어 박스를 출력하는 제8 단계를 포함하여, 상기 n 픽셀만큼 늘린 단어 박스를 이용해 상기 제2 단계 내지 제8
단계를 소정 횟수만큼 반복하는 것을 특징으로 한다.