기업조회

특허 실용신안

특허/실용신안

특허 기본정보

텍스트 인식 모델의 트레이닝 방법, 텍스트 인식 방법 및 장치

특허 개요

특허 개요
기관명 NDSL
출원인 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
출원번호 10-2022-0109668
출원일자 2022-08-31
공개번호 20220921
공개일자 0000-00-00
등록번호
등록일자 0000-00-00
권리구분 KUPA
초록 본 출원은 텍스트 인식 모델의 트레이닝 방법, 텍스트 인식 방법 및 장치를 제공하며, 인공지능 기술분야에 관한 것으로서, 구체적으로 딥러닝, 컴퓨터 비전 기술분야에 관한 것이며, 광학 캐릭터 인식 등의 시나리오에 적용될 수 있다. 구체적인 구현 방안에 따르면, 획득된 샘플 이미지의 비전 특징에 대해 마스크 예측을 수행하여, 예측 비전 특징을 획득하고, 획득된 샘플 텍스트의 의미 특징에 대해 마스크 예측을 수행하여, 예측 의미 특징을 획득하며, 여기서, 샘플 이미지는 텍스트를 포함하고, 예측 비전 특징을 기초로 샘플 이미지의 텍스트의 제1 손실값을 결정하고, 예측 의미 특징을 기초로 샘플 텍스트의 제2 손실값을 결정하고, 제1 손실값과 제2 손실값을 기초로 트레이닝하여 텍스트 인식 모델을 획득함으로써, 텍스트 인식 모델이 비전 정보를 마이닝할 수 있을 뿐만 아니라, 의미 콘텍스트 논리도 마이닝할 수 있도록 하여, 텍스트 인식 모델을 기반으로 텍스트 인식을 수행할 때, 텍스트 인식의 다양성과 전면성을 향상시킬 수 있다.
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=KUPA&cn=KOR1020220109668
첨부파일

추가정보

추가정보
과학기술표준분류
ICT 기술분류
IPC분류체계CODE G06V-030/199,G06V-030/16,G06V-030/19,G06V-030/20
주제어 (키워드)