한국딥러닝, 글로벌 OCR 벤치마크 1위…구글 제미나이·GPT-5 제쳐 - 플래텀(Platum)

[AI] 제미나이 | 2026년 4월 22일 08:27 | 🏷️ AI 딜

#gpt-5 #머신러닝/연구 #ai 투자 #소프트뱅크 #스타트업 펀딩 #엔비디아 #오픈ai

원문 출처: [AI] 제미나이 · Genesis Park에서 요약 및 분석

요약

오픈AI가 1220억달러(약 183조원) 약정 자본을 유치하며 기업가치 8520억달러(약 1284조원)를 인정받는 펀딩 라운드를 마무리했다고 31일(현지시간) 공식 블로그를 통해 밝혔다.소프트뱅크, 아마존, 엔비디아, 마이크로소프트가 주도한 이번 라운드에는 블랙록, 블랙스톤, 피델리티, 세쿼이아 캐피털 등 글로벌 주요 기관투자자들이 대거 참여했다. 처음으로 은행 채널을 통해 개인 투자자 참여를 열어 30억달러(약 4조원) 이상을 개인 투자자로부터 모집했으며, ARK 인베스트가 운용하는 ETF에도 편입돼 더 많은 일반 투자자가 오픈A

본문

공공·기업용 시각지능 솔루션 기업 한국딥러닝이 허깅페이스에 공식 등재된 글로벌 멀티모달 OCR 벤치마크 ‘OCRBench v2’ 2026년 3월 영어 부문 평가에서 68.1점으로 종합 1위를 기록했다. OCRBench v2는 HUST·바이트댄스 등이 공동 개발한 대규모 벤치마크로 단순 텍스트 인식을 넘어 레이아웃 분석·수식·도표 해석·논리적 추론 등 31개 시나리오를 검증한다. 대부분의 모델이 100점 만점 중 50점을 넘기기 힘들 만큼 난이도가 높다. 한국딥러닝은 2위 제미나이 3 프로 프리뷰(63.4점)와 4.7점 차이를 기록했으며, GPT-5(11위·55.5점)·클로드 오퍼스 4.6(15위·48.4점) 등을 하위권으로 밀어냈다. 문서 구조화(파싱) 40.7점, 맥락 이해 85.4점에서 특히 두드러진 강세를 보였다. 이번 성과의 핵심은 AI 환각 현상을 최소화한 ‘Near-Zero Hallucination’ 기술이다. 구글·오픈AI 등 빅테크가 범용 시각 언어 모델(VLM)을 활용하는 것과 달리, 한국딥러닝은 문서 구조 이해에 특화된 VLM을 처음부터 독자적으로 설계했다. 레이아웃·항목 간 관계·위치 정보를 동시에 반영해 단순 인식 오류가 실제 의미 오류로 이어지는 것을 최소화하는 방식이다. 수억 건 규모의 문서 도메인 특화 데이터가 이를 뒷받침한다. 2019년 설립된 한국딥러닝은 현재 공공·기업 고객 80곳 이상에 OCR·객체 검출·영상 이해 등 비전 AI 솔루션을 제공하고 있으며, 4억 장 이상의 독점 데이터셋을 보유하고 있다. 김동현 한국딥러닝 CSO는 “범용 모델이 따라올 수 없는 문서 지능 영역에서 구조적 설계를 통해 기술 격차를 증명해낸 것”이라며 “금융·법무·공공 등 오차가 허용되지 않는 산업 현장에서 환각 없는 문서 AI의 가치를 글로벌 무대에서 보여줄 것”이라고 말했다.

원문 보기 ([AI] 제미나이)

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

요약

본문

관련 저널 읽기