사이냅소프트, 구글의 ‘터보퀀트’ 기술 적용…”OCR 메모리 효율 극대화” - AI타임스
[AI] 구글 터보퀀트
|
|
{'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} 머신러닝/연구
#두푸스
#멋진
#클래식
#폴리 라마도
#폴리라마
#ai
#구글
#기타 ai
#동아사이언스
#터보퀀트
요약
사이냅소프트는 자사의 AI 솔루션 사이냅 OCR IX에 구글의 최신 양자화 알고리즘 ‘터보퀀트’를 적용해 VLM의 메모리 효율을 극대화하고 인식 정확도 손실을 최소화했다. 이를 통해 동일한 GPU 환경에서도 더 긴 문서와 대규모 배치를 병목 없이 처리할 수 있어 고가의 하드웨어 도입 부담을 덜고 고객들의 총소유비용을 낮출 계획이다. 또한, 품질 손실을 1% 이하로 억제한 ‘사이냅 OCR IX CPU 버전’을 통해 GPU 구축이 제한적인 환경에서도 분당 약 100건의 추론 처리를 지원하며 유연한 기술 지원을 약속했다.
왜 중요한가
본문
도큐먼트 AI 전문 사이냅소프트(대표 전경헌)는 구글이 공개한 최신 벡터 양자화 알고리즘 ‘터보퀀트(TurboQuant)’를 AI 솔루션 ‘사이냅 OCR IX’에 적용했다고 15일 밝혔다. 사이냅 OCR IX는 비전언어모델(VLM)과 AI 에이전트 기술을 결합해 비정형 문서의 맥락을 이해하고 데이터를 추출하는 AI 에이전틱 광학문자인식(OCR) 솔루션이다. 일반적으로 대형언어모델(LLM)이나 VLM을 운영할 때, 긴 문서를 처리할수록 AI의 단기 기억 장치인 ‘KV 캐시(Key-Value Cache)’가 방대한 메모리를 차지해 고가의 고성능 GPU가 요구된다는 한계가 있었다. 사이냅소프트는 이러한 인프라 구축 부담을 해결하기 위해 터보퀀트를 채택했다. 모델의 인식 정확도 손실을 최소화하면서도 KV 캐시를 고도로 압축할 수 있도록 사이냅 OCR IX의 VLM 엔진에 적용한 것이다. 이를 통해 사이냅 OCR IX는 동일 GPU 환경에서 더 긴 컨텍스트와 더 큰 배치를 병목 없이 빠르고 안정적으로 처리할 수 있게 됐다는 설명이다. 고가의 고성능 GPU 서버를 별도로 구축하기 부담스러웠던 고객들의 TCO(총소유비용)을 낮추겠다는 계획이다. 더불어, GPU 인프라 구축이 제한적인 환경을 위해 ‘사이냅 OCR IX CPU 버전’도 지원하고 있다. 자체 개발 모델 특성에 맞춘 정밀 프로파일링으로 연산 효율을 극대화해, 품질 손실을 1% 이하로 억제하면서도 CPU 서버만으로 분당 약 100건 수준의 원활한 추론 처리가 가능하도록 성능을 확보했다고 강조했다. 전경헌 사이냅소프트 대표는 “단순히 자체 기술력에만 머물지 않고, 글로벌 빅테크의 최신 연구 성과인 터보퀀트를 기민하게 상용화해 기존 VLM의 한계를 극복했다”라며 “CPU 버전까지 아우르는 유연한 인프라 지원을 통해, 기업들이 도입 비용 걱정 없이 에이전틱 OCR 환경을 구축하고 실질적인 업무 자동화를 이룰 수 있도록 적극 지원하겠다”라고 말했다. 장세민 기자 [email protected]