아크릴, 자체 AI ‘아름.H’ 구글·오픈AI·앤트로픽 성능 상회 - 이데일리

[AI] 앤트로픽 | | {'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} review
#ai #구글 #아름.h #아크릴 #오픈ai #review #서울대병원 #오픈소스 #의료 ai

요약

아크릴이 개발한 의료 특화 오픈소스 AI ‘ALLM.H’가 초대형 모델이 아닌 31B 규모로도 의사 면허 시험에서 96.78%라는 경이적인 성능을 기록했습니다. 이 모델은 서울대병원의 ‘HARI’와 빅테크 상용 모델을 모두 능가하며, 고품질 데이터와 정교한 학습 파이프라인을 통해 특화 분야의 효율성을 입증했습니다. 현재 연세의료원 등에서 임상 의사결정 지원 등 실증을 진행하며, 향후 금융과 법률 등 다른 산업 분야로도 기술을 확장할 계획입니다.

왜 중요한가

본문

이번 결과는 오픈소스 의료 AI 분야에서도 주목할 만하다. ALLM.H는 서울대병원이 개발한 오픈소스 의료 모델 ’HARI(89.2%)‘를 7.58%p 앞섰다. 특히, K-Med.ai가 실제 KMLE에서 달성한 96.4%에 비견되는 수준의 성능을 72B 이상의 초대형 모델이 아닌 31B 규모의 경량 오픈소스 모델로 구현했다는 점에서 업계의 주목을 받고 있다. 단순히 모델 규모를 키우는 방식이 아니라, 고품질 데이터 구성과 정교한 학습·추론 파이프라인 설계를 통해 특화 분야 성능을 끌어올린 사례라는 평가다. ALLM.H는 아크릴이 독자 개발한 산업 특화 파운데이션 모델 패밀리 ALLM(Acryl LLM)의 첫 번째 결과물로, 의료·헬스케어 분야에 특화해 개발됐다. 아크릴은 2024년 Weights & Biases(W&B)가 운영하는 한국어 LLM 리더보드 ’호랑이 벤치(Open Ko-LLM Leaderboard)‘에서 오픈소스 부문 1위를 기록하며 파인튜닝 역량을 입증한 바 있다. 이후 축적한 고성능 모델 학습 노하우를 바탕으로 산업별 특화 파운데이션 모델 개발에 착수했으며, ALLM.H는 그 전략의 첫 성과물이다. ALLM.H는 구글의 최신 오픈소스 모델 ’Gemma 4(31B)‘를 기반으로 국내 최초 파인튜닝을 거쳐 개발됐다. 2022년부터 2024년까지의 KMLE 공식 기출 435문항으로 구성된 KorMedMCQA Doctor Test에서 최고 수준의 성능을 낸 배경에는 아크릴이 보유한 데이터 정제 역량과 도메인 특화 학습 설계 역량이 있다. 아크릴은 이번 성과를 통해 국내 특화 파운데이션 모델이 해외 빅테크의 대형 상용 모델과도 충분히 경쟁할 수 있음을 입증했다고 강조했다. ALLM.H와 ALLM.H 패밀리 모델은 현재 아크릴이 수행 중인 보건복지부·과학기술정보통신부 주관 ‘닥터앤서 3.0’ 및 ‘K-ARPA’ 사업을 기반으로 국내 대형 병원에서 실증에 돌입할 예정이다. 연세의료원, 경북대학교병원 등 협력 병원을 중심으로 의료진의 임상 의사결정 지원, 의료 데이터 분석, 전문 진료과 상담 보조 등에 활용되며, 온프레미스 방식으로 배포돼 환자 데이터 보안까지 확보할 계획이다. 연구실 수준의 데모를 넘어 실제 임상 환경에서 작동하는 의료 AI로 검증하겠다는 것이 회사 측 설명이다. 이어 “이번에 검증된 특화 파인튜닝 기술은 향후 조나단 플랫폼에 탑재돼 의료뿐 아니라 금융, 법률, 제조 등 다양한 산업 도메인으로 확장될 예정”이라며 “고객이 자체 도메인 데이터만 보유하면 특화 모델의 학습부터 평가, 배포까지 가능한 엔드투엔드 파이프라인을 제공해 산업별 AI 내재화를 앞당길 것”이라고 덧붙였다.

관련 저널 읽기

전체 보기 →