AIWORKX, AI 에이전트 신뢰성 검증 솔루션 'AgentRigor' 출시 - 네이트

[AI] ai compliance solutions | | ⚡ AI 서비스
#agentrigor #ai 에이전트 #aiworkx #솔루션 출시 #신뢰성 검증 #ai 모델 #physical ai #스마트공장 #포스코dx
원문 출처: [AI] ai compliance solutions · Genesis Park에서 요약 및 분석

요약

에이전트 신뢰성 검증 솔루션 'AgentRigor'는 AI 기본법 시행에 따른 금융과 공공 분야의 컴플라이언스 검증 수요를 충족하기 위해 출시되었습니다. 2033년까지 시장이 크게 성장할 것으로 전망되는 가운데, 이 솔루션은 기존 평가 방식의 한계를 극복하고 서비스 관점의 행동 검증과 한국어 특화 데이터를 활용한 정밀 평가를 지원합니다.

본문

AgentRigor는 SW 분야 KOLAS(한국인정기구) 공인시험기관이 설계부터 참여한 에이전트 평가 솔루션이다. 글로벌 AI 에이전트 시장은 2025년 76억 달러에서 2033년 1830억 달러 규모로 성장할 전망이다(Grand View Research, 2026-2033 CAGR 49.6%). 금융·의료·법률·물류 등 버티컬 AI 시장이 성장하면서, 산업별 고유 요구사항을 반영한 AI 신뢰성 검증 수요가 증가하고 있다. 특히 한국 AI 기본법 시행을 앞두고 금융·공공 분야에서 AI 컴플라이언스 검증 의무화 흐름이 가속되고 있어, 체계적인 에이전트 평가 인프라의 필요성이 어느 때보다 높아진 상황이다. 기존 AI 에이전트 평가 방식에는 범용 벤치마크 데이터셋 의존에 따른 검증 범위 불일치, 획일적 기준 적용으로 인한 평가 기준 불일치, 맥락 정보(Context) 반영의 어려움 등 구조적 한계가 있었다. AgentRigor는 이러한 한계를 극복해 서비스 관점에서 AI의 컴플라이언스 평가, 산업별 에이전트의 대응 방식 및 리스크 종합 평가, 한국어 특화 평가 자산 데이터 활용 정밀 평가 등을 지원한다. 특히 AI가 틀린 말을 했는지를 검사하던 콘텐츠(Contents) 평가에서 서비스 내 올바른 행동 여부를 따지는 서비스 관점의 컴플라이언스(Compliance) 평가로 전환했으며, 자체 구축한 한국어 특화 평가 자산 데이터(Asset Library)를 활용해 실서비스 환경을 반영한다. AgentRigor의 핵심 기능은 세 가지다. 첫째, LLM 응답 품질 및 평가 신뢰도 정량 검증을 통해 정확성과 검색 맥락 연관성 등을 자동 측정하고 지표의 신뢰도를 정량적으로 입증한다. 둘째, 실제 사용자 시나리오 기반 안전성 검증으로 서비스 수준의 안전성을 체계적으로 검증한다. 셋째, KOLAS 공인 인정기관이 설계한 프레임워크 기반 검증 프로세스를 통해 AI 기본법 및 금융 컴플라이언스 대응에 필요한 평가 자료를 제공한다. 이 외에도 시나리오 기반 테스트 데이터 자동 생성, 자동 메트릭 및 인적 평가(Human Evaluation) 통합 관리, 고객별 커스텀 메트릭 구성(G-Eval), 평가 결과 시각화 대시보드, 리포트 자동 생성 등 다양한 편의 기능을 제공한다. 최근 국내 대형 IT 서비스 기업의 검증 자동화 프로젝트와 밤빗(BAMBIT)의 영유아 스킨케어 플랫폼 ‘새록’ 베타 테스트에서 화장품 도메인 1440건의 케이스를 검증하며 안정성을 확인했다. 회사에 따르면 기업 고객은 AgentRigor를 통해 서비스 배포 전 리스크를 점검하고 수동 검증 대비 준비 시간을 절감할 수 있다. 온프레미스와 클라우드 환경을 모두 지원해 보안 민감 산업에서도 도입이 가능하다. AgentRigor는 오는 5월 6일부터 8일까지 서울 코엑스에서 열리는 ‘제9회 AI Expo Korea 2026’에서 라이브 데모로 공개될 예정이다. 윤석원 대표는 “AI 에이전트가 실제 업무를 수행하는 시대에 배포 전 신뢰성 검증은 필수”라며, “AgentRigor는 AI 에이전트 신뢰성의 새로운 기준을 제시하겠다”고 밝혔다. 배경민 한경닷컴 기자 [email protected]

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →