AIWORKX, AI 에이전트 신뢰성 검증 솔루션 'AgentRigor' 출시 - v.daum.net
[AI] ai compliance solutions
|
|
🏷️ AI 딜
#agentrigor
#ai 에이전트
#aiworkx
#솔루션 출시
#신뢰성 검증
#ai
#ai 딜
#ai 모델
#ai 협력
#anthropic
#claude
#codaholiq
#gemini
#github
#openai
#거버넌스
#반도체
#유럽판 챗gpt
#자동화
#하드웨어/반도체
원문 출처: [AI] ai compliance solutions · Genesis Park에서 요약 및 분석
요약
개발자가 깃허브 리포지토리의 PR 검토나 문서 생성 등의 반복 작업을 자동화하기 위해 ‘Codaholiq’라는 오픈소스 플랫폼을 공개했습니다. 이 도구는 PR 생성, 코드 푸시, 이슈 작성 등의 특정 이벤트 발생 시 Claude나 Gemini 등의 AI 모델을 사용해 워크플로우를 자동으로 실행하며, 실행 내역과 토큰 사용량을 실시간으로 추적합니다. 독커(Docker), 레디스(Redis), 포스트그레스(Postgres)를 활용해 사용자가 직접 인프라에 구축하여 호스팅할 수 있도록 설계되었습니다.
본문
AIWORKX, AI 에이전트 신뢰성 검증 솔루션 'AgentRigor' 출시 전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다. 인공지능(AI) 데이터·솔루션 기업 AIWORKX(에이아이웍스, 대표 윤석원)가 오는 30일 AI 에이전트의 신뢰성을 종합 진단하는 평가 솔루션 'AgentRigor(에이전트리거)'를 정식 출시한다고 28일 밝혔다. 해당 솔루션은 기존 콘텐츠 정확도 중심 평가에서 벗어나 실제 서비스 환경에서의 컴플라이언스와 안전성까지 종합적으로 검증하는 구조로 설계됐다. AgentRigor는 SW 분야 KOLAS(한국인정기구) 공인시험기관이 설계부터 참여한 에이전트 평가 솔루션이다. 글로벌 AI 에이전트 시장은 2025년 76억 달러에서 2033년 1830억 달러 규모로 성장할 전망이다(Grand View Research, 2026-2033 CAGR 49.6%). 금융·의료·법률·물류 등 버티컬 AI 시장이 성장하면서, 산업별 고유 요구사항을 반영한 AI 신뢰성 검증 수요가 증가하고 있다. 특히 한국 AI 기본법 시행을 앞두고 금융·공공 분야에서 AI 컴플라이언스 검증 의무화 흐름이 가속되고 있어, 체계적인 에이전트 평가 인프라의 필요성이 어느 때보다 높아진 상황이다. 기존 AI 에이전트 평가 방식에는 범용 벤치마크 데이터셋 의존에 따른 검증 범위 불일치, 획일적 기준 적용으로 인한 평가 기준 불일치, 맥락 정보(Context) 반영의 어려움 등 구조적 한계가 있었다. AgentRigor는 이러한 한계를 극복해 서비스 관점에서 AI의 컴플라이언스 평가, 산업별 에이전트의 대응 방식 및 리스크 종합 평가, 한국어 특화 평가 자산 데이터 활용 정밀 평가 등을 지원한다. 특히 AI가 틀린 말을 했는지를 검사하던 콘텐츠(Contents) 평가에서 서비스 내 올바른 행동 여부를 따지는 서비스 관점의 컴플라이언스(Compliance) 평가로 전환했으며, 자체 구축한 한국어 특화 평가 자산 데이터(Asset Library)를 활용해 실서비스 환경을 반영한다. AgentRigor의 핵심 기능은 세 가지다. 첫째, LLM 응답 품질 및 평가 신뢰도 정량 검증을 통해 정확성과 검색 맥락 연관성 등을 자동 측정하고 지표의 신뢰도를 정량적으로 입증한다. 둘째, 실제 사용자 시나리오 기반 안전성 검증으로 서비스 수준의 안전성을 체계적으로 검증한다. 셋째, KOLAS 공인 인정기관이 설계한 프레임워크 기반 검증 프로세스를 통해 AI 기본법 및 금융 컴플라이언스 대응에 필요한 평가 자료를 제공한다. 이 외에도 시나리오 기반 테스트 데이터 자동 생성, 자동 메트릭 및 인적 평가(Human Evaluation) 통합 관리, 고객별 커스텀 메트릭 구성(G-Eval), 평가 결과 시각화 대시보드, 리포트 자동 생성 등 다양한 편의 기능을 제공한다. 최근 국내 대형 IT 서비스 기업의 검증 자동화 프로젝트와 밤빗(BAMBIT)의 영유아 스킨케어 플랫폼 ‘새록’ 베타 테스트에서 화장품 도메인 1440건의 케이스를 검증하며 안정성을 확인했다. 회사에 따르면 기업 고객은 AgentRigor를 통해 서비스 배포 전 리스크를 점검하고 수동 검증 대비 준비 시간을 절감할 수 있다. 온프레미스와 클라우드 환경을 모두 지원해 보안 민감 산업에서도 도입이 가능하다. AgentRigor는 오는 5월 6일부터 8일까지 서울 코엑스에서 열리는 ‘제9회 AI Expo Korea 2026’에서 라이브 데모로 공개될 예정이다. 윤석원 대표는 “AI 에이전트가 실제 업무를 수행하는 시대에 배포 전 신뢰성 검증은 필수”라며, “AgentRigor는 AI 에이전트 신뢰성의 새로운 기준을 제시하겠다”고 밝혔다. 배경민 한경닷컴 기자 [email protected] Copyright © 한국경제. 무단전재 및 재배포 금지. - "타던 車 팔고 신차 사려고 했더니…" 견적서 받고 '당혹' - "사람 아닌 것 같았다"…인신매매 낙인 지우는 피부과 의사들 - "우린 그냥 죽으란 소리냐"…5월 대목 또 날린 상인들 '분통' - "다리 힘 빠진다" 무심코 넘겼다간…'치명적 결과' 부른다 [건강!톡] - "건물주 됐다고 좋아하셨는데"…70대 노부부 '날벼락' [김용남의 부동산 자산관리] - "또 일본 갈 줄 알았는데"…5월 황금연휴 1위 여행지 어디? - CIS, 첨단 정밀 장비로 日 배터리 업체도 홀렸다 - "한국에 최우선 공급하겠다"…중동 6개국 '깜짝 선언' - "호텔서 커피 마셨더니…" 조회수 '300만' 대박 영상의 비밀 [현장+] - "32만전자 간다"…삼성전자, 역대급 잭팟 예고에 주가 '들썩'
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유