미소스, METR 자율성 평가서 '16시간' 기록..."측정 한계 돌파"
AI Times
|
|
📰 뉴스
#ai
#anthropic
#claude
#앤트로픽
#취약점/보안
#review
원문 출처: AI Times · Genesis Park에서 요약 및 분석
요약
AI의 자율성이 빠르게 향상되면서, 이제 AI가 인간 전문가의 ‘하루짜리 업무’를 독립적으로 수행할 수 있는 수준에 도달했다는 연구 결과가 나왔다. 비영리 AI 연구기관 METR는 8일(현지시간) 최근 '클로드 미소스 프리뷰(Claude Mythos Preview)' 초기 버전이 인간 전문가 기준 약 16시간이 걸리는 작업을 50% 성공률로 수행했다고 밝혔다.METR의 평가는 단순 벤치마크 점수가 아니라, AI가 얼마나 오랜 시간 인간 개입 없이 자율적으로 작업을 수행할 수 있는지를 측정하는 새로운 지표인 ‘작업 완료 시간 지평(t
본문
AI의 자율성이 빠르게 향상되면서, 이제 AI가 인간 전문가의 ‘하루짜리 업무’를 독립적으로 수행할 수 있는 수준에 도달했다는 연구 결과가 나왔다. 비영리 AI 연구기관 METR는 8일(현지시간) 최근 '클로드 미소스 프리뷰(Claude Mythos Preview)' 초기 버전이 인간 전문가 기준 약 16시간이 걸리는 작업을 50% 성공률로 수행했다고 밝혔다.METR의 평가는 단순 벤치마크 점수가 아니라, AI가 얼마나 오랜 시간 인간 개입 없이 자율적으로 작업을 수행할 수 있는지를 측정하는 새로운 지표인 ‘작업 완료 시간 지평(t
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유