뉴스피드 큐레이션 SNS 대시보드 저널

똑똑한 AI, 실수하는 이유는 '구조'…테크기업들이 주목한 '에이전트 하네스' - 동아사이언스

[AI] ai | | 🔬 연구
#ai #머신러닝 #실행 환경 #에이전트 하네스 #테크 기업

요약

2026년 테크 기업들은 모델 자체보다 모델을 둘러싼 제어 구조인 ‘에이전트 하네스’가 AI 성패를 가른다고 보고 주목하고 있습니다. 하네스는 AI에 작업 순서를 짜주고 도구 사용 권한을 부여하며 실수를 잡아주는 환경으로, 랭체인과 앤스로픽 등은 이를 통해 코딩 성능을 획기적으로 높이거나 복잡한 게임 제작에 성공했습니다. 앤스로픽은 최근 ‘두뇌’와 ‘손’을 분리해 안정성과 응답 속도를 개선한 매니지드 에이전트 서비스도 선보였습니다. 전문가들은 AI 모델이 발전해도 하네스 설계를 통해 효율을 높이는 엔지니어링은 계속 유효할 것이라 전망했습니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

인공지능(AI)이 아무리 똑똑해져도 긴 작업을 끝까지 완수하려면 작업 순서를 짜주고 도구 사용 권한을 주고 중간에 실수를 잡아주는 구조가 필요하다. 2026년 들어 테크 기업들은 어떤 모델을 쓰느냐보다 모델을 어떤 구조 안에서 돌리느냐가 성패를 가른다는 사실에 주목하기 시작했다. AI 모델을 둘러싼 실행 환경과 제어 구조를 '에이전트 하네스'라 부른다. 앤스로픽, 랭체인 등 주요 AI 기업이 올해 3~4월 잇따라 하네스 설계와 관련된 글을 발표하면서 '하네스 엔지니어링'이 업계의 핵심 화두로 떠올랐다. 앤스로픽은 AI 모델 '클로드'를 개발한 미국 AI 기업, 랭체인은 AI 에이전트 개발 도구를 만드는 소프트웨어 기업이다. AI 에이전트는 사람의 개입 없이 스스로 판단하고 도구를 활용해 작업을 수행하는 AI 시스템을 말한다. '에이전트 하네스'는 AI 모델 바깥의 모든 실행 환경과 제어 구조를 가리킨다. 하네스는 원래 말의 몸에 씌우는 마구를 뜻한다. 말이 아무리 힘이 세도 마구 없이는 마차를 끌 수 없는 것처럼 AI 모델도 하네스 없이는 복잡한 작업을 완수하기 어렵다. 하네스로 AI에게 작업 순서를 지정하고 외부 도구나 파일시스템에 접근할 권한을 부여해 중간에 발생하는 실수를 감지 후 되돌리는 소프트웨어 구조다. 랭체인의 비벡 트리베디는 지난달 10일(현지시간) 자사 블로그를 통해 "AI 모델이 아닌 나머지 전부가 하네스"라고 정의했다. AI에게 내리는 지시문부터 파일을 저장하는 공간, 외부 도구를 연결하는 방식까지 모델을 둘러싼 모든 소프트웨어 구조가 하네스에 해당한다는 뜻이다. 트리베디는 같은 AI 모델로 하네스만 바꿔 코딩 성능 평가에서 순위를 30위권 밖에서 5위권으로 끌어올렸다고 밝혔다. 앤스로픽도 구체적 비교 결과를 제시했다. 지난달 24일 공개한 블로그 글에서 프리트비 라자세카란 앤스로픽 연구원은 동일한 프롬프트로 AI 단독 작업과 하네스를 갖춘 AI의 결과물을 비교했다. AI 혼자 20분 만에 만든 2D 게임 제작 도구는 겉보기엔 그럴듯했지만 핵심 기능인 게임이 작동하지 않았다. 하네스를 적용한 AI는 기획·제작·검증 에이전트 세 개를 조합해 6시간에 걸쳐 실제로 플레이할 수 있는 앱을 완성했다. 앤스로픽은 8일(현지시간) 하네스 설계를 한 단계 발전시킨 '매니지드 에이전트' 서비스를 공개했다. 랜스 마틴 앤스로픽 기술연구원 등은 같은 날 자사 블로그를 통해 하네스 설계를 한 단계 발전시킨 '매니지드 에이전트' 서비스를 소개했다. 핵심은 AI 모델과 실행 환경의 분리다. 앤스로픽은 AI 모델을 생각하는 '두뇌', 코드를 실행하고 파일을 저장하는 작업 환경을 실제로 손발을 움직이는 '손'에 비유했다. 기존에는 두뇌와 손이 하나로 묶여 있어 작업 환경이 멈추면 AI 전체가 중단됐다. AI 모델과 작업 환경을 분리하자 한쪽에 문제가 생겨도 다른 쪽이 독립적으로 복구할 수 있게 됐다. 사용자가 첫 응답을 받기까지 걸리는 시간도 최대 90% 이상 단축됐다. AI 에이전트가 수 시간에 걸쳐 복잡한 작업을 자율적으로 수행하려면 필수인 중간에 멈추지 않는 안정성을 마련한 셈이다. 새 모델이 나올 때마다 하네스를 재점검해야 한다는 과제도 남아 있다. 하네스는 현재 모델이 못하는 것을 전제로 설계되기 때문에 모델이 발전하면 기존 보완 기능이 쓸모없어질 수 있기 때문이다. 라자세카란 연구원은 "새 모델이 나올 때마다 하네스를 재점검해 불필요한 부분을 걷어내고 새로운 가능성을 추가하는 것이 좋을 것"이라고 밝혔다. 트리베디는 "모델이 좋아질수록 하네스 일부는 모델에 흡수되겠지만 잘 구성된 환경과 검증 루프는 모델의 기본 지능과 무관하게 효율을 높인다"며 "하네스 엔지니어링은 계속 유효할 것"이라고 밝혔다. AI가 스스로 더 많은 일을 해내더라도 작업 환경을 잘 설계하면 성능이 추가로 올라간다는 전망이다.

관련 저널 읽기

전체 보기 →