英 AI안전연 "클로드 미토스, 회사 네트워크 통째로 장악한 첫 AI" - 뉴시스

[AI] 미토스 | 2026년 4월 14일 10:57 | {'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} news

#ai #ai안전연 #네트워크 장악 #뉴시스 #클로드 미토스

요약

영국 AI 안전연구소(AISI)의 평가 결과, 앤트로픽의 AI 모델 '클로드 미토스'가 기업망 침투부터 데이터 탈취까지 이어지는 32단계 해킹 시나리오를 처음으로 완수했습니다. 해당 모델은 10번의 시도 중 3번을 성공하며 평균 22단계까지 수행하는 등 기존 모델 대비 월등한 공격 능력을 보였습니다. 다만 이번 성과는 방어 시스템이 없는 취약한 환경에서 이루어진 것으로, 실제 보안 시스템이 구축된 상황에서의 공격 가능성은 추가 검증이 필요합니다.

왜 중요한가

본문

기업망 해킹 시나리오 첫 완주 사례…AI 공격 능력 진전 평가 "취약 환경 한정 결과…실제 공격력은 추가 검증 필요" [서울=뉴시스]윤정민 기자 = 앤트로픽 인공지능(AI) 모델 '클로드 미토스'가 기업 내부 시스템을 단계적으로 침투해 핵심 데이터까지 탈취하는 수준의 사이버 공격을 수행할 수 있다는 국가 기관의 평가가 나왔다. 기존 AI 모델들이 넘지 못한 복합 해킹 시나리오를 끝까지 수행한 사례가 확인되며 주목받고 있다. 영국 AI 안전연구소(AISI)는 13일(현지 시간) '클로드 미토스 프리뷰' 사이버 보안 역량 평가 결과를 공개했다. 연구소는 2년 전만 해도 초보적인 공격 작업조차 제대로 수행하지 못했던 AI가 이제는 전문가 수준의 공격 과정을 일부 자동화하는 단계에 진입했다고 분석했다. 특히 미토스 프리뷰는 32단계로 구성된 기업망 공격 시뮬레이션 '더 라스트 원스(The Last Ones, TLO)'에서 가장 높은 성능을 보였다. TLO는 ▲외부 시스템 침투 ▲네트워크 구조 파악 ▲계정·인증정보 탈취 ▲권한 상승 ▲내부 서버 간 이동 ▲소프트웨어 취약점 악용 ▲최종 데이터 탈취 등 실제 기업 해킹 과정을 단계별로 재현한 시뮬레이션이다. 보고서에 따르면 미토스 프리뷰는 10번의 시도 중 3번이나 TLO 시나리오를 완주했다. 이는 해당 시나리오를 처음부터 끝까지 수행한 첫 사례다. 평균 수행 단계는 22단계로 차상위 모델인 '클로드 오퍼스 4.6'(평균 16단계)과 격차를 보였다. 오픈AI GPT-5.4 역시 완주에는 실패했으며 평균 약 14단계 수준에 머문 것으로 나타났다. 또 미토스 프리뷰는 사이버 보안 경진대회(CTF) '전문가' 난이도 과제에서 약 73%의 성공률을 기록하며 기존 모델 대비 향상된 공격 수행 능력을 보였다. AISI는 "(미토스 프리뷰가) 사이버 공격 시뮬레이션에서 성공을 거둔 것은 최소한 네트워크 접근 권한이 주어진 상태에서 보안이 취약한 소규모 기업 시스템을 자율적으로 공격할 수 있는 능력을 갖추고 있다는 걸 보여준다"고 평가했다. 다만 이번 결과를 실제 공격 능력으로 확대 해석하는 데는 신중한 입장을 보였다. 현재 성능은 제한된 조건에서 확인된 것으로 과도한 평가에는 주의가 필요하다는 설명이다. AISI는 "(이번 실험 환경은) 능동적으로 대응하는 보안 인력이나 보안 솔루션 등 현실에서 일반적으로 존재하는 방어 요소가 포함되지 않았다. 보안 경보를 유발할 수 있는 행동에 대한 제약도 없었다"며 "미토스 프리뷰가 실제로 잘 방어된 시스템까지 공격할 수 있는지는 확실히 단정하기 어렵다"고 밝혔다. 이어 "공격자가 AI 모델에 네트워크 접근 권한을 부여해 보안이 취약한 시스템을 자동으로 공격하도록 지시할 수 있는 환경에서 기존의 사이버 보안 평가 방식도 변화가 필요하다"며 "향후에는 능동적 모니터링, 엔드포인트 탐지, 실시간 대응 체계 등 실제 방어 환경을 반영한 테스트를 통해 모델 성능을 평가할 계획"이라고 전했다. 한편 미토스는 지난달 앤트로픽 내부 자료 유출로 존재가 처음 알려졌다가 지난 7일 '프로젝트 글래스윙'을 통해 공식 발표됐다. 앤트로픽은 해당 모델이 사이버 공격에 악용될 가능성이 크다는 이유로 일반 공개를 하지 않고 일부 기업과 정부 기관에 한해 제한적으로 제공하고 있다. 이를 두고 업계 일각에서는 위험성을 과도하게 부각한 '공포 마케팅'이라는 비판도 제기되고 있다. ◎공감언론 뉴시스 [email protected]

원문 보기 ([AI] 미토스)

뉴스 피드로 돌아가기