뉴스피드 큐레이션 SNS 대시보드 저널

앤트로픽 클로드 미토스는 보안 업계의 ‘오펜하이머 순간’이 될까 - 동아일보

[AI] security | | 🤖 AI 모델
#취약점/보안 #ai 모델 #deepmind #gemini #gemma 4 #google #경량화 모델 #오픈 ai 모델

요약

Google DeepMind가 Gemini 3 기술을 기반으로 한 차세대 오픈 AI 모델 Gemma 4를 발표, 매개변수당 지능 효율을 극대화한 구조로 설계됨 모델은 E2B, E4B, 26B, 31B 네 가지 크기로 제공되며, 모바일·IoT부터 개인용 GPU 환경까지

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

지난 3월 29일, 앤트로픽 임직원이 콘텐츠 관리 시스템을 운용하다가 실수로 내부 문건 일부가 유출됐다. 당시 유출된 코드는 약 51만 줄, 파일 수로는 1900여 개에 달했다. 유출 당시만 해도 세간의 시선은 고객 데이터나 인증 정보, 기술 유출에 집중되었으나 이는 상대적으로 작은 문제에 불과했다. 앤트로픽의 새로운 고성능 모델인 ‘미토스(Mythos)’의 존재가 드러나면 서다. 앤트로픽을 포함해 구글, 오픈AI 등 거의 모든 AI 기업들은 매 분기마다 새로운 AI 기술을 업데이트 중이므로 그렇게 새로운 소식은 아닐 수 있었다. 하지만 미토스의 성능 일부가 공개되고, 앤트로픽이 해당 모델의 위험성을 근거로 출시를 연기하면서 문제가 수면 위로 드러났다. 그간 AI는 텍스트를 생성하거나 코딩을 돕는 수준에 불과했지만 클로드 미토스는 복잡한 소프트웨어 시스템의 논리적 구조를 완전히 이해하고, 특히 인간이 수십 년 간 발견하지 못한 치명적인 보안 결함을 자율적으로 찾아내 공격하는 설계 능력을 갖췄다. 단순 명령으로 수십 단계의 보안 공격을 자율 수행하는 AI 해킹 에이전트인 셈이다. 이로 인해 전 세계 소프트웨어 및 보안 기업에는 일대 비상이 걸렸으며, 주요 국가들도 보안 체계 확보에 나선 상황이다. 앤트로픽 역시 ‘프로젝트 글라스윙’이라는 관리 체계를 바탕으로 허가된 경우에만 서비스를 사용할 수 있도록 협의 중이다. 클로드 미토스 공개 이후 지금까지의 상황과 대응 방안 등을 시간 순서대로 정리해봤다. 클로드 미토스, 전 세계 보안의 끝과 시작될까 클로드 미토스는 앤트로픽이 개발한 AI 모델 중 가장 높은 성능을 가진 범용 모델이다. AI 에이전트 성능으로 소프트웨어 시장에 충격을 안겨다준 클로드 오퍼스 4.6보다도 한 단계 더 높은 성능을 갖췄다. 클로드 오퍼스 4.6과 비교해도 성능이 점진적으로 올라간 게 아니라 한 등급 자체가 올라섰다. 소프트웨어 엔지니어링 문제 해결 능력인 SWE-벤치 베리파이드 지표는 오퍼스가 80.8%일 때 93.9%의 정확성을 보였고, 고난도 기업용 코드베이스 수정 역량도 53.4%에서 77.8%로 큰 차이를 보여줬다. 특히 보안 취약점 재현 및 공격 코드 생성 성공률이 66.6%에서 83.1%로 올라섰다. 심지어 해당 결과는 외부의 도구를 호출하지 않고 미토스가 자체적인 데이터로 수행한 결과여서 도구를 호출할 경우 훨씬 더 높은 성능을 발휘할 것으로 보인다. 일반적인 사이버 공격은 시스템의 구조, 운영체제 버전, 외부와 연결된 포트를 찾아낸 뒤 스캐닝 도구를 돌려 허점을 찾는다. 취약점을 찾아내면 해커가 소프트웨어의 구조를 뜯어보고 입력값에 따라 시스템이 어떻게 오류를 일으키는지 장기적으로 관찰한다. 이후 자동 복구나 보호 기능 등을 우회하기 위해 수작업으로 맞춤형 코딩을 진행하고, 코드가 완성되면 시스템에 이를 주입해 관리자 권한을 획득한다. 그다음 시스템을 드나들며 주요 정보 등을 빼내는 식이다. 클로드 미토스와 같은 AI는 공격 대상만 지정하면 이와 관련된 모든 데이터와 네트워크 패턴을 학습해 취약 지점을 타격 우선순위로 잡는다. 그다음 기계 학습을 통해 어떤 값이 시스템 오류를 유발하는지 계산하고, 대규모 언어모델의 코드 생성기로 보호 기법을 무력화하는 코드를 바로 만든다. 사람이 작업하면 취약점 확인부터 수작업 프로그래밍까지 몇 주에서 개월 단위로 걸리는 일을 몇 분 안에 해낸다. 앤트로픽 내부 테스트 결과는 충격적이다. 보안성이 가장 뛰어난 운영 체제인 오픈 BSD에서 원격 시스템 충돌을 유발할 수 있는 코드를 스스로 발견했다. 이 코드는 27년 전 생성됐고 수천 명의 전문가와 수백만 건의 자동화 테스트까지 통과했던 값이었다. 또 비디오 처리 기능인 FFmpeg에서도 16년 간 숨겨진 결함을 찾아냈다. 자동화 도구로 500만 번 이상 실행해도 찾을 수 없었던 문제점을 단 한번의 분석으로 찾아냈다. 리눅스 커널에서 작은 보안 결함을 찾아낸 뒤 이를 논리적으로 연결해 일반 사용자 권한을 시스템 관리자로 승격시키는 공격 시나리오도 생성했고, 심지어 보안 훈련을 받지 않은 엔지니어가 ‘이 프로그램에서 보안 취약점을 찾아줘’라고 명령했을 때 원격 명령 실행이 가능한 공격 코드까지 생성할 정도였다. AI로 자율 해킹 공격 가능··· 기업·정부 대응 분주해져 클로드 미토스가 문제가 되는 이유는 공격 속도와 범위다. 그간의 보안 방식은 취약점이 발견된 후 보완하는 시간차가 있었는데 클로드 미토스가 그 시간차를 몇 분 단위로 줄였다. 금융 시스템, 전력망, 항공관제 등 현대 사회의 주요 시스템이 단 몇 분 안에 무력화될 수 있다. 게다가 지난 23일 접근 권한이 없는 외부 인력이 미토스의 온라인 위치를 유추해 접근한 것이 사실로 밝혀지며 시장의 불안은 더욱 커지고 있다. 앤트로픽은 지난 4월 7일 미토스 프리뷰를 공개하며 주요 빅테크 기업들이 참여하는 프로젝트 글라스윙을 출범했다. 참여 기업들은 공동으로 시스템 취약점을 식별하고 방어 중심의 전략을 구축한다. 미국 정부는 사태의 심각성을 조기에 인지하고 대응에 나서는 상황이다. 지난 10일, 스콧 베센트 미국 재무장관은 제롬 파월 연방준비제도 의장을 포함한 대형은행 최고경영자들을 워싱턴 DC로 불러 미토스나 유사한 AI를 활용한 공격 가능성과 대비책을 점검한 것으로 알려졌다. 게다가 미 매체 악시오스는 앤트로픽이 공급망 위험 기업으로 지정됐음에도 국가안보국에서 미토스 프리뷰 모델을 활용 중이라고 보도했다. 지난 17일에는 다리오 아모데이 최고경영자가 백악관을 찾아 수지 와일스 비서실장, 스콧 베센트 재무장관과 관련 협의를 진행한 것으로 알려졌다. 영국 금융당국, 일본 재무상 등 주요 국가들도 대형 은행들과 관련 대응책 마련에 분주한 상황이다. 구글 딥마인드는 AI 공격은 AI로 방어해야 한다며 코드멘더라는 자율방어 보안 체계를 선보였다. 코드멘더는 지난해 10월 공개된 AI 기반 보안 에이전트로 제미나이 딥싱크 추론 기술과 자동화된 분석 및 테스트 도구가 포함된다. 코드멘더는 6개월 간 72건의 보안 패치를 수행했다. 시점 과정에서는 단순한 오타 수정을 넘어 난해한 논리적 결함을 해결하거나, 라이브러리에 보안 주석을 추가하고 공격을 원천 차단하는 조치를 취하는 등의 성능을 보여줬다. 구글은 다음 주 중 코드맨더를 정식 출시할 것으로 알려졌다. 또한 개발자들이 자유롭게 활용할 수 있도록 오픈소스로 공개될 예정이다. 침해 가정에서 공격 자동화 가정이라는 새로운 보안 현실 직면 그간 사이버 보안은 ‘누군가 침해할 수 있다’는 침해 가정을 전제로 구축되어 왔다. 보안으로 성을 쌓을 때 성문과 성벽을 굳건히 만드는 식이었고, 그중에서 숨겨진 출입구를 찾아내 침투하는 것이 전제였다. 그런데 클로드 미토스를 기점으로 ‘언제든지 공격해 올 것’을 전제로 하는 공격 자동화 가정의 단계로 발전했다. 공격자는 클릭 한 번이면 자동으로 출입구를 십수 개씩 찾아서 침투할 수 있다. 결국 보안 업계의 흐름은 다양한 변종 공격과 실시간 제로데이 공격까지 실시간으로 대응할 수 있는 AI 기반 자율방어 체계로 발전할 수밖에 없다. AI가 수 백개 이상의 취약점을 동시에 공격하는 것은 이제 사람이 막을 수 없으며, 코드멘더같은 형태의 AI 보안 에이전트를 도입해 수 분 단위로 패치 적용 주기를 압축해야만 대응할 수 있다. 지난 수십 년 간 IT 업계에 통용되던 보안의 불문율이 2026년 4월을 기점으로 깨졌다. 보안 위협은 새로운 단계로 접어들었고, 우리가 이해하지 못하는 속도와 단위로 공격과 방어가 이뤄져야 한다. 이제 사이버 보안은 위협을 제거하는 것은 불가능하고, 얼마나 좋은 AI를 활용하는가에 달렸다. 그리스어로 미토스는 논리적 증명보다는 직관, 상징 등 믿음의 영역에 가까운 이야기를 의미한다. 어쩌면 미토스를 통한 보안 위협은 과장되었을 수 있다. 하지만 보안은 평소의 철저한 준비가 근심을 없애는 유비무환의 영역이고, 반대로 한 번이라고 깨지면 돌이킬 수 없는 영역이기도 하다. 미토스로 인한 보안 우려가 과장되었더라도 이에 적극적으로 대비하는 것이 매우 중요하다. 댓글 0

관련 저널 읽기

전체 보기 →