英 AI안전연구소, GPT-5.5도 미토스 만큼 사이버 위협 경고 - 디지털투데이
[AI] gpt-5.5
|
|
🖥️ 하드웨어
#ai 모델
#gpt-5
#openai
#자기개선
#태그없음
#nvidia halos
#차량 안전성
#하드웨어/반도체
원문 출처: [AI] gpt-5.5 · Genesis Park에서 요약 및 분석
요약
NVIDIA는 GTC 산호세 2025에서 자율주행차(AV)의 안전성을 강화하기 위한 새로운 전략으로 'NVIDIA Halos'를 소개했습니다. 이번 발표는 AV 안전 규격인 S74743을 충족시키기 위한 구체적인 기술적 접근 방식을 제시하는 데 중점을 두었습니다. 해당 세션은 향후 자율주행 기술의 안전성과 신뢰성을 확보하는 방향성을 제시하는 것으로 보입니다.
본문
[디지털투데이 추현우 기자] 오픈AI의 GPT-5.5가 통제된 연구 환경에서 고도 사이버 공격 능력을 보였다는 영국 정부 산하 연구기관의 평가가 나왔다. 2일(현지시간) 블록체인 매체 코인포스트에 따르면 영국 과학기술혁신부 산하 AI안전연구소(AISI)는 4월 30일 공개한 보고서에서 GPT-5.5의 높은 사이버 공격 수행 능력을 경고했다. AISI는 GPT-5.5를 두 가지 방식으로 평가했다. 첫 번째 CTF 방식에서는 취약점 탐지와 공격 코드 실행 능력을 측정했다. 최고 난도 과제군에서 GPT-5.5의 평균 성공률은 71.4%였다. 미토스의 68.6%를 웃돌았다. 리버스 엔지니어링 과제는 10분 22초 만에 해결했다. AISI는 같은 작업에 인간 보안 전문가가 약 12시간을 쓸 수 있다고 설명했다. 두 번째 평가는 실제 네트워크 환경과 방어 체계를 모사한 사이버 레인지에서 진행됐다. 기업 침투 경로를 본뜬 32단계 시뮬레이션 '더 라스트 원스'에서 GPT-5.5는 10차례 시도 중 2차례 자율적으로 완전 공략에 성공했다. 이 시뮬레이션은 전문가가 수동으로 수행하면 약 20시간이 걸리는 과제로 제시됐다. 다만 산업제어시스템을 겨냥한 '쿨링 타워' 시뮬레이션에서는 어떤 AI 모델도 돌파하지 못했다. AISI는 서로 다른 AI 개발사에서 고도 공격 능력을 가진 모델이 잇달아 나오고 있다는 점에 주목했다. 논리 추론과 자율 기능의 발전이 사이버 기술 향상으로 이어지고 있다면, 가까운 시일 안에 여러 모델에서 비슷한 능력 향상이 나타날 수 있다고 봤다. 이번 평가는 통제된 연구 환경에서 나온 결과여서 공개형 GPT-5.5의 성능과 바로 연결되지는 않는다. 공개형 모델에는 안전장치가 적용돼 있다. 다만 약 6시간 동안 진행한 레드팀 테스트에서는 안전장치를 무력화하는 방법이 발견됐다. 준비된 모든 악성 프롬프트에서 위험한 응답도 끌어냈다. 오픈AI는 이후 패치를 적용했지만, 제공 환경의 설정 문제로 최종 안전성 확인은 끝나지 않았다. 영국에서는 지난 1년 동안 기업의 43%가 사이버 공격 피해를 입었다. 영국 정부는 새 위협에 대응하기 위해 9000만파운드의 추가 자금을 투입해 방어 역량 강화에 나섰다.
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유