뉴스피드 큐레이션 SNS 대시보드 저널

오픈AI, 자율성 높인 GPT-5.5 출시…앤트로픽보다 우위 자신 | - HeraldK.com

[AI] GPT-5 | | 🖥️ 하드웨어
#ai 모델 #gpt-5 #anthropic #broadcom #claude #google #tpu #하드웨어/반도체

요약

Anthropic(앤스로픽)은 차세대 '클로드(Claude)' 모델의 학습과 서비스 제공을 위해 구글(Google) 및 브로드컴(Broadcom)과 대규모 전력 공급 계약을 체결했습니다. 이 협력을 통해 확보된 수 기가와트(GW) 규모의 차세대 TPU(텐서 처리 장치) 연산 용량은 2027년부터 본격적으로 가동될 예정입니다. 이는 향후 최첨단 AI 모델 개발에 필수적인 막대한 인프라를 선제적으로 구축했다는 점에서 큰 의의가 있습니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

| 샘 울트먼 오픈AI 최고경영자(CEO)가 지난해 6월 샌프란시스코 모스콤 센터에서 열린 ‘스토우 플레이크 2025 서밋’에서 발언하고 있다. 오픈AI는 23일 두 달만에 새 인공지능(AI) 모델을 선보였다. [게티이미지] | [헤럴드경제=도현정 기자] 챗GPT를 선보인 오픈AI가 두 달 만에 새 인공지능(AI) 모델을 출시하며 앤트로픽과의 AI 모델 주도권 경쟁을 가속화했다. 오픈AI는 23일(현지시간) 새 AI 모델 ‘GPT-5.5’를 공개하면서 “현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 모델”이라고 자신했다. 오픈AI가 공개한 성능지표(벤치마크) 보고서를 보면 GPT-5.5는 상당수 영역에서 앤트로픽의 주력 모델인 ‘클로드 오퍼스4.7’보다 높은 점수를 기록했다. 지식 업무 수행 능력을 평가하는 ‘GDPval’ 지표는 84.9%로 나왔다. 경쟁 모델인 클로드 오퍼스 4.7은 이 부문에서 80.3%를 받았다. 터미널 환경 작업 능력인 ‘터미널-벤치 2.0’에서 GPT-5.5는 82.7%를 기록, 오퍼스4.7(69.4%)을 10%포인트 이상 앞섰다. 사이버 보안 능력을 평가하는 ‘사이버짐’에서도 81.8%의 평가를 받아, 오퍼스4.7의 73.1%를 뛰어넘었다. 다만 정보기술(IT) 업계에서 가장 수요가 높은 코딩 부문 지표인 ‘SWE-벤치 프로’에서는 58.6%로 어퍼스4.7보다 뒤떨어졌다. 오퍼스4.7은 이 부문에서64.3%라는 평가를 받았다. 이에 대해 오픈AI는 “앤트로픽의 모델은 데이터 암기 징후가 보고됐다”며 평가 결과를 인정할 수 없다고 주장했다. 오픈AI는 특히 GPT-5.5가 에이전트형 연산에 더 적합하도록 자율성과 직관성을 높였다는 점을 강조했다. 그레그 브록먼 오픈AI 사장은 “이 모델이 정말 특별한 점은 더 적은 지침으로도 더 많은 일을 할 수 있다는 것”이라며 “불분명한 문제를 보고 다음에 무엇을 해야 하는지 스스로 파악해낸다”고 말했다. 그는 이어 “내게는 이것이 우리가 앞으로 컴퓨터를 사용하는 방식과 대규모 에이전트형 연산이 어떻게 작동할지에 대한 기초를 다지는 것처럼 느껴진다”고 전했다. 오픈AI는 GPT-5.5가 전작인 GPT-5.4보다 더 높은 성능을 보이면서도 토큰당 대기시간은 동일하게 유지했다는 점을 강조하기도 했다. “더 이상 성능을 위해 속도를 희생할 필요가 없다”는게 오픈AI가 자신있게 내세운 점 중 하나다.

관련 저널 읽기

전체 보기 →