뉴스피드 큐레이션 SNS 대시보드 저널

오픈AI, ‘GPT-5.5’ 공개…앤트로픽과 AI 주도권 경쟁 격화 - mstoday.co.kr

[AI] gpt-5.5 | | 🖥️ 하드웨어
#ai 모델 #gpt-5 #constellations #sf #별자리 #우주 #우주선 #조난 #하드웨어 #하드웨어/반도체 #항해사

요약

우주선이 불가항력적인 시스템 고장으로 미지의 적막한 행성에 불시착한 소수의 생존자들은 생존을 위해 외계 유적지인 13개의 돔을 향해 척박한 눈보라 속을 이동합니다. 최단 1천 마일에서 최장 1만 마일에 이르는 길고 험난한 여정 속에서 그들은 수많은 우주선 추락으로 인해 이곳에 쓸려 온 수백 종의 외계 우주비행사들의 참혹한 유해와 마주하게 됩니다. 절망적인 상황 속에서도 생존자들은 은하계 최초의 경이로운 접촉 발견이라는 씁쓸한 직업적 사명감을 느끼며, 인공지능이 예측한 50% 미만의 희망찬 생존 확률을 뚫고 거대한 시체 더미를 헤치고 돔을 향해 나아갑니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

성능 개선에도 속도 유지…토큰당 지연없이 효율성 강조 오픈AI CG. 연합뉴스 [서울이코노미뉴스 박희만 기자] 연내 기업공개(IPO)를 추진 중인 오픈AI가 차세대 인공지능(AI) 모델 ‘GPT-5.5’를 공개하며 앤트로픽과의 기술경쟁에 다시 불을 지폈다. 오픈AI는 23일(현지시간) 새 모델을 발표하며 “현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 AI”라고 강조했다. 공개된 벤치마크에 따르면 GPT-5.5는 다수 영역에서 앤트로픽의 주력모델 ‘클로드 오퍼스 4.7’을 앞섰다. 지식기반 업무수행 능력을 평가하는 ‘터미널 벤치 2.0’에서는 82.7%를 기록해 오퍼스 4.7(69.4%)보다 10%포인트 이상 높았다. 사이버 보안대응 능력을 측정하는 ‘사이버짐’에서도 81.8%로 오퍼스 4.7(73.1%)을 웃돌았다. 다만 핵심 수요가 집중된 코딩 분야에서는 격차가 확인됐다. 소프트웨어 개발역량을 평가하는 ‘SWE-벤치 프로’에서 GPT-5.5는 58.6%에 그치며 오퍼스 4.7(64.3%) 대비 5%포인트 이상 낮은 성적을 기록했다. 이를 두고 오픈AI는 앤트로픽 모델에서 데이터 암기 징후가 보고됐다며 평가 결과에 문제를 제기했다. 앞서 ‘SWE-벤치 베리파이드’ 지표에 대해서도 데이터 오염 가능성을 이유로 활용중단 방침을 밝힌 바 있다. 이날 브리핑에서 그레그 브록먼 사장은 GPT-5.5의 핵심 경쟁력으로 ‘에이전트형 연산’을 꼽았다. 그는 “적은 지침으로도 더 많은 작업을 수행할 수 있으며, 불명확한 문제상황에서도 다음 행동을 스스로 판단하는 능력이 강화됐다”고 설명했다. 이어 “향후 컴퓨터 활용방식과 대규모 에이전트 시스템의 기반이 될 것”이라고 덧붙였다. 성능 개선과 함께 효율성도 강조됐다. 오픈AI는 GPT-5.5가 전작 대비 성능을 끌어올리면서도 토큰당 대기시간은 동일 수준을 유지했다고 밝혔다. 고성능 모델의 약점으로 지적되던 응답지연 문제를 일정 부분 해소했다는 의미다. 다만 경쟁모델인 ‘미토스’ 대비 매개변수(파라미터) 규모에 대해서는 구체적인 답변을 피했다. 저작권자 © 서울이코노미뉴스 무단전재 및 재배포 금지

관련 저널 읽기

전체 보기 →