오픈AI, 가성비 높인 GPT 5.5 출시…앤스로픽 미토스 성능엔 못미쳐 - 한국경제

[AI] ai 모델 | | 🔬 연구
#ai 모델 #ai 딜 #ai 평가 #ai타임스 #gpt-5 #gpt-5.2 #openai #review #인공지능 #전문 작업 #전문가 평가
원문 출처: [AI] ai 모델 · Genesis Park에서 요약 및 분석

요약

오픈AI의 최신 모델 'GPT-5.2'는 복잡한 코딩과 심층적인 추론, 긴 시간이 소요되는 기업용 에이전트 작업 등에서 역대 최고 수준의 성능을 보여주며 전문가들의 찬사를 받았습니다. 출시 첫날 API에서 1조 토큰을 돌파할 정도로 산업계의 열광적인 반응을 얻었지만, 반면 일상적인 대화나 창의적인 글쓰기에서는 체감할 만한 큰 변화가 없고 답변 형식이 지나치게 딱딱하다는 아쉬운 평가를 동시에 받았습니다. 코드명 '갈릭'으로 불리는 이번 모델은 개발자와 B2B 시장의 이탈을 막기 위해 특화된 것이며, 일반 사용자들이 만족할 만한 챗봇의 편의성과 강력한 이미지 생성 기능은 내년 1월에 출시될 새로운 모델에서 선보일 예정입니다.

본문

입력 2026.04.24 07:38 수정 2026.04.24 07:38 오픈AI가 최신 인공지능(AI) 모델 GPT-5.5를 23일(현지시간) 출시했다. 전작 대비 적은 컴퓨팅 자원으로도 뛰어난 작업물을 내놓을 수 있다. 다만 제한적으로 공개된 경쟁사의 AI 모델 '미토스(mythos)의 성능은 뛰어넘지 못했다. 그렉 브록만 오픈AI 사장은 이날 신규 모델 출시 브리핑에서 "GPT-5.5는 5.4와 비교해 더 적은 모델로 더욱 빠르게 날카롭게 사고한다"고 밝혔다. 그는 "실제 환경에서 토큰(AI 연산 기본단위)당 지연 시간을 측정했을 때 GPT-5.5는 전작과 일치하는 속도를 보여주면서도 지능은 훨씬 더 높다"고 강조했다. 이는 AI모델 경쟁에서 단순 성능보다 '비용 대비 성능'이 더욱 중요해지는 시점에서 획기적인 발전이라는 게 오픈AI의 설명이다. 브록만 사장은 "거시적으로 우리는 '컴퓨팅 자원 경제'로 이동하고 있다며 "기업 사용자들에게 더 많은 첨단 AI모델(한도)을 제공할 수 있다는 뜻"이라고 설명했다. GPT-5.5는 전작 대비 코딩·추론·지식업무 등에서 뛰어난 성능을 자랑한다. 지식 업무 수행 능력을 평가하는 'GDPval' 지표는 84.9%로 GPT-5.4보다 1.9%포인트 높았다. 터미널 환경 작업 능력을 측정하는 '터미널-벤치 2.0'은 82.7%로 이전 모델 대비 7.5%포인트 높았다. 다만 앤스로픽이 40개 파트너사에 제한적으로 공개한 미토스의 성능에는 미치지 못했다. 미토스의 터미널-벤치2.0 지표는 92.1%이었다. 범용 지능을 측정하는 인류 마지막 시험(HLE) 정답률은 GDP-5.5가 41.4%로 미토스(56.8%)를 뛰어넘지 못했다. 오픈AI 측은 미토와 성능을 비교하는 질문에 "모델이 매우 정확하다"며 성능지표를 확인해보라며 즉답을 피했다. 또 매개변수(파라미터) 수가 미토스(10조 개)보다 더 많은지 묻자 "매개변수 수는 답하기 어렵다"고 답했다. 실리콘밸리=김인엽 특파원 [email protected]

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →