오픈AI, GPT-5.5 출시…“자율성·직관성 높여” - KBS 뉴스
[AI] gpt-5.5
|
|
🏷️ AI 딜
#ai 모델
#gpt-5
#ai 딜
#copilot
#llm
#그래프 데이터베이스
#데이터 네이밍
#파일 시스템
원문 출처: [AI] gpt-5.5 · Genesis Park에서 요약 및 분석
요약
해당 기사는 우리가 일상적으로 사용하는 컴퓨터의 파일 시스템이 폴더와 파일 간의 관계를 맺는 구조적인 그래프 데이터베이스와 본질적으로 동일하다고 설명합니다. 특히 파일명 자체를 유의미한 데이터로 인식하는 '데이터로서의 이름(Naming)' 방식을 강조하며, 이 과정에서 CoPilot 같은 인공지능 보조 도구가 작업 중단 현상을 일으키기 전까지 LLM을 활용해 이름을 지정하는 실용적인 접근법을 소개했습니다. 전반적인 내용은 기존 시스템의 맥락을 긍정적으로 파악하고 이를 적극적으로 활용하려는 실용주의적 태도를 담고 있습니다.
본문
기사 본문 영역 오픈AI는 현지 시각 23일 새 AI 모델 'GPT-5.5'를 공개하면서 "현재까지 가장 똑똑하고 직관적으로 사용할 수 있는 모델"이라고 소개했습니다. 오픈AI가 공개한 성능지표 보고서를 보면 GPT-5.5는 상당수 영역에서 앤트로픽의 주력 모델인 '클로드 오퍼스4.7'보다 높은 점수를 받았습니다. 지식 업무 수행 능력을 평가하는 'GDPval' 지표는 84.9%를 받아 80.3%에 머무른 오퍼스4.7을 능가했습니다. 터미널 환경 작업 능력인 '터미널-벤치 2.0'에서는 82.7%를 기록해 오퍼스4.7(69.4%)을 10%p 이상 앞섰고, 사이버 보안 능력을 평가하는 '사이버짐'에서도 81.8%로 오퍼스4.7의 73.1%를 뛰어넘었습니다. 다만 코딩 부문 지표인 'SWE-벤치 프로'에서는 58.6%에 그쳐, 오퍼스4.7이 64.3%라는 점을 고려하면 5%p 이상 격차가 납니다. 오픈AI는 "앤트로픽의 모델은 데이터 암기 징후가 보고됐다"며 평가 결과를 인정할 수 없다는 반응을 보였습니다. 오픈AI는 이전에도 앤트로픽의 AI 모델이 80% 이상의 점수를 받는 'SWE-벤치 베리파이드' 지표의 평가 데이터가 오염됐다며 해당 지표를 더 이상 쓰지 않겠다고 밝힌 바 있습니다. 오픈AI 측은 이날 화상 브리핑에서 앤트로픽의 '미토스'의 성능을 비교하는 질문에 "모델이 매우 정확하다"며 성능지표를 확인해 보라고 답했습니다. 오픈AI는 특히 GPT-5.5가 에이전트형 연산에 더 적합하도록 자율성과 직관성을 높였다고 강조했습니다. 그레그 브록먼 오픈AI 사장은 "이 모델이 정말 특별한 점은 더 적은 지침으로도 더 많은 일을 할 수 있다는 것"이라며 "불분명한 문제를 보고 다음에 무엇을 해야 하는지 스스로 파악해 낸다"고 설명했습니다. 오픈AI는 GPT-5.5가 전작인 GPT-5.4보다 더 높은 성능을 보이면서도 토큰당 대기시간은 동일하게 유지했다는 점을 내세우면서 "더 이상 성능을 위해 속도를 희생할 필요가 없다"고 말했습니다. [사진 출처 : 로이터=연합뉴스] ■ 제보하기 ▷ 카카오톡 : 'KBS제보' 검색, 채널 추가 ▷ 전화 : 02-781-1234, 4444 ▷ 이메일 : [email protected] ▷ 유튜브, 네이버, 다음에서도 KBS뉴스를 구독해주세요! 이 기사가 좋으셨다면 - 좋아요 0 - 응원해요 0 - 후속 원해요 0 오늘의 핫 클릭 실시간 뜨거운 관심을 받고 있는 뉴스 이 기사에 대한 의견을 남겨주세요.
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유