오픈AI, 복잡한 업무 처리 능력 높인 AI 모델 'GPT-5.5' 공개...코딩·리서치·문서 작업까지 - 인공지능신문
[AI] coding
|
|
🤖 AI 모델
#ai 딜
#ai 모델
#gpt-5
#openai
#오픈ai
요약
오픈AI는 코딩, 리서치, 문서 작업 등 실제 업무 전반을 지원하는 최신 AI 모델 ‘GPT-5.5’를 공개했다. 이 모델은 이전 세대인 GPT-5.4 대비 처리 속도와 효율성을 유지하면서 성능을 고도화했으며, 사용자 의도를 빠르게 파악해 복합적인 업무를 수행한다. 또한 코딩 관련 벤치마크에서 이전 모델을 상회하는 점수를 기록하며 실제 개발 과제 해결 능력을 크게 개선했다.
왜 중요한가
개발자 관점
검토중입니다
연구자 관점
검토중입니다
비즈니스 관점
검토중입니다
본문
안전성 강화… 고위험 사이버 요청에 보호 조치 적용 오픈AI(OpenAI)는 코딩, 온라인 리서치, 데이터 분석, 문서 및 스프레드시트 작성, 소프트웨어 조작 등 실제 업무 전반을 지원하도록 설계된 최신 인공지능(AI) 모델 'GPT-5.5'를 23일(현지시간) 공개했다. GPT-5.5는 에이전트형 코딩(agentic coding), 컴퓨터 활용, 지식업무, 초기 과학 연구 등 실제 업무와 맞닿은 영역에서 강점을 보인다. 실제 서비스 환경에서는 GPT-5.4와 유사한 토큰당 지연시간을 유지하면서도 더 높은 성능을 제공하고, 동일한 코덱스 작업을 더 적은 토큰으로 수행해 효율성도 높였다. 특히, 사용자의 의도를 더 빠르게 이해하고, 필요한 도구를 활용해 결과를 점검하며 여러 단계의 업무를 이어서 수행할 수 있도록 설계됐다. 코딩 성능도 강화됐다. 실제 개발 업무와 가까운 코딩 과제에서 GPT-5.4 대비 개선된 성능이 확인됐다. 복잡한 명령줄 작업 수행 능력을 평가하는 Terminal-Bench 2.0에서는 82.7%를 기록해 GPT-5.4의 75.1%를 웃돌았고, 장시간이 걸리는 코딩 과제를 평가하는 내부 지표 Expert-SWE에서도 GPT-5.4를 상회했다. 실제 소프트웨어 이슈 해결 능력을 평가하는 SWE-Bench Pro에서는 58.6%를 기록했으며, 이전 모델보다 더 많은 작업을 단일 패스로 해결했다. 코드 작성, 디버깅, 테스트, 검증 등 실제 개발 업무에 가까운 작업에서 개선된 성능을 보였다. 리서치와 데이터 분석, 컴퓨터 활용, 문서 작성 등 실제 업무와 가까운 영역에서도 성능 개선이 확인됐다. GPT-5.5는 지식업무 수행 능력을 평가하는 GDPval에서도 GPT-5.4 대비 개선된 결과를 보였다. 실제 컴퓨터 조작 능력을 평가하는 OSWorld-Verified에서도 78.7%로 GPT-5.4의 75.0%보다 높았다. 코덱스에서는 문서, 스프레드시트, 슬라이드 작성 성능도 향상됐으며, 컴퓨터 활용 기능과 결합하면 화면을 인식하고 클릭, 입력, 탐색 등을 이어서 수행할 수 있다. 답변 생성에 그치지 않고 실제 소프트웨어 환경에서 작업을 이어가는 활용도 가능해졌다. 과학·기술 연구 분야에서도 성능 개선이 확인됐다. 다단계 과학 데이터 분석 능력을 평가하는 GeneBench에서 GPT-5.4보다 개선된 결과를 기록했다. 데이터 분석과 해석, 후속 판단이 이어지는 연구 업무에서도 활용 범위를 넓혔다는 점에서 의미가 있다. 이번 모델은 안전성 측면에서도 강화됐다. GPT-5.5는 보다 강력한 세이프가드와 함께 출시했으며, 사이버 관련 고위험 요청에는 더 높은 수준의 거절 기준과 추가적인 보호 조치를 적용했다. 오픈AI는 기술 발전의 혜택이 공격자보다 방어자에게 먼저, 더 넓게 돌아가야 한다는 원칙 아래, 합법적이고 방어적인 보안 활용을 지원하는 접근을 이어가고 있다. GPT-5.5는 이날부터 챗GPT 플러스·프로·비즈니스·엔터프라이즈 사용자와 코덱스에 순차 적용된다. GPT-5.5 프로는 챗GPT 프로·비즈니스·엔터프라이즈 사용자에게 제공된다. API 배포에는 별도의 안전 및 보안 요건이 적용되며, 오픈AI는 GPT-5.5와 GPT-5.5 프로를 API에도 곧 제공할 예정이다.