[AI 이슈] 오픈AI, 차세대 ‘GPT-5.5’ 공개…“지금까지 가장 똑똑하고 직관적인 모델” - AI라이프경제
[AI] gpt-5.5
|
|
🖥️ 하드웨어
#ai 딜
#gpt-5
#gpt-5.4
#openai
#오픈ai
#nvidia halos
#차량 안전성
#하드웨어/반도체
요약
NVIDIA는 GTC 산호세 2025에서 자율주행차(AV)의 안전성을 강화하기 위한 새로운 전략으로 'NVIDIA Halos'를 소개했습니다. 이번 발표는 AV 안전 규격인 S74743을 충족시키기 위한 구체적인 기술적 접근 방식을 제시하는 데 중점을 두었습니다. 해당 세션은 향후 자율주행 기술의 안전성과 신뢰성을 확보하는 방향성을 제시하는 것으로 보입니다.
왜 중요한가
개발자 관점
검토중입니다
연구자 관점
검토중입니다
비즈니스 관점
검토중입니다
본문
코딩·리서치·데이터 분석 등 실제 업무 전반을 겨냥한 차세대 업무형 AI 모델 공개 GPT-5.4와 유사한 지연시간 유지하며 코딩·문서작성·컴퓨터 활용 성능 전방위 업그레이드 오픈AI가 복잡한 실제 업무를 겨냥한 차세대 인공지능(AI) 모델 ‘GPT-5.5’를 공개했다. 코딩과 온라인 리서치, 데이터 분석, 문서·스프레드시트 작성, 소프트웨어 조작 등 지식 노동 전반을 지원하는 ‘업무형 AI’로 설계된 것이 특징이다. 오픈AI는 23일(현지시간) 공식 블로그를 통해 GPT-5.5를 발표하며 “지금까지 개발한 모델 중 가장 똑똑하고 직관적인 모델”이라며 “컴퓨터에서 업무를 처리하는 새로운 방식을 돕는다”고 밝혔다. GPT-5.4 대비 실제 서비스 환경에서 토큰당 지연시간(latency)은 비슷한 수준을 유지하면서도 더 높은 성능을 구현했고, 동일한 코덱스(Codex) 작업을 더 적은 토큰으로 처리해 효율성도 끌어올렸다. GPT-5.5는 특히 에이전트형 코딩, 컴퓨터 활용, 지식 업무, 초기 과학 연구 등 실제 업무와 맞닿은 영역에서 강점을 보이도록 설계됐다. 사용자의 의도를 더 빠르게 파악하고, 필요한 도구를 스스로 호출해 결과를 점검하며, 여러 단계를 연속해서 수행하는 ‘멀티스텝 업무 처리’ 능력이 강화됐다. 코딩 성능은 전반적으로 상향됐다. 복잡한 명령줄 작업 수행 능력을 평가하는 ‘터미널 벤치 2.0(Terminal-Bench 2.0)’에서 GPT-5.5는 82.7%를 기록해 GPT-5.4(75.1%)를 크게 웃돌았다. 장시간이 소요되는 코딩 과제를 측정하는 내부 지표 ‘엑스퍼트-SWE(Expert-SWE)’에서도 이전 모델을 상회한 것으로 나타났다. 실제 소프트웨어 문제 해결 능력을 따지는 ‘SWE-벤치 프로(SWE-Bench Pro)’ 평가에서는 58.6%를 기록했다. 오픈AI에 따르면 GPT-5.5는 이전 세대보다 더 많은 작업을 단일 패스(single pass)로 해결했으며, 코드 작성부터 디버깅, 테스트, 검증에 이르는 실제 개발 업무 전 과정에서 성능이 개선됐다. 리서치와 데이터 분석, 컴퓨터 활용, 문서 작성 등 지식 노동과 밀접한 영역에서도 업그레이드가 확인됐다. 지식 업무 수행 능력을 평가하는 ‘GDPval’ 지표에서 GPT-5.5는 GPT-5.4 대비 향상된 점수를 기록했다는 설명이다. 문서·스프레드시트·슬라이드 작성 기능을 담당하는 코덱스 영역에서도 성능이 높아졌다. 여기에 컴퓨터 활용 기능이 결합되면서 화면을 인식하고 클릭·입력·탐색을 연속적으로 수행하는 ‘실제 PC 조작’에 한층 가까워졌다. 단순히 답변을 생성하는 데 그치지 않고, 실제 소프트웨어 환경에서 작업을 이어가는 능력이 강화된 셈이다. 안정성과 안전성도 보강했다. 오픈AI는 GPT-5.5를 “더 강력한 세이프가드(safeguard)와 함께 출시했다”고 밝히며, 특히 사이버 관련 고위험 요청에 대해선 더 엄격한 거절 기준과 추가 보호 조치를 적용했다고 설명했다. API 배포 시에는 별도의 안전·보안 요건도 병행한다. GPT-5.5는 23일부터 챗GPT 플러스·프로·비즈니스·엔터프라이즈 이용자와 코덱스에 순차 적용된다. 고성능 버전인 GPT-5.5 프로는 챗GPT 프로·비즈니스·엔터프라이즈 구독자에게 제공된다. 오픈AI는 GPT-5.5와 GPT-5.5 프로를 개발자용 응용프로그램인터페이스(API)에도 곧 지원할 계획이다.