뉴스피드 큐레이션 SNS 대시보드 저널

오픈AI, GPT-5.5 공개 ··· 코딩·리서치·업무 자동화 성능 강화 - 데이터넷

[AI] AI coding | | 🔒 보안
#gpt-5 #기타 ai #axios #macos #openai #보안 #코드 서명

요약

OpenAI는 최근 Axios 사이버 공격으로 코드 서명 워크플로우가 타격을 입은 후, 보안을 위해 macOS 인증서를 교체하는 조치를 취했습니다. 이번 인증서 순환은 해커가 악성 코드에 정당한 서명을 하는 것을 방지하여 소프트웨어 공급망 공격의 피해를 최소화하려는 목적을 가집니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

GPT 5.4 대비 성능 개선 뚜렷 ··· 세이프가드로 안정성 동시 강화 [데이터넷] 오픈AI는 최신 AI 모델 GPT-5.5를 공개했다고 24일 밝혔다. GPT-5.5는 ▲코딩 ▲온라인 리서치 ▲데이터 분석 ▲문서 및 스프레드시트 작성 ▲소프트웨어 조작 등 실제 업무 전반을 지원하도록 설계된 모델이다. GPT-5.5는 에이전트형 코딩(agentic coding), 컴퓨터 활용, 지식업무, 초기 과학 연구 등 실제 업무와 맞닿은 영역에서 강점을 보인다. 실제 서비스 환경에서는 GPT-5.4와 유사한 토큰당 지연시간을 유지하면서도 더 높은 성능을 제공하고, 동일한 코덱스 작업을 더 적은 토큰으로 수행해 효율성도 높였다. 사용자의 의도를 더 빠르게 이해하고, 필요한 도구를 활용해 결과를 점검하며 여러 단계의 업무를 이어서 수행할 수 있도록 설계됐다. 코딩 성능도 강화됐다. 복잡한 명령줄 작업 수행 능력을 평가하는 터미널 벤치(Terminal-Bench) 2.0에서는 82.7%를 기록해 GPT-5.4의 75.1%를 웃돌았고, 장시간이 걸리는 코딩 과제를 평가하는 내부 지표 엑스퍼트-SWE에서도 GPT-5.4를 상회했다. 실제 소프트웨어 이슈 해결 능력을 평가하는 SWE-벤치 프로에서는 58.6%를 기록했으며, 이전 모델보다 더 많은 작업을 단일 패스로 해결했다. 코드 작성, 디버깅, 테스트, 검증 등 실제 개발 업무에 가까운 작업에서 개선된 성능을 보였다. 리서치와 데이터 분석, 컴퓨터 활용, 문서 작성 등 실제 업무와 가까운 영역에서도 성능 개선이 확인됐다. GPT-5.5는 지식업무 수행 능력을 평가하는 GDPval에서도 GPT-5.4 대비 개선된 결과를 보였다. 실제 컴퓨터 조작 능력을 평가하는 OS월드-베리파이드(OSWorld-Verified)에서도 78.7%로 GPT-5.4의 75.0%보다 높았다. 아울러 코덱스에서는 문서, 스프레드시트, 슬라이드 작성 성능이 향상됐으며, 컴퓨터 활용 기능과 결합하면 화면을 인식하고 클릭, 입력, 탐색 등을 이어서 수행할 수 있다. 답변 생성에 그치지 않고 실제 소프트웨어 환경에서 작업을 이어가는 활용도 가능해졌다. 다단계 과학 데이터 분석 능력을 평가하는 GeneBench에서는 데이터 분석과 해석, 후속 판단이 이어지는 연구 업무에서도 활용 범위를 넓혔다. GPT-5.5는 보다 강력한 세이프가드와 함께 출시했으며, 사이버 관련 고위험 요청에는 더 높은 수준의 거절 기준과 추가적인 보호 조치를 적용했다. 합법적이고 방어적인 보안 활용을 지원하는 접근을 제공하며, 방어자 중심의 포괄적인 보안 원칙을 이어가고 있다. GPT-5.5는 챗GPT 플러스·프로·비즈니스·엔터프라이즈 사용자와 코덱스에 순차 적용된다. GPT-5.5 프로는 챗GPT 프로·비즈니스·엔터프라이즈 사용자에게 제공된다. API 배포에는 별도의 안전 및 보안 요건이 적용되며, 오픈AI는 GPT-5.5와 GPT-5.5 프로를 API에도 곧 제공할 예정이다.

관련 저널 읽기

전체 보기 →