GPT-5.2를 소개합니다 - OpenAI

[AI] gpt-5.1 | | 🔬 연구
#ai 딜 #gpt-5 #gpt-5.2 #openai #ai #chatgpt #review #리뷰 #인공지능
원문 출처: [AI] gpt-5.1 · Genesis Park에서 요약 및 분석

요약

OpenAI가 전문적인 지식 업무와 장시간 에이전트 실행 작업에 최적화된 최신 프론티어 모델인 GPT-5.2를 공개했습니다. 이 모델은 44개 직종의 지식 업무를 평가하는 GDPval 벤치마크에서 70.9%의 승률을 기록하며 인간 전문가를 처음으로 능가하는 최고 기록을 세웠고, 인간 전문가보다 11배 이상 빠르면서도 비용은 1% 미만에 불과한 뛰어난 경제적 효율성을 입증했습니다. 특히 재무 모델링 등 복잡한 스프레드시트 작성과 소프트웨어 엔지니어링 분야에서 GPT-5.1 대비 눈에 띄는 성능 향상을 보여주었으며, Instant, Thinking, Pro 등 다양한 버전으로 ChatGPT 유료 플랜과 API를 통해 순차적으로 제공됩니다.

본문

[메인 콘텐츠로 건너뛰기](https://openai.com/ko-KR/index/introducing-gpt-5-2/#main) [](https://openai.com/ko-KR/) * [리서치](https://openai.com/ko-KR/research/index/) * 제품 * [비즈니스](https://openai.com/ko-KR/business/) * [개발자](https://openai.com/ko-KR/api/) * [회사](https://openai.com/ko-KR/about/) * [재단(새 창에서 열기)](https://openaifoundation.org) 로그인[ChatGPT 사용하기(새 창에서 열기)](https://chatgpt.com/?openaicom-did=c5c5a636-2fcf-4b46-bfea-f948213121eb&openaicom_referred=true) * 리서치 * 제품 * 비즈니스 * 개발자 * 회사 * [재단(새 창에서 열기)](https://openaifoundation.org) GPT-5.2를 소개합니다 | OpenAI 목차 * [모델 성능](https://openai.com/ko-KR/index/introducing-gpt-5-2/#model-seongneung) * [ChatGPT에 도입되는 GPT-5.2](https://openai.com/ko-KR/index/introducing-gpt-5-2/#chatgpte-doibdoeneun-gpt-52) * [안전](https://openai.com/ko-KR/index/introducing-gpt-5-2/#anjeon) * [지원 범위 및 가격](https://openai.com/ko-KR/index/introducing-gpt-5-2/#jiweon-beomwi-mic-gagyeog) * [OpenAI의 파트너](https://openai.com/ko-KR/index/introducing-gpt-5-2/#openaiyi-pateuneo) * [부록](https://openai.com/ko-KR/index/introducing-gpt-5-2/#burog) 2025년 12월 11일 [제품](https://openai.com/ko-KR/news/product-releases/)[릴리스](https://openai.com/research/index/release/) # GPT‑5.2를 소개합니다 GPT‑5.2는 전문 작업과 장시간 에이전트 실행에 최적화된 최신 프런티어 모델입니다. 로딩 중... 전문 지식 업무에서 가장 뛰어난 성능을 제공하는 새로운 모델 시리즈 GPT‑5.2를 소개합니다. 많은 ChatGPT Enterprise 사용자가 AI를 통해 하루에 40~60분을 절약하고 있으며, 사용량이 많은 사용자는 주당 10시간 이상을 절약하고 있다고 [말합니다⁠](https://openai.com/ko-KR/index/the-state-of-enterprise-ai-2025-report/). OpenAI는 AI 모델이 사용자에게 더 큰 경제적 가치를 제공할 수 있도록 GPT‑5.2를 새롭게 설계했습니다. GPT‑5.2는 스프레드시트 생성, 프레젠테이션 제작, 코드 작성, 이미지 인식, 긴 컨텍스트 이해, 도구 활용, 여러 단계에 걸친 복잡한 프로젝트 작업에서 더욱 강화된 성능을 제공합니다. GPT‑5.2는 여러 벤치마크에서 새로운 최고 기록을 달성했으며 44개 직종의 지식 업무를 명확한 기준으로 평가하는 GDPval에서도 업계 전문가를 능가하며 이를 입증했습니다. | | **GPT-5.2 Thinking** | **GPT-5.1 Thinking** | | --- | --- | --- | | **GDPval(승리 또는 동점) ** 지식 작업 | 70.9% | 38.8%(GPT-5) | | **SWE-Bench Pro(공개) ** 소프트웨어 엔지니어링 | 55.6% | 50.8% | | **SWE-bench Verified ** 소프트웨어 엔지니어링 | 80.0% | 76.3% | | **GPQA Diamond(도구 미사용) ** 과학 문제 | 92.4% | 88.1% | | **CharXiv Reasoning(Python 사용) ** 과학 도표 문제 | 88.7% | 80.3% | | **HMMT(2025년 2월) ** 수학 토너먼트 | 99.4% | 96.3% | | **FrontierMath(1~3등급) ** 고급 수학 | 40.3% | 31.0% | | **ARC-AGI-1 (Verified) ** 추상적 추론 | 86.2% | 72.8% | | **ARC-AGI-2 (Verified) ** 추상적 추론 | 52.9% | 17.6% | [**Notion** ⁠(새 창에서 열기)](https://www.notion.com/), [**Box** ⁠(새 창에서 열기)](https://www.box.com/home), [**Shopify** ⁠(새 창에서 열기)](https://www.shopify.com/), [**Harvey** ⁠(새 창에서 열기)](https://www.harvey.ai/), [**Zoom** ⁠(새 창에서 열기)](https://www.zoom.com/)은 GPT‑5.2가 장시간 추론과 도구 호출에서 최고 수준의 성능을 발휘한다는 피드백을 전했으며 [**Databricks** ⁠(새 창에서 열기)](https://www.databricks.com/), [**Hex** ⁠(새 창에서 열기)](https://hex.tech/),[**Triple Whale** ⁠(새 창에서 열기)](https://www.triplewhale.com/)은 GPT‑5.2가 에이전트 기반 데이터 과학과 문서 분석 작업에서 탁월한 성능을 보인다고 밝혔습니다. [**Cognition** ⁠(새 창에서 열기)](https://cognition.ai), [**Warp** ⁠(새 창에서 열기)](https://www.warp.dev/), [**Charlie Labs** ⁠(새 창에서 열기)](https://www.charlielabs.ai/), [**JetBrains** ⁠(새 창에서 열기)](https://www.jetbrains.com/), [**Augment Code** ⁠(새 창에서 열기)](https://www.augmentcode.com/)는 GPT‑5.2가 인터랙티브 코딩, 코드 리뷰, 버그 탐지 등에서 측정 가능한 향상을 보이며 최고 수준의 에이전트 코딩 성능을 제공한다고 평가했습니다. GPT‑5.2 Instant, Thinking, Pro 모델은 오늘부터 ChatGPT에서 유료 플랜을 시작으로 순차 출시됩니다. API에서는 모든 개발자가 사용할 수 있습니다. GPT‑5.2는 일반 지능, 긴 컨텍스트 이해, 에이전트형 도구 호출, 비전 기능 전반에서 큰 폭의 발전을 이루었고 복잡한 실제 작업을 처음부터 끝까지 수행하는 능력도 이전 모델보다 크게 강화되었습니다. ## 모델 성능 #### 경제 가치가 높은 작업 GPT‑5.2 Thinking은 현실 세계의 전문 업무를 처리하는 데 있어 현존하는 모델 중 가장 뛰어난 성능을 보입니다. 44개 직종의 지식 업무를 명확한 기준으로 평가하는 [_GDPval_ ⁠](https://openai.com/ko-KR/index/gdpval/)에서는 GPT‑5.2 Thinking이 새로운 최고 기록을 세우며 인간 전문가 수준 혹은 그 이상에 도달한 첫 번째 모델로 평가되었습니다. 전문 심사자들은 GPT‑5.2 Thinking이 GDPval 지식 작업에서 진행된 비교 평가의 70.9%에서 업계 최고 수준의 전문가와 동등하거나 그를 능가하는 결과를 보였다고 평가했습니다. 이러한 작업에는 프레젠테이션, 스프레드시트, 기타 결과물 제작이 포함되었습니다. GPT‑5.2 Thinking은 GDPval 작업에서 전문가보다 11배 이상 빠른 속도로 결과물을 생성하면서도 비용은 1% 미만에 불과했습니다. 이는 인간의 검토와 함께 사용할 경우 GPT‑5.2가 전문 작업을 지원하는 데 매우 유용할 수 있음을 시사합니다. 속도와 비용 수치는 과거 지표를 기반으로 하며, ChatGPT에서 측정되는 실제 속도는 달라질 수 있습니다. _GDPval에서는 모델이 미국 GDP에 가장 크게 기여하는 9개 산업 전반의 44개 직종을 대상으로 명확히 정의된 지식 업무를 수행합니다. 업무 목표는 영업 프레젠테이션, 회계 스프레드시트, 응급 진료 스케줄, 제조 도면, 짧은 영상 등 실제 업무 환경에서 사용할 수 있는 결과물을 생성하는 것입니다. ChatGPT의 GPT‑5.2 Thinking 모델에서는 GPT‑5 Thinking에는 없던 새로운 도구들을 사용할 수 있습니다._ 특히 우수한 결과물을 검토하던 한 GDPval 심사자는 “출력 품질이 확실히 도약한 것이 느껴진다… 전문 인력이 있는 회사가 만든 결과물처럼 보이며, 일부 작은 오류는 있지만 전반적인 구성과 제안이 놀라울 만큼 잘 정리되어 있다”고 평가했습니다. 또한 포춘 500대 기업을 위한 3대 재무제표 모델을 적절한 형식과 인용까지 갖춰 작성하거나 비상장 전환을 위한 LBO 모델을 구축하는 등 주니어 투자은행 애널리스트 수준의 스프레드시트 모델링 과제를 기준으로 한 내부 평가에서 GPT‑5.2 Thinking의 과제당 평균 점수는 68.4%로, 59.1%인 GPT‑5.1보다 9.3% 높게 나타났습니다. 나란히 비교해보면 스프레드시트와 슬라이드 서식 작업에서도 GPT‑5.2 Thinking이 더 정교한 결과를 제공하는 것이 확인됩니다. 워크포스 플래너캡 테이블프로젝트 관리 ![Side by side example of spreadsheet outputs from GPT-5.1 vs GPT-5.2](https://images.ctfassets.net/kftzwdyauwt9/56quNQBhWkueK3WGnLDE1e/ba7a5bc2f39ca2fb78e8576b51b0d819/Workforce_Planner_-_desktop_-_light.png?w=3840&q=90&fm=webp) **프롬프트:** 인원 현황, 채용 계획, 이직률, 예산 영향을 포함한 인력 계획 모델을 작성하세요. 엔지니어링, 마케팅, 법무, 영업 부서를 모두 반영해야

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →