엇갈린 'GPT-5.2' 평가 "전문 작업 역대 최강...일반 채팅 개선 적어" - AI타임스
[AI] gpt-5.2
|
|
🔬 연구
#ai 딜
#ai타임스
#gpt-5
#gpt-5.2
#openai
#전문 작업
#ai 평가
#review
#인공지능
#전문가 평가
원문 출처: [AI] gpt-5.2 · Genesis Park에서 요약 및 분석
요약
오픈AI의 최신 모델 'GPT-5.2'는 복잡한 코딩과 심층적인 추론, 긴 시간이 소요되는 기업용 에이전트 작업 등에서 역대 최고 수준의 성능을 보여주며 전문가들의 찬사를 받았습니다. 출시 첫날 API에서 1조 토큰을 돌파할 정도로 산업계의 열광적인 반응을 얻었지만, 반면 일상적인 대화나 창의적인 글쓰기에서는 체감할 만한 큰 변화가 없고 답변 형식이 지나치게 딱딱하다는 아쉬운 평가를 동시에 받았습니다. 코드명 '갈릭'으로 불리는 이번 모델은 개발자와 B2B 시장의 이탈을 막기 위해 특화된 것이며, 일반 사용자들이 만족할 만한 챗봇의 편의성과 강력한 이미지 생성 기능은 내년 1월에 출시될 새로운 모델에서 선보일 예정입니다.
본문
오픈AI의 최신 인공지능(AI) 모델 'GPT-5.2'가 초기 테스트를 통해 전문가와 개발자, 기업용 업무 처리 등에서 역대 최고로 꼽혔다. 반면, 일상적인 글쓰기나 채팅에서는 눈에 띄는 개선이 보이지 않았다는 평이다. 벤처비트의 12일(현지시간) 보도에 따르면, GPT-5.2 출시 몇주 전부터 모델을 테스트한 일부 전문가들은 X(트위터)와 블로그 등을 통해 초기 테스트 결과를 공유했다. 이 가운데 가장 강력한 찬사는 상당 시간 사고 시간을 요구하는 어려운 문제를 처리하는 능력이 역대 최고 수준이라는 내용이다. 맷 슈머 하이퍼라이트AI(HyperWriteAI) CEO는 리뷰를 통해 'GPT-5.2 프로'를 "세계 최고의 모델"이라고 칭찬했다. 그는 "이 모델은 어려운 문제에 대해 한시간 이상 생각한다. 그리고 다른 어떤 모델도 해낼 수 없는 작업을 완벽하게 해낸다"라고 밝혔다. AI 기업가이자 전 AWS 임원인 앨리 K. 밀러도 X를 통해 "이 모델은 '친근한 동반자'가 아닌, '진지한 분석가로서의 AI'로 나아가는 한 걸음"이라고 말했다. 특히 "사고력과 문제 해결 능력이 눈에 띄게 향상된 것 같다"라며 "기존에 보던 것보다 훨씬 더 심층적인 설명을 제공한다. 심지어 작업 도중에 자체 OCR 기능을 개선하는 코드를 작성하기도 했다"라고 설명했다. 이 때문에 기업들은 이번 업데이트가 매우 중요한 의미를 갖는다는 것이다. 아론 레비 박스(Box) CEO는 X에서 회사가 GPT-5.2를 조기 테스트 중이라고 밝혔다. 그리고 이 모델이 금융 서비스와 생명 과학 분야의 실제 업무 지식을 테스트하는 확장 추론에서 "GPT-5.1과 GPT-5보다 훨씬 빠르게 대부분의 작업을 수행했다"라며, 회사는 이 모델을 자체 작업에 통합할 예정이라고 밝혔다. 개발자들은 GPT-5.2가 복잡한 코드 구조를 한번에 생성하는 데 특히 강력하다는 것을 발견했다. 피에트로 시라노 매직패스에이아이(magicpathai) CEO는 모델이 단일 파일로 인터랙티브 컨트롤을 갖춘 완전한 3D 그래픽 엔진을 구축하는 영상을 공유했다. 그는 "복잡한 추론과 수학, 코딩 및 시뮬레이션 분야에서 엄청난 도약"이라며 "발전 속도가 믿기지 않을 정도"라고 전했다. 대표적인 AI 평론가인 에단 몰릭 펜실베이니아 대학교 와튼 경영대학원 교수는 단 한번의 프롬프트만으로 시각적으로 복잡한 구조물을 생성하는 장면을 시연하며 "정말 인상적인 모델"이라는 평을 남겼다. 이런 체감 성능 외에도 가장 실질적인 변화는 모델이 흐름을 놓치지 않고 몇시간 동안 작업을 지속할 수 있다는 점이 꼽혔다. AI 테스트 전문 에브리(Every)의 댄 시퍼 CEO는 2시간 동안 자율적으로 작동해야 하는 손익 분석(P&L)을 성공적으로 수행했다고 밝혔다. 이처럼 GPT-5.2는 오픈AI가 밝힌 대로 전문 지식 작업과 코딩, 에이전트 워크플로우에서 다른 모델을 압도한다는 평가를 받았다. 샘 알트먼 오픈AI CEO도 GPT-5.2가 11일 출시 첫날에만 API에서 1조 토큰을 돌파하는 등 엄청난 속도로 기업과 개발자의 사용을 확대 중이라고 밝혔다. GPT-5.2 exceeded a trillion tokens in the API on its first day of availability and is growing fast! — Sam Altman (@sama) December 12, 2025 그러나 일반 사용자들에게는 이번 업데이트를 통해 체감되는 개선점이 적을 것이라는 평이다. 시퍼 CEO는 이번 개선 사항이 챗GPT의 사용자 편의성을 크게 향상해 주지만, 큰 변화를 가져올 정도는 아니라고 평가했다. 순수 채팅 기능 자체에서는 개선점을 알아차리기가 점점 어려워지고 있는데, 현재의 기본 모델들이 이미 대부분의 요구 사항을 충족하고 있기 때문이라는 것이다. 밀러 역시 "단점은 어조와 형식"이라며 "기본 어조가 다소 딱딱하게 느껴졌고, 길이/마크다운 방식이 지나치게 극단적이다. 간단한 질문에 58개의 글머리 기호와 번호가 매겨진 항목으로 답변했다"라고 지적했다 또 슈머 CEO는 모델의 싱킹(thinking) 모드를 사용할 때 상당히 속도가 떨어지는 것은 문제라고 지적했다. 이처럼 초기 반응으로 미뤄볼 때 GPT-5.2는 일반적인 채팅보다는 고급 사용자, 개발자 및 기업용 에이전트에 최적화된 도구인 것으로 보인다는 결론이다. 하지만 창의적인 글쓰기나 빠르고 능숙한 답변을 원하는 사용자에게는 다른 모델이 선택지가 될 수 있다는 분석이다. 한편, GPT-5.2는 코드명 '갈릭(Garlic)'으로 알려진 모델로, 이는 코딩과 B2B를 위한 특화 모델로 알려져 있다. 이는 '제미나이 3' 출시에 따라 개발자나 기업 사용자의 이탈을 방지하기 위한 것으로 알려졌다. 그리고 알트먼 CEO가 '코드 레드'를 발령, 챗GPT의 사용성 개선에 총력을 기울이라고 지시한 모델은 현재 막바지 테스트 중인 것으로 알려졌다. 따라서 일반 사용자들이 체감할 만한 성능 차를 느끼려면 내년 1월 출시 모델을 기다려야 한다는 결론이다. 특히, 새 모델에는 강력한 성능의 이미지 생성 기능도 포함될 예정이다. 임대준 기자 [email protected]
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유