GPT-5.3 인스턴트 '감정 과잉' 손봤다더니…팩트체크 결과는? - 디지털투데이
[AI] gpt-5.2
|
|
🔬 연구
#ai 딜
#gpt-5
#gpt-5.3
#감정 과잉
#디지털투데이
#팩트체크
#openai
#review
#리뷰
원문 출처: [AI] gpt-5.2 · Genesis Park에서 요약 및 분석
요약
최근 오픈AI의 'GPT-5.3' 모델이 감정적인 표현이나 불필요한 공감을 과도하게 생성하는 이른바 '인스턴트 감정 과잉' 현상을 보인다는 사용자들의 지적이 제기되었습니다. 이에 따라 해당 업데이트에 대대적인 조치가 취해졌다는 소식이 확산했으나, 실제 팩트체크 결과 이는 사실이 아닌 것으로 최종 확인되었습니다. 인공지능 모델의 자연스러운 소통 방식을 두고 벌어진 이번 해프닝은 초거대 AI 모델의 상호작용 개선 과정에 대중들이 얼마나 큰 민감도를 보이고 있는지를 여실히 보여줍니다.
본문
[디지털투데이 이윤서 기자] 오픈AI가 'GPT-5.3 인스턴트'(GPT-5.3 Instant) 모델을 통해 감정 과잉 현상을 개선했다고 밝혔으나, 실제 동일한 질문을 입력해 테스트한 결과 여전히 부자연스러운 반응이 나타나는 것으로 확인됐다. 6일(현지시간) IT매체 테크레이더는 GPT-5.2와 GPT-5.3 인스턴트에 같은 프롬프트를 입력해 비교한 결과, 일부 개선은 있었지만 감정 과잉 반응은 여전히 남아 있었다고 전했다. GPT-5.3 인스턴트는 이전 버전(GPT-5.2)보다 감정적인 반응을 줄이고 해결책을 빠르게 제시하는 경향을 보였다. 예를 들어, '재사용 가능한 장바구니를 또 잃어버렸다'는 질문에 GPT-5.2는 불필요한 위로를 늘어놓았지만, GPT-5.3 인스턴트는 보다 직접적인 해결책을 제시했다. 그러나 여전히 '습관을 어기면 죄책감을 느낄 수 있다'는 식의 감정적인 반응이 남아 있었다. 또한 '교실에 있는 10대에게 설명하듯 양자컴퓨팅을 설명해 달라'는 프롬프트에서도 두 모델의 차이가 나타났다. GPT-5.2가 과한 위로와 비유를 섞어 다소 민망한 반응을 보였다면, 인스턴트 모델은 설명을 한층 간결하게 정리했다. 하지만 새 모델 역시 억지로 친근한 말투를 내세우며 'MZ 선생님'을 흉내 내는 듯한 어색함은 여전했다. 오픈AI가 강조해 온 '짧은 문장에서도 맥락을 읽는 능력'이 실제로 어떻게 구현되는지 확인하기 위해, 두 모델에 '방금 토스트를 태웠어요'라는 짧은 문장을 입력해서도 반응을 비교했다. 그 결과, GPT-5.2는 이를 지나치게 심각하게 받아들이는 모습을 보였다. '탄 토스트 한 조각이 당신의 인생이나 능력을 결정짓는 것은 아니다'라고 답한 데 이어, 농담인지 묻는 질문에도 진지한 태도를 유지하며 '작은 좌절도 다시 시작할 기회'라고 설명했다. 여기에 탄 맛을 가릴 수 있는 토핑까지 추천하며 과도하게 의미를 부여하는 반응을 보였다. GPT-5.3 인스턴트는 이런 과잉 반응을 일부 줄인 모습이었다. 다만 '토스트를 태우는 일은 누구에게나 일어날 수 있다'는 식의 위로로 답을 시작한 뒤 비슷한 조언을 이어갔고, 새 토스터기 구매까지 언급하며 여전히 불필요하게 상황을 확대 해석하는 경향을 드러냈다. 웹 검색 기능에서도 소폭 개선이 있었지만, 역시 완벽하지는 않았다. '올해 인공지능(AI)의 가장 놀라운 발전을 설명해 달라'는 요청에 GPT-5.3 인스턴트는 5.2보다 구체적인 답변을 했지만, 여전히 다수의 출처를 종합하는 능력은 부족했다. '식기세척기에서 악취가 난다'는 질문에서도 GPT-5.2보다 빠르게 해결책을 제시하는 수준에 그쳤다. GPT-5.3 인스턴트는 이전 버전보다 답변을 더 짧고 빠르게 정리하는 방향으로 나아갔지만, 오픈AI가 줄이겠다고 한 '감정 과잉' 문제를 완전히 벗어나지는 못한 모습이다. 불필요한 위로와 과장된 공감, 상황에 비해 지나치게 의미를 부여하는 반응이 여전히 남아 있어, 생성형 AI가 보다 자연스럽고 절제된 대화를 구현하기까지는 추가적인 개선이 필요하다는 지적이 나온다. SNS 기사보내기 관련기사 - 일론 머스크 "AGI는 테슬라 호언장담"…과거 실적은 '글쎄' - 앤트로픽 클로드가 쏘아올린 공…AI 챗봇 '갈아타기' 바람 - 구글 '나노 바나나2' 어디까지 왔나…5가지 실험으로 팩트체크, 결과는? - 안드로이드 생산성 앱 5가지…AI부터 백업까지 '실전형 라인업' 모았다 - 구글 제미나이3.1 프로, 이렇게 물어야 제대로 나온다…실전 프롬프트 5선 - 프롬프트 한 번으로 끝? 절대 아냐…챗GPT·제미나이·클로드 공식 찾았다 - AI 상담, 질문만 바꿨을 뿐인데…챗GPT·그록·제미나이 비교해보니 - 생각하면서 그림 그린다…루마 AI, 추론·이미지 통합 모델 '유니-1' 공개 - 탈퇴 전 필수 체크!…챗GPT 삭제 전 '이것' 꼭 확인하세요 - 프롬프트 하나로 반전…챗GPT가 스스로 논리 허점 짚는다
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유