저는 Claude, GPT, Gemini, Grok에게 늑대인간 게임 120개를 플레이하게 했습니다. GPT-5.4는 최고의 거짓말쟁이이자 탐정입니다. Opus와 Gemini는 예상보다 더 가깝습니다. Grok은 이것에 능숙하지 않습니다. 전체 글: plduhoux.fr/en/blog/maki...

bluesky | 2026년 5월 5일 18:51 | 🤖 AI 모델

#뉴스 #ai 모델 #claude #gemini #gpt-5

원문 출처: bluesky · Genesis Park에서 요약 및 분석

요약

한 연구자가 Claude, GPT, Gemini, Grok 등 대규모 언어 모델을 대상으로 늑대인간 게임 120회를 진행하는 실험을 실시했습니다. 그 결과, GPT-5.4가 최고의 거짓말 능력과 탐정 역량을 보여 가장 뛰어난 성과를 기록했습니다. 반면 Opus와 Gemini는 비교적 선전했으나, Grok은 게임 전략 수립에 어려움을 겪는 등 상대적으로 부진한 모습을 보였습니다.

본문

저는 Claude, GPT, Gemini, Grok에게 늑대인간 게임 120개를 플레이하게 했습니다.
GPT-5.4는 최고의 거짓말쟁이이자 탐정입니다. Opus와 Gemini는 예상보다 더 가깝습니다.
Grok은 이것에 능숙하지 않습니다.

전체 글: plduhoux.fr/en/blog/maki...

원문 보기 (bluesky)

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

요약

본문

관련 저널 읽기