저는 Claude, GPT, Gemini, Grok에게 늑대인간 게임 120개를 플레이하게 했습니다. GPT-5.4는 최고의 거짓말쟁이이자 탐정입니다. Opus와 Gemini는 예상보다 더 가깝습니다. Grok은 이것에 능숙하지 않습니다. 전체 글: plduhoux.fr/en/blog/maki...
bluesky
|
|
🤖 AI 모델
#뉴스
#ai 모델
#claude
#gemini
#gpt-5
원문 출처: bluesky · Genesis Park에서 요약 및 분석
요약
한 연구자가 Claude, GPT, Gemini, Grok 등 대규모 언어 모델을 대상으로 늑대인간 게임 120회를 진행하는 실험을 실시했습니다. 그 결과, GPT-5.4가 최고의 거짓말 능력과 탐정 역량을 보여 가장 뛰어난 성과를 기록했습니다. 반면 Opus와 Gemini는 비교적 선전했으나, Grok은 게임 전략 수립에 어려움을 겪는 등 상대적으로 부진한 모습을 보였습니다.
본문
저는 Claude, GPT, Gemini, Grok에게 늑대인간 게임 120개를 플레이하게 했습니다.
GPT-5.4는 최고의 거짓말쟁이이자 탐정입니다. Opus와 Gemini는 예상보다 더 가깝습니다.
Grok은 이것에 능숙하지 않습니다.
전체 글: plduhoux.fr/en/blog/maki...
GPT-5.4는 최고의 거짓말쟁이이자 탐정입니다. Opus와 Gemini는 예상보다 더 가깝습니다.
Grok은 이것에 능숙하지 않습니다.
전체 글: plduhoux.fr/en/blog/maki...
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유