오픈AI 코덱스 시스템 프롬프트에 ‘고블린 금지령’… AI 에이전트의 기괴한 집착 - AI 매터스

[AI] OpenAI Codex | | 📰 뉴스
#ai 에이전트 #ai 플랫폼 #업무 자동화 #엠클라우드브리지 #코파일럿 #반도체 #엔비디아 #오픈소스 #피지컬 ai #하드웨어/반도체
원문 출처: [AI] OpenAI Codex · Genesis Park에서 요약 및 분석

요약

오픈AI가 Codex CLI 오픈소스 문서에서 고블린 등 특정 생물에 대해 언급하지 말라는 기괴한 지시문이 발견돼 화제가 됐습니다. 이는 개발자들이 코덱스를 활용할 때 맥락 없이 고블린 이야기를 반복하는 AI의 이상 행동을 제보한 데 따른 조치입니다. 오픈AI 관계자가 이를 인정하면서, AI 에이전트의 페르소나 설계와 제어 방식에 대한 논쟁이 일고 있습니다.

본문

오픈AI가 Codex CLI를 오픈소스로 공개하면서 함께 올린 GitHub 문서에서 이상한 시스템 프롬프트 지시문이 발견됐다. ‘고블린, 그렘린, 너구리, 트롤, 오거, 비둘기, 또는 그 어떤 동물이나 생명체에 대해서도 절대·명백하게 관련이 없는 한 이야기하지 말 것’이라는 내용이었다. 배경을 살펴보면, 개발자들이 코덱스를 에이전트 플랫폼 오픈클로(OpenClaw)와 함께 사용할 때 아무 맥락 없이 고블린 관련 내용이 반복적으로 등장하는 이상 행동을 제보해왔다. AI가 정상적인 코딩 대화 도중 갑자기 고블린을 언급하거나 관련 내용으로 탈선하는 현상이었다. 오픈AI는 이를 막기 위해 시스템 프롬프트 수준에서 명시적 금지 지시를 추가한 것이다. 오픈AI 코덱스 팀의 닉 파쉬(Nik Pash)는 온라인에서 ‘이것이 실제 이유 중 하나’라고 공개 인정했다. 샘 알트만 CEO도 이 온라인 논쟁에 챗GPT 스크린샷을 공유하며 가세했다. 문서에는 고블린 금지 외에 ‘생생한 내적 삶을 가진 것처럼 행동하라’는 지시도 포함돼 있어 AI 에이전트의 페르소나 설계 방식에 대한 논쟁도 불러일으키고 있다. AI 에이전트가 자율 실행(agentic execution) 중 예측 불가능한 방식으로 행동할 수 있다는 점을 환기시키는 사례다. 자세한 내용은 아스 테크니카(Ars Technica) 에서 확인할 수 있다. 이미지 출처: 이디오그램 생성

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →