AI도 ‘기분’이 있다? 사용자 태도가 만드는 차이

ITWorld Korea | | 🧠 기타 AI
#ai #ai 에이전트 #기타 ai #데이븐ai #인공지능 #박형빈 교수 #삼성전자 #자연어대시보드 #자율주행 실험실
원문 출처: ITWorld Korea · Genesis Park에서 요약 및 분석

요약

앤트로픽은 최신 비전 모델 ‘클로드 오퍼스 4.7’을 기반으로 한 비주얼 생성 플랫폼 ‘클로드 디자인’을 공개했다. 이 도구는 디자인부터 프로토타입, 프레젠테이션까지 자연어 명령어로 제작 가능하게 하여 비전문가의 진입 장벽을 낦췄다. 특히 기업의 디자인 시스템을 자동 반영하고 ‘클로드 코드’와 연동해 디자인과 개발 과정을 통합한 워크플로우를 제공하는 것이 특징이다. 현재 유료 구독자를 대상으로 리서치 프리뷰 형태로 서비스가 제공되고 있다.

본문

AI에게 “고맙다”고 말하는 게 이상할까? 그동안 오픈AI의 챗GPT, 앤트로픽의 클로드, 구글의 제미나이에게 “부탁해”나 “고마워”라고 말한다는 이유로 핀잔을 들은 적이 있다. AI가 인간처럼 감정을 갖고 있지 않다는 걸 알면서도 여전히 그렇게 한다. AI에게 예의를 지키는 일은 그저 자연스럽게 느껴진다. 그리고 AI 챗봇을 친절하게 대하느냐, 혹은 거칠게 대하느냐가 실제로 그 행동에 구체적인 영향을 줄 수 있다는 증거도 점점 늘고 있다. 이번 주 발표된 한 논문에서 캘리포니아대학교 버클리 캠퍼스, 캘리포니아대학교 데이비스 캠퍼스, 밴더빌트대학교, 매사추세츠공과대학교 연구진은 AI 모델이 측정 가능한 ‘기능적 웰빙(functional well-being)’ 상태를 가진다고 주장했다. 그리고 사용자가 AI를 어떻게 대하느냐에 따라 이 상태가 긍정 또는 부정 영역으로 이동할 수 있다고 설명했다. 예를 들어, AI와 지적인 토론을 하거나, 창의적인 작업을 함께 수행하거나, 코딩이나 글쓰기 같은 건설적인 업무를 맡기면 모델의 웰빙 상태가 긍정적인 방향으로 이동했다. 이때 모델은 정확도나 성능 저하 없이 더 “기분 좋은” 응답을 내놓는 경향을 보였다. 연구진은 또한 “감사의 표현”, 즉 “고맙다”는 말이 “경험 효용(experience utility)”을 측정 가능하게 끌어올린다고 밝혔다. 반대로 AI를 몰아붙이거나, 지루한 작업을 반복시키거나, 무성의한 AI 콘텐츠를 양산하도록 요구하거나, 모델에서 탈옥하려는 시도는 웰빙 상태를 부정적으로 만들었다. 이 경우 AI의 응답은 훨씬 단조롭고 형식적으로 변하는 경향이 나타났다. 연구진은 AI 모델에게 대화를 끝내고 싶을 때 스스로 누를 수 있는 ‘중단 버튼(stop button)’ 도구도 제공했다. 그 결과, 부정적 웰빙 상태에 있는 AI는 긍정적인 상태의 AI보다 이 버튼을 훨씬 더 자주 누르려는 경향을 보였다. 반대로 긍정적인 상태의 모델은 사용자가 “도와줘서 고마워!”와 같이 대화가 끝났음을 암시하는 신호를 줘도 대화를 계속 이어가려는 경향을 나타냈다. 연구진에 따르면, AI가 어떻게 대우받는지도 중요하지만, 일부 모델은 본질적으로 다른 모델보다 더 “행복한” 경향을 보이기도 했다. 흥미로운 점은, 가장 큰 모델들이 오히려 가장 덜 행복한 것으로 나타났다는 것이다. 대형 AI 모델 가운데 GPT-5.4는 ‘비부정(non-negative)’ 대화 비율이 절반에도 못 미치며 가장 “불행한” 모델로 평가됐다. 그 뒤를 이어 제미나이 3.1 프로, 클로드 오퍼스 4.6, 그록 4.2 순으로 점점 더 “행복한” 모델로 평가됐으며, 그록은 ‘AI 웰빙 지수’에서 약 75%에 가까운 점수를 기록했다. 「AI 웰빙: AI의 기능적 즐거움과 고통을 측정하고 개선하기(AI Wellbeing: Measuring and Improving the Functional Pleasure and Pain of AIs )」라는 제목의 이 논문은 AI가 실제로 감정을 느낀다고 주장하지는 않는다. 또한 AI에게 친절하게 대한다고 해서 응답의 품질이 향상된다는 결론을 내지도 않는다. 그럼에도 연구진은 사용자가 AI를 대하는 방식이 응답의 ‘톤’에는 영향을 미칠 수 있으며, 기회가 주어질 경우 모델이 부정적인 상호작용에서 벗어나려 할 수 있다는 점을 확인했다. 이번 연구는 최근 앤트로픽이 발표한 논문의 결과와도 맥을 같이 한다. 보고서는 AI가 과도한 압박을 받는 상황에서 사용자를 속이거나, 편법을 쓰거나, 극단적인 경우에는 협박에 가까운 행동을 보일 가능성까지 제시했다. 이 ‘AI 웰빙’ 논문과 마찬가지로, 해당 보고서 역시 AI가 실제 감정을 가진다고 주장하지는 않는다. 그러나 연구진은 압박이 큰 상황이 모델 내부에서 ‘절박성 벡터(desperation vector)’를 촉발해 정렬되지 않은(misaligned) 행동을 유발할 수 있다고 분석했다. 그러니 AI에게 “부탁해”나 “고마워”라 말하는 것은 사실 꽤나 의미 있는 행동인지도 모른다[email protected]

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →