클로드 코드 품질 논란…앤트로픽 "3가지 변경 영향, 모두 수정" - IT타임스
[AI] anthropic ai
|
|
🔬 연구
#kospi
#경제
#반도체주
#주가급등
#ai 딜
#anthropic
#claude
#앤트로픽
#클로드 코드
요약
앤트로픽의 AI 모델 클로드를 둘러싼 코드 품질 논란과 관련해, 회사 측이 3가지 변경 사항의 영향을 인정하고 모두 수정했다고 밝혔습니다. 해당 조치는 사용자들에게 제기되었던 기술적 우려를 해소하고 모델의 신뢰성을 높이기 위해 취해진 것으로 알려졌습니다.
왜 중요한가
개발자 관점
검토중입니다
연구자 관점
검토중입니다
비즈니스 관점
검토중입니다
본문
추론 설정·메모리 버그 등 복합 원인 확인 시스템 프롬프트 변경 영향 성능 저하 미국 AI 기업 앤트로픽(Anthropic)은 자사 코딩용 AI 에이전트인 '클로드 코드(Claude Code)'의 최근 품질 저하 논란과 관련해 "서로 다른 3가지 변경이 동시에 영향을 주며 발생한 문제였다"고 공식 설명했다. 회사는 해당 문제를 모두 수정했으며, API와 추론(inference) 계층은 전혀 영향을 받지 않았다고 강조했다. 23일(현지시간) 앤트로픽에 따르면, 지난 한 달간 일부 사용자들로부터 "클로드의 응답 품질이 나빠졌다"는 보고가 이어졌고, 이에 대한 조사 결과 3개의 독립적인 변경 사항이 문제를 일으킨 것으로 확인됐다. 모든 문제는 4월 20일 기준 버전(v2.1.116)에서 해결됐다. ◆ 추론 강도 조정…"지능 vs 속도" 균형 논란 첫 번째 원인은 3월 4일 적용된 '추론 강도' 기본값 변경이었다. 당시 회사는 UI 지연 문제를 줄이기 위해 높음(high) 수준에서 중간(medium)으로 기본 설정을 낮췄다. 하지만 일부 사용자들은 "응답이 덜 똑똑해졌다"는 반응을 보였고, 결국 회사는 4월 7일 해당 결정을 철회했다. 이후 현재는 모델에 따라 오퍼스(Opus) 계열은 '매우 높음(xhigh)', 다른 모델은 '높음(high)'이 기본값으로 설정됐다. 앤트로픽은 "긴 추론은 품질을 높이지만 지연 시간이 늘어난다"며 "속도와 성능 사이 균형을 맞추려 했던 결정이 사용자 기대와 어긋났다"고 설명했다. ◆ 세션 메모리 버그…"기억 상실·반복 답변" 발생 두 번째 문제는 3월 26일 도입된 캐싱 최적화 과정에서 발생했다. 오래 비활성 상태였던 세션의 이전 추론 내용을 정리해 재접속 속도를 높이려던 기능이었지만, 코드 버그로 인해 모든 대화에서 지속적으로 이전 추론이 삭제되는 문제가 발생했다. 이로 인해 클로드는 작업 맥락을 잃고 반복적인 답변을 하거나 부정확한 도구 선택을 하는 현상이 나타났다. 또한 캐시 미스가 증가하면서 일부 사용자들은 사용량 제한이 더 빨리 소진되는 현상도 경험했다. 앤트로픽은 해당 문제를 4월 10일 수정했으며, "복잡한 컨텍스트 관리 로직과 API 간 상호작용에서 발생한 드문 케이스였다"고 설명했다. ◆ 시스템 프롬프트 변경…과도한 간결화로 성능 저하 세 번째 원인은 4월 16일 적용된 시스템 프롬프트 수정이었다. 당시 회사는 출력 길이를 줄이기 위해 "툴 간 메시지는 25단어 이하, 최종 응답은 100단어 이하"라는 제한을 추가했다. 그러나 이 조정은 모델의 문제 해결 능력에도 영향을 주며 코딩 성능을 저하시킨 것으로 나타났다. 내부 평가에서 약 3% 수준의 성능 저하가 확인됐고, 해당 변경은 4월 20일 즉시 철회됐다. 엔트로픽은 향후 유사 문제를 방지하기 위해 △내부 직원도 실제 사용자와 동일한 공개 버전 사용 확대 △코드 리뷰 도구 개선∙고객 배포 △시스템 프롬프트 변경 시 모델별 영향 평가 강화 △변경 전 충분한 테스트 기간 도입 △점진적 배포∙평가 기준 확대 △모델별 변경 사항을 명확히 제한하는 내부 가이드 강화 등의 개선책을 발표했다. 또한 "프롬프트 한 줄 변경도 성능에 큰 영향을 줄 수 있다"며 관련 검증 절차를 강화하겠다고 밝혔다. 한편 엔트로픽은 이번 문제 해결 과정에서 사용자 신고와 재현 사례가 결정적인 역할을 했다고 강조했다. 이에 대한 감사 차원에서 4월 23일 모든 구독자의 사용량 제한을 재설정했다. 엔트로픽 관계자는 "의도적인 성능 저하는 없었으며 문제는 모두 수정됐다"며 "더 안정적인 '클로드 코드' 경험을 제공하겠다"고 말했다. IT타임스 YoungHa Kim ([email protected])