뉴스피드 큐레이션 SNS 대시보드 저널

앤트로픽 "클로드 성능 저하는 '하네스' 때문...의도적으로 낮춘 적 없어" - AI타임스

[AI] 앤트로픽 | | 📰 뉴스
#gemini 2.5 flash #google #전자책 #퀵레퍼런스 #하이브리드 추론

요약

앤트로픽은 개발자 커뮤니티에서 제기된 클로드의 성능 저하 논란과 관련해, 모델 자체가 아닌 UI 지연 문제 해결을 위해 기본 추론 수준을 조정한 시스템 레이어인 ‘하네스’ 변경이 원인임을 인정했습니다. 회사는 성능 의도적 저하 의혹을 부인하며 모델과 API 계층에는 문제가 없다고 밝혔으나, 일부 테스트에서 정확도가 80%대에서 60%대로 떨어지는 등 복잡한 작업 해결 능력이 악화된 것으로 확인되었습니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

앤트로픽이 최근 개발자 커뮤니티에서 제기된 '클로드 성능 저하' 논란과 관련해 공식적으로 문제를 인정하고 원인과 해결책을 공개했다. 앤트로픽은 23일(현지시간) 공식 기술 보고서를 통해 이번 AI 성능 저하 문제의 원인이 모델 자체가 아니라 이를 둘러싼 제품 레이어’ 이른바 ‘하네스(harness)’ 변경에서 비롯됐다고 밝혔다. 먼저 “모델 성능을 의도적으로 낮춘 적은 없다”라며, API와 추론(inference) 계층에는 문제가 없었다고 강조했다. 이번 논란은 최신 모델인 '클로드 오퍼스 4.7' 출시 이후 불거졌다. 이전보다 추론 능력이 떨어지고 환각이 늘어났으며 토큰 사용 효율도 악화했다는 사용자들의 지적이 이어졌다. 깃허브와 X, 레딧 등에서는 이 모델이 과거보다 복잡한 문제를 깊이 있게 해결하지 못하고, 단순한 수정 위주의 답변을 내놓는 경향이 강해졌다고 주장이 이어졌다. 특히 일부 사용자들은 클로드가 장기적인 추론 대신 ‘가장 쉬운 해결책’을 선택하는 경향이 늘었다고 지적하며, 엔지니어링 작업에서 신뢰도가 낮아졌다고 평가했다. 이는 외부 벤치마크 결과와 맞물리며 더 커졌다. 일부 테스트에서는 모델의 정확도가 80%대에서 60%대로 하락했다는 분석이 나왔는데, 여기에 트래픽 증가까지 맞물리며 "앤트로픽이 의도적으로 모델 성능을 낮춘 것이 아니냐”는 의혹까지 제기됐다. 앤트로픽은 문제의 핵심 요인으로 3가지를 지목했다. 첫째, 기본 추론 강도 설정 변경이다. 지난 3월4일 UI 지연 문제를 해결하기 위해 기본 추론 수준을 ‘높음’에서 ‘중간’으로 낮췄는데, 이로 인해 복잡한 작업에서 성능 저하가 발생했다. 이 변경 사항은 '소네트 4.6'과 '오퍼스 4.6'에 영향을 미쳤다. 둘째, 캐싱 로직 버그다. 3월26일 적용된 최적화 과정에서 오류가 발생해, 일정 시간 이후 한번만 초기화돼야 할 ‘사고 기록(thinking history)’이 요청마다 삭제됐다. 이 때문에 모델이 단기 기억을 잃고 반복적이거나 맥락을 놓치는 문제가 나타났다는 설명이다. 이 변경 사항은 소네트 4.6과 오퍼스 4.6에 영향을 미쳤다. 마지막으로는 응답 길이 제한을 들었다. 4월16일 도입된 프롬프트 정책으로 도구 호출 사이 텍스트를 25단어, 최종 응답을 100단어로 제한했는데, 이로 인해 코딩 성능이 약 3% 하락하는 등 품질 저하가 발생했다. 이 변경 사항은 소네트 4.6, 오퍼스 4.6, 오퍼스 4.7에 영향을 미쳤다. 앤트로픽은 현재 문제들을 모두 수정했다고 밝혔다. 추론 강도 설정과 응답 길이 제한을 원상 복구하고, 캐싱 버그는 최신 버전에서 해결했다. 또 이번 문제로 인해 발생한 불편을 보상하기 위해 모든 유료 사용자에 대해 사용 한도를 초기화하는 조치를 시행했다. 앤트로픽은 앞으로 유사한 문제를 방지하기 위해 운영 체계를 강화할 계획이다. 우선 내부 직원들이 실제 사용자와 동일한 환경에서 모델을 사용하는 ‘도그푸딩(dogfooding)’을 확대해 문제를 조기에 발견할 수 있도록 한다. 또 프롬프트 변경이 모델 성능에 미치는 영향을 정밀하게 검증하는 평가 시스템을 강화하고, 변경 사항을 추적·관리하는 도구도 개선할 예정이다. Thanks to the entire Claude community for giving feedback and continuing to build with us. Read the full post-mortem here: https://t.co/a8xZ5iFos0 — ClaudeDevs (@ClaudeDevs) April 23, 2026 또 개발자 커뮤니티와의 소통을 강화하기 위해 X와 깃허브를 통해 제품 변경 배경과 기술적 의사결정을 더욱 투명하게 공개하겠다고 밝혔다. 앤트로픽은 “사용자들이 기대하는 수준의 성능을 제공하지 못한 점을 인정한다”라며, 신뢰 회복에 집중하겠다고 밝혔다. 박찬 기자 [email protected]

관련 저널 읽기

전체 보기 →