클로드 성능 왜 갑자기 떨어졌나…앤스로픽 “모델 아닌 시스템 문제였다” - kmjournal.net
[AI] 클로드
|
|
📰 뉴스
#ai 모델
#기술 뉴스
#성능 저하
#앤스로픽
#클로드
#sk하이닉스
#기타 ai
#매장 안내
#메이커 운동
#클로봇
원문 출처: [AI] 클로드 · Genesis Park에서 요약 및 분석
요약
앤스로픽은 최근 ‘클로드 오퍼스 4.7’을 둘러싼 성능 저하 논란과 관련해, 모델 자체가 아니라 서비스 운영 과정의 설정 변경과 버그가 원인이라고 밝혔습니다. 회사는 성능을 의도적으로 낮춘 사실이 없으며 API나 추론 엔진에는 문제가 없었고, 모델을 감싸는 운영 레이어에서 문제가 발생했다고 해명했습니다. 이전까지 개발자 커뮤니티에서는 추론 능력 약화와 환각 증가 등을 이유로 성능이 의도적으로 조정된 것 아니냐는 의혹이 제기되었던 바 있습니다.
본문
앤스로픽이 최근 불거진 ‘클로드 성능 저하’ 논란에 대해 공식적으로 원인을 공개했다. 핵심은 모델 자체가 아니라, 서비스 운영 과정에서 적용된 설정 변경과 버그였다. 앤스로픽은 23일 발표한 기술 보고서에서 “모델 성능을 의도적으로 낮춘 사실은 없다”고 밝혔다. API나 추론 엔진 자체에는 문제가 없었고, 성능 변화는 모델을 감싸는 운영 레이어에서 발생했다는 설명이다. 이번 논란은 최신 모델 ‘클로드 오퍼스 4.7’ 출시 이후 개발자 커뮤니티를 중심으로 확산됐다. 이전보다 추론이 얕아졌고, 환각이 늘었으며, 복잡한 문제를 다루는 능력이 떨어졌다는 지적이 이어졌다. 깃허브와 X, 레딧 등에서는 “복잡한 작업보다 단순한 해결을 택하는 경향이 강해졌다”는 반응이 많았다. 일부 벤치마크에서는 정확도가 크게 하락했다는 분석도 나오면서, 성능이 의도적으로 조정된 것 아니냐는 의혹까지 제기됐다. 설정 변경과 버그가 겹치며 성능 영향 앤스로픽은 성능 저하의 원인을 세 가지로 설명했다. 모두 모델 내부가 아니라 운영 과정에서 발생한 변화다. 먼저 기본 추론 강도 설정이다. 3월 초 UI 지연 문제를 줄이기 위해 기본 추론 수준을 ‘높음’에서 ‘중간’으로 낮췄는데, 이로 인해 복잡한 작업에서 성능이 떨어졌다. 이 설정은 소네트 4.6과 오퍼스 4.6에 적용됐다. 이어 캐싱 로직에서 문제가 발생했다. 3월 말 최적화 과정에서 ‘사고 기록’이 유지되지 않고 요청마다 초기화되는 오류가 생겼다. 이 때문에 모델이 이전 맥락을 제대로 활용하지 못하고 반복적인 답변을 내놓는 상황이 발생했다. 응답 길이 제한도 영향을 줬다. 4월 중순 도입된 정책으로 도구 호출 사이 텍스트를 25단어, 최종 응답을 100단어로 제한하면서 특히 코딩 성능이 일부 저하됐다. 이 정책은 오퍼스 4.7까지 포함해 여러 모델에 적용됐다. 현재는 모두 수정…운영 방식도 손본다 앤스로픽은 해당 문제들을 모두 수정했다고 밝혔다. 추론 강도 설정과 응답 길이 제한은 원래대로 되돌렸고, 캐싱 버그도 최신 버전에서 해결했다. 유료 사용자에 대해서는 사용 한도를 초기화하는 보상 조치도 시행했다. 앞으로는 운영 과정에서 발생하는 변수를 줄이기 위한 개선이 진행된다. 내부 직원이 실제 사용자 환경에서 모델을 사용하는 테스트를 확대하고, 프롬프트 변경이 성능에 미치는 영향을 사전에 검증하는 시스템도 강화할 계획이다. 또 제품 변경 이력을 보다 체계적으로 관리하고, 개발자 커뮤니티와의 소통도 확대한다는 방침이다. X와 깃허브를 통해 기술적 변경 배경을 지속적으로 공개하겠다는 입장이다. 앤스로픽은 “사용자 기대에 미치지 못한 점을 인정한다”며 성능 안정화와 신뢰 회복에 집중하겠다고 밝혔다. 신주백 기자 [email protected]
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유