월 100달러 내도 금세 제한…앤트로픽 '클로드 코드' 한도 산정 논란 - 네이트
[AI] 클로드
|
|
{'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} 기타 AI
#ai 모델
#방산업체
#앤트로픽
#앱스토어 1위
#클로드
#ai 딜
#anthropic
#claude
요약
앤트로픽의 유료 AI 챗봇 '클로드'에서 월 100달러의 고가 요금제를 이용하더라도 일반적인 사용에도 불구하고 사용량 제한에 빨리 걸린다는 이용자 불만이 제기되었습니다. 특히 백그라운드 세션의 캐시 읽기가 저렴한 비용으로 계산됨에도 불구하고, 사용량 한도 산정에는 원본 크기 그대로 반영돼 한도가 금방 소진된다는 지적입니다. 이에 대해 개발팀은 기본 컨텍스트 윈도를 축소하거나 백그라운드 작업을 정리하는 등의 대응 방안을 검토하겠다고 밝혔습니다.
왜 중요한가
본문
[디지털투데이 이윤서 기자] 앤트로픽의 인공지능(AI) 챗봇 '클로드'(Claude)가 사용량 제한을 내건 가운데, 일반적인 사용량에도 불구하고 금세 제한에 걸린다는 이용자 보고가 나왔다. 14일(현지시간) 온라인 매체 기가진에 따르면 월 100달러(약 15만원) 수준의 '맥스 5x' 요금제를 쓰는 한 이용자는 깃허브 이슈를 통해 "1시간 30분 만에 한도가 소진돼 사실상 업무에 쓰기 어려웠다"고 문제를 제기했다. 클로드는 5시간을 한 구간으로 사용량을 관리한다. 이 구간 안에서 일정 사용량에 도달하면 처음 사용을 시작한 시점부터 5시간이 지날 때까지 추가 이용이 제한된다. 문제가 제기된 요금제는 월 20달러(약 3만원) '프로'(Pro) 요금제보다 사용 한도가 5배 높은 상품이다. 해당 이용자는 문제 당일 15시부터 20시까지 집중적으로 개발 작업을 진행했다. 이 5시간 동안 API 호출은 2715회 이뤄졌고, 최대 컨텍스트 길이는 약 97만토큰까지 올라갔다. 컨텍스트 자동 요약 기능도 2차례 동작했다. 이용자도 이 정도의 고강도 사용 뒤 제한이 걸리는 점 자체는 수용할 수 있다고 밝혔다. 쟁점은 그 이후였다. 이용자는 20시 이후 가벼운 개발 작업과 질의응답처럼 일반적인 방식으로 클로드를 사용했는데도 1시간 30분 만에 다시 사용량 제한에 도달했다고 했다. 이용자는 원인을 분석하는 과정에서 백그라운드에 열린 채 남아 있던 클로드 세션이 대량의 캐시 읽기를 수행한 정황을 확인했다고 밝혔다. 이용자는 비용 계산상 캐시 입력은 일반 입력의 10분의 1 수준으로 처리되는데, 실제 사용량 제한은 그렇게 반영되지 않았을 가능성을 제기했다. 캐시 입력이 한도 계산에서는 10분의 1이 아니라 원래 양 그대로 잡히는 것 아니냐는 주장이다. 문제 제기는 클로드가 앞세운 대규모 컨텍스트 전략과도 맞물린다. 클로드 코드는 유료 이용자에게 최대 100만토큰의 컨텍스트 윈도를 제공한다. 한 번에 더 많은 정보를 처리할 수 있다는 점이 강점으로 제시됐지만, 이용자는 "캐시 읽기가 전체 속도로 계산된다면, 컨텍스트 윈도가 넓을수록 API 호출당 입력 토큰 수가 늘어나 사용량 제한에 더 쉽게 도달하게 되는 것이 아니냐"고 지적했다. 즉, 100만토큰 지원이 장점이 아니라 오히려 한도 소진을 앞당길 수 있다는 주장이다. 이용자는 또 "백그라운드에서 열려 있을 뿐, 사용자가 조작하지 않는 유휴 세션이 대량의 API를 사용해서는 안 된다"고도 주장했다. 실제 작업과 무관한 세션 활동이 한도 소진을 부추긴다면 요금제 체감 가치가 크게 떨어질 수 있기 때문이다. 클로드 코드 개발팀도 대응에 나섰다. 한 담당자는 대응책으로 '기본 컨텍스트 윈도를 더 좁히는 방안'과 '백그라운드 작업 정리에 더 적극적으로 나서는 방안' 등을 검토하겠다고 밝혔다. 사용량 계산 구조 자체를 인정한 것은 아니지만, 문제를 줄이기 위한 조치에는 착수한 셈이다. 이러한 문제는 앤트로픽의 서비스 운영 상황과도 맞닿아 있다. 앤트로픽은 최근 3개월 사이 매출이 3배 이상 늘어날 정도로 빠르게 성장 중이지만, 단기적으로는 연산 자원이 부족한 상태로 거론되고 있다. 회사는 부하 대응을 위해 사용량 제한을 더 엄격하게 하겠다고 밝힌 바 있다. 이에 따라 이용자 사이에서는 최근 클로드의 응답 품질이 눈에 띄게 떨어졌다는 반응과 함께, 캐시 유효기간이 짧아져 사용량 소모가 커졌다는 지적도 이어지고 있다. 이번 논란은 고성능 AI 서비스를 둘러싼 연산 자원 제약과 요금제 설계, 실제 체감 사용성 사이의 간극을 다시 드러낸 사례로 보인다.