[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이
AI Times
|
|
🔬 연구
#ai 모델
#chatgpt
#gpt-5
#openai
#오픈ai
#amazon
#google nest
#review
#리뷰
#스마트홈
#온도 센서
요약
구글이 출시한 '네스트 온도 센서(2세대)'는 사용자가 집안의 곳곳에 설치하여 온난 냉방이 잘 되는 곳과 덥거나 추운 공간을 효율적으로 관리할 수 있도록 돕는 스마트 홈 기기입니다. 이 제품은 배터리로 구동되어 약 3년까지 사용할 수 있으며, 구글 홈이나 네스트 앱을 통해 하루 중 특정 시간에 원하는 온도로 설정을 관리할 수 있는 것이 특징입니다. 최대 6개의 센서를 연동해 특정 방의 온도를 우선시하거나 여러 방의 평균 온도를 유지하는 등 최적의 실내 환경을 조성할 수 있습니다.
왜 중요한가
개발자 관점
검토중입니다
연구자 관점
검토중입니다
비즈니스 관점
검토중입니다
본문
샘 알트먼 오픈AI CEO는 'GPT-5.5'를 출시한 직후 X를 통해 앤돈 랩스(Andon Labs)의 게시물을 공유했습니다. 새로운 모델이 안돈 랩스의 '벤딩벤치 아레나(Vending-Bench Arena)'에서 앤트로픽의 '클로드 오퍼스 4.7'을 이겼다는 내용이었습니다.벤딩벤치는 AI에게 벤딩머신 운영을 맡겼을 경우, 얼마나 많은 수익을 낼 수 있는지 테스트하는 것입니다. 앤돈 랩스는 지난해 앤트로픽 매점 운영을 '클로드'에게 맡긴 실험으로 잘 알려져 있습니다.이에 따르면, GPT-5.5는 이 실험에서 7980달러를 벌어,