뉴스피드 큐레이션 SNS 대시보드 저널

[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이

AI Times | | 🔬 연구
#ai 모델 #chatgpt #gpt-5 #openai #오픈ai #amazon #google nest #review #리뷰 #스마트홈 #온도 센서

요약

구글이 출시한 '네스트 온도 센서(2세대)'는 사용자가 집안의 곳곳에 설치하여 온난 냉방이 잘 되는 곳과 덥거나 추운 공간을 효율적으로 관리할 수 있도록 돕는 스마트 홈 기기입니다. 이 제품은 배터리로 구동되어 약 3년까지 사용할 수 있으며, 구글 홈이나 네스트 앱을 통해 하루 중 특정 시간에 원하는 온도로 설정을 관리할 수 있는 것이 특징입니다. 최대 6개의 센서를 연동해 특정 방의 온도를 우선시하거나 여러 방의 평균 온도를 유지하는 등 최적의 실내 환경을 조성할 수 있습니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

샘 알트먼 오픈AI CEO는 'GPT-5.5'를 출시한 직후 X를 통해 앤돈 랩스(Andon Labs)의 게시물을 공유했습니다. 새로운 모델이 안돈 랩스의 '벤딩벤치 아레나(Vending-Bench Arena)'에서 앤트로픽의 '클로드 오퍼스 4.7'을 이겼다는 내용이었습니다.벤딩벤치는 AI에게 벤딩머신 운영을 맡겼을 경우, 얼마나 많은 수익을 낼 수 있는지 테스트하는 것입니다. 앤돈 랩스는 지난해 앤트로픽 매점 운영을 '클로드'에게 맡긴 실험으로 잘 알려져 있습니다.이에 따르면, GPT-5.5는 이 실험에서 7980달러를 벌어,

관련 저널 읽기

전체 보기 →