뉴스피드 큐레이션 SNS 대시보드 저널
주간 AI 트렌드 Journalism

물리적 지능의 신뢰도 99% 달성…구글·제너럴리스트, 가상과 현실의 경관을 뒤흔들다

물리적 지능의 신뢰도 99% 달성…구글·제너럴리스트, 가상과 현실의 경관을 뒤흔들다

로봇이 접이식 상자를 접는 단순 작업에서 99%라는 압도적인 신뢰도를 기록하며 인간 수준의 물리적 지능을 입증한 가운데, 생성형 AI 패러다임이 텍스트와 이미지 생성을 넘어 현실 세계의 노동을 대체하는 본격적인 '에이전트 단계'로 진입했다. 4월 첫 주, AI 업계는 구글 딥마인드의 가상 세계 제어 기술과 제너럴리스트의 정교한 로봇 제어 기술을 통해 AI가 단순히 정보를 생산하는 도구가 아니라 물리적 환경을 직접 조작하고 개척하는 존재로 진화했음을 보여주었다. 이번 주 일지는 AI의 물리적 적용 가능성이 획기적으로 개선된 기술적 돌파구와, 이를 지원하는 하드웨어 및 소프트웨어 생태계의 변화를 집중 조명한다.

물리적 세계 정복, 로봇의 눈과 손이 깨어나다

로봇 공학이 오랫동안 직면해온 낮은 작업 성공률이라는 난관이 대규모 데이터와 추론 능력의 결합으로 해소되고 있다. 로봇 머신러닝 스타트업 제너럴리스트가 공개한 'GEN-1' 모델은 상자 접기 등 정교한 작업에서 인간 수준의 99% 신뢰도를 달성해 업계를 놀라게 했다. 이 회사는 모델 훈련을 위해 인간의 미세한 움직임을 포착하는 웨어러블 도구인 '데이터 핸즈'를 활용해 50만 시간 이상의 상호작용 데이터를 확보했으며, 이를 통해 대규모 언어모델(LLM)의 스케일링 법칙을 로봇 공학에 성공적으로 적용했다.

"이 회사는 모델 훈련을 위해 인간의 미세한 움직임을 포착하는 웨어러블 집게 도구 '데이터 핸즈'를 활용해 50만 시간 이상의 상호작용 데이터를 확보했습니다." - Ars Technica

이러한 진전은 AI가 더 이상 실험실의 가상 존재가 아니라는 사실을 명확히 한다. 하지만 완전한 자율성을 위해서는 여전히 막대한 비용과 데이터 훈련 시간이 필요하며, 복잡한 맥락을 이해하고 장기간 다단계 과제를 처리하는 데에는 기술적 한계가 여전히 존재한다는 지적도 제기된다. 이에 따라 현장 적용을 위해서는 안정성과 효율성을 극대화하는 추가적인 기술 고도화가 필요한 실정이다.

가상 세계 창조와 추론의 시너지

구글 딥마인드는 물리적 세계와 가상 세계를 아우르는 AGI(인공일반지능)의 기반을 동시에 확보했다. 차세대 AI 에이전트 'SIMA 2'는 단순 모방을 넘어 3D 가상 환경에서 고도화된 추론 능력을 바탕으로 목표를 해석하고 자율적으로 판단하는 모습을 보여주었다. 초기 버전 대비 장기 및 복합 과제 완수율을 31%에서 65%로 대폭 향상시킨 성과는 주목할 만하다.

반면 프로젝트 지니(Project Genie)는 텍스트나 손그림 입력만으로 실시간으로 상호작용 가능한 2D 가상 세계를 생성함으로써 AI의 훈련 환경을 혁신하고 있다. DeepMind 엔지니어가 복잡한 코딩 없이 AI 에이전트를 활용해 뉴욕 전체 지도를 제작한 사례는, 이 기술이 게임 산업을 넘어 미래의 콘텐츠 제작 파이프라인을 근본적으로 변화시킬 잠재력을 확인할 수 있다. 가상 공간에서의 훈련 데이터가 실제 로봇의 학습 효율을 비약적으로 높이는 선순환 구조가 형성되고 있는 셈이다.

프라이버시와 효율성을 잡는 온디바이스 경쟁

클라우드 의존도를 낮추고 개인정보 보호와 실시간성을 강화한 온디바이스 기술도 이번 주의 중요한 흐름이다. 구글이 iOS용으로 조용히 출시한 'AI Edge Eloquent' 앱은 기기 자체에서 정교한 음성 인식과 텍스트 요약이 가능함을 보여주었다. 사용자는 지메일 계정에서 키워드를 불러오거나 단어를 추가할 수 있으며, 클라우드 모드 시에는 추임새 제거와 문장 다듬기 기능을 활용할 수 있다.

하드웨어 측면에서도 프라이버시 강화가 움직임이다. 삼성전자는 차기 갤럭시 S27 라인업에 새로운 프리미엄 모델인 'S27 프로'를 추가하고, 화면 시야각을 제한해 주변의 시선을 차단하는 '프라이버시 디스플레이'를 탑재할 것으로 알려졌다. 엔비디아 역시 'DLSS 4.5 Dynamic Multi Frame Generation'을 지원하며 온디바이스 렌더링 성능을 극대화하는 데 주력하고 있다. 이는 고성능 AI 혜택을 누리면서도 개인 데이터를 기기 내에 보존하려는 사용자 요구와 하드웨어 경쟁이 맞물려 고도화되고 있음을 보여준다.

SaaS를 통한 AI 상용화 가속화

기술의 접근성을 높이는 상용화 노력도 가속화되고 있다. 한국딥러닝이 문서 AI 솔루션 'DEEP Agent'의 SaaS 버전을 출시한 것이 대표적이다. 인프라 구축 없이 바로 적용 가능한 구독형 서비스로, 여러 문서를 동시에 처리하는 워크스페이스 구조와 VLM 기반 추출 기능을 갖추고 있다. 회사는 이번 출시를 기념해 4월 한정 가입 시 무료 크레딧을 제공하는 프로모션을 진행하며 기업 도입을 유도하고 있다.

이처럼 AI 모델의 성능이 인간 수준에 근접함에 따라, 이를 실제 산업 현장에 배포하기 위한 인프라와 솔루션 경쟁이 치열해지고 있다. 온프레미스 방식과 병행 제공되며 다국어 지원과 ERP 연계가 가능해지면서, AI의 실질적인 업무 생산성 기여도가 점검될 시기이다.

시장 신호 및 다음 주 전망

  • 시장 신호: 물리적 AI의 신뢰성이 99% 수준으로 끌어올려지면서 제조 및 물류 자동화에 대한 기대감이 커지고 있다. 프라이버시를 강조한 온디바이스 AI 기능들이 스마트폰과 앱 형태로 출시되며, 개인용 AI 시장의 경쟁이 하드웨어 스펙 beyond 소프트웨어 생태계로 확장되고 있다.
  • 다음 주 전망: 삼성전자의 신제품 라인업 관련 루머가 구체화됨에 따라, 프라이버시 기술이 실제 제품군에서 어떻게 차별화 요소로 작용할지 주목된다. 또한 4월 한정 프로모션을 진행하는 AI 솔루션 업체들의 시장 반응이 향후 SaaS 시장의 성장성을 가늠하는 중요한 지표가 될 것으로 보인다.

참고 출처

  • Ars Technica - "접이식 상자부터 진공청소기 고정까지, GEN-1 로봇 모델은 99%의 신뢰성을 달성했습니다."
  • TechCrunch - "구글, iOS에 오프라인 우선 AI 받아쓰기 앱 조용히 출시"
  • The Verge - "삼성 갤럭시 S27 '프로', 울트라와 플러스 폰 사이에 끼어들 수도 있다"
  • 톱스타뉴스 - "구글 딥마인드 SIMA 2, 3D 가상세계서 인간형 추론 성능 구현하며 AGI 향해..."
  • kmjournal.net - "구글 딥마인드, 실시간으로 세계를 건설하는 AI 프로젝트 지니 공개"
  • 네이버 프리미엄콘텐츠 - "코드를 쓰지 않고 뉴욕 전체 지도를 만들다. DeepMind 엔지니어가 보여준 에이전트 기반 월드 빌딩"
  • NVIDIA 공시 - "DLSS 4.5 Dynamic Multi Frame Generation 및 Multi Frame Generation 6X 지금 이용 가능"
  • FA저널 - "한국딥러닝, 문서 AI 솔루션 ’DEEP Agent’ SaaS 버전 출시"

출처 기사