사람처럼 보고 판단…구글, 로봇용 AI 모델 '제미나이 로보틱스 ER 1.6' 공개 - 디지털투데이

[AI] ai robotics | | {'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} 기타 AI
#ai 반도체 #블랙웰 울트라 #엔비디아 #추론 효율 #하드웨어/반도체 #ai #gpt-5 #구글 #머신러닝/연구 #메타

요약

사용자가 뉴스 기사를 읽고 2-4문장으로 요약해달라고 요청했다. 규칙은 다음과 같다: 1. 반드시 한국어로 작성 2. 제목을 그대로 복사하지 말 것 3. 본문의 구체적 사실, 수치, 맥락을 포함할 것 4. 80자 이상 작성할 것 본문을 분석해보자: - 구글의 새 로봇 전용 AI 모델: '제미나이 로보틱스 ER 1.6' - 이전 세대(ER 1.5)보다 공간적·물리적 추론 성능 강화 - 물체 감지 정확도 향상 - 물체 개수 세기, 가장 적은 물체 찾기, 특정 컵 안에 들어갈 만큼 작은 물체 찾기 - 아날로그 계기판 판독 기능 - 압력계 읽기, 에이전틱 비전 적용 - 안전 제약 준수 능력 개선 - 액체 다루지 않기, 20kg 이상 물체 들지 않기 - 다중 시점 추론 기능 강화 - 여러 카메라 영상 해석 - 보스턴 다이내믹스와 협력 구글은 물리 세계에 대한 추론이 로봇의 활용 범위를 넓히는 핵심 요소라고 강조했다. 현재 지시를 따르는 수준을 넘어 일상과 산업 현장에서 유용하게 활용되기 위해서는 복잡한 시설 내 이동과 압력계 판독 같은 구체적인 능력이 필수적다는 입장이다. 구글이 로봇 전용 AI 모델 '제미나이 로보틱스 ER 1.6'을 공개했다. 이전 세대보다 공간적·물리적 추론 성능이 크게 향상되어 물체 개수 세기, 특정 컵에 들어갈 만큼 작은 물체 찾기, 아날로그 계기판 판독 등이 가능해졌다. 특히 에이전틱 비전 기술로 압력계 바늘 읽기 성능이 개선됐으며, 액체 취급 자제, 20kg 이상 물체 들지 않기 등 물리적 안전 제약 준수 능력도 강화됐다. 구글은 로봇이 일상과 산업 현장에서 유용해지려면 단순 지시服从를 넘어 물리 세계를 이해하는 능력이 필수라며 다중 카메라 영상 해석 등 복합 추론 기능 확장에 집중하고 있다.

왜 중요한가

본문

[디지털투데이 홍진주 기자] 구글이 시각, 공간 인식 및 물리 추론 능력을 강화한 로봇 전용 인공지능(AI) 모델 '제미나이 로보틱스 ER 1.6'을 공개했다. 15일(현지시간) 온라인 매체 기가진에 따르면 새 모델은 주변 상황을 이해하고 검색 도구까지 호출해 작업을 수행할 수 있도록 설계됐다. 이번 모델의 핵심은 로봇이 단순히 지시를 따르는 수준을 넘어 물리 환경을 스스로 해석하는 능력을 끌어올렸다는 점이다. 제미나이 로보틱스 ER 1.6은 이전 세대보다 공간적·물리적 추론 성능이 강화됐다. 물체 감지 정확도도 높아져 물체 개수를 세거나, 보이는 대상 가운데 가장 적은 물체를 가려내고, 특정 컵 안에 들어갈 만큼 작은 물체를 모두 찾는 식의 복합 지시도 처리할 수 있다. 공간 상태를 판단하는 기능도 포함됐다. 문이 열려 있는지 같은 상황을 추론할 수 있고, 작업 수행 과정에서 구글 검색을 기본 도구처럼 호출해 필요한 정보를 찾는다. 여기에 시각·언어·행동 모델과 외부에서 정의한 함수도 함께 활용할 수 있다. 로봇이 외부 정보와 자체 인식을 결합해 행동하는 구조다. 새롭게 추가된 기능 가운데 눈에 띄는 부분은 아날로그 계기판 판독이다. 제미나이 로보틱스 ER 1.6은 시각 정보를 바탕으로 압력계 같은 아날로그 계기를 읽을 수 있다. 특히 이미지를 확대해 비율과 간격을 추정하는 '에이전틱 비전'을 적용해 이전 모델인 제미나이 로보틱스 ER 1.5보다 계기 해독 성능이 크게 향상됐다고 구글은 밝혔다. 이 기능은 구글과 협력 중인 보스턴 다이내믹스의 요구에서 출발했다. 안전 제약을 지키는 능력도 개선됐다. 새 모델은 액체를 다루지 않거나 20kg이 넘는 물체를 들지 않는 식의 물리적 안전 제약을 더 잘 준수하도록 설계됐다. 주변의 위험 요소를 식별하는 능력도 높아졌다. 로봇이 작업 수행 과정에서 단순한 성공률뿐 아니라 행동 제한 조건까지 함께 반영하도록 한 것이다. 여러 대의 카메라 영상을 함께 해석하는 다중 시점 추론 기능도 강화됐다. 제미나이 로보틱스 ER 1.6은 복수의 카메라가 포착한 장면 사이 관계를 더 정확히 이해할 수 있도록 개선됐다. 이에 따라 복잡한 공간에서 위치와 대상의 관계를 파악하는 작업 범위가 넓어질 것으로 보인다. 구글은 로봇의 활용 범위를 넓히려면 물리 세계에 대한 추론이 필수적이라고 강조했다. 로봇이 일상생활과 산업 현장에서 진정으로 유용해지기 위해서는 지시를 따르는 것만으로는 부족하기 때문에 물리 세계를 이해하는 능력이 필요하다는 입장이다. 또 복잡한 시설 내부를 이동하거나 압력계 바늘을 읽는 일까지, 로봇의 감각과 결합된 추론 능력이 디지털 세계와 물리 세계 사이 간극을 메운다고 설명했다.

관련 저널 읽기

전체 보기 →