엔비디아·구글 클라우드, AI 협력 확대…새 인프라·서비스 공개 - 디지털투데이

[AI] 베라 루빈 | 2026년 4월 24일 11:24 | 🏷️ AI 딜

#ai #구글 클라우드 #엔비디아 #인프라 #협력 #5070ti #7800x3d #ai 딜 #cyberpowerpc #pc 조립 #pc할인 #rtx 5070 ti #게이밍 pc #바이오하자드 #사이버파워 #할인 코드

요약

엔비디아와 구글 클라우드가 차세대 에이전트형 AI 개발을 위해 엔비디아 ‘베라 루빈’ 기반의 베어메탈 인스턴스 A5X를 도입하여 초대형 인프라를 구축한다고 밝혔습니다. 기업이 자원을 독점하는 A5X는 최대 96만기의 GPU를 확장할 수 있어 대규모 AI 학습과 추론에 최적화되었습니다. 이번 인프라는 이전 세대 대비 토큰당 추론 비용을 10분의 1로 낮추고 전력 효율을 10배 높여 기업의 비용 절감과 성능 향상을 도모할 것입니다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

[디지털투데이 홍진주 기자] 엔비디아와 구글 클라우드가 차세대 에이전트형 AI와 피지컬 AI를 겨냥한 초대형 인프라 구축에 나선다. 23일(현지시간) 온라인 매체 기가진에 따르면, 양사는 구글 클라우드 AI 하이퍼컴퓨터를 확장해 엔비디아 ‘베라 루빈’(Vera Rubin) 기반의 A5X 베어메탈 인스턴스를 기업에 제공할 계획이다. A5X는 엔비디아 베라 루빈 NVL72 랙스케일 시스템을 적용한 전용 물리 서버 형태다. 여러 사용자가 나눠 쓰는 가상 서버와 달리 단일 기업이 자원을 독점적으로 사용하는 구조로, 대규모 AI 학습·추론과 고성능 시뮬레이션에 최적화됐다. 핵심은 확장성이다. A5X는 단일 사이트 기준 최대 8만기, 멀티사이트 클러스터에서는 최대 96만기 규모의 루빈 GPU까지 확장이 가능하다. 이를 위해 엔비디아 커넥트X-9 슈퍼닉(ConnectX-9 SuperNIC)과 구글의 네트워크 기술을 결합해 초대형 AI 클러스터를 구성한다. 엔비디아는 이를 ‘AI 팩토리’ 수요를 겨냥한 인프라로 설명했다. 성능과 비용 지표도 함께 제시됐다. 엔비디아는 A5X가 이전 세대 대비 토큰당 추론 비용을 최대 10분의 1로 낮추고, 전력 대비 처리량은 최대 10배 높였다고 밝혔다. 기업 입장에서는 동일한 인프라로 더 많은 AI 작업을 수행하거나 비용을 크게 절감할 수 있다는 의미다. 양사는 이번 협업을 서버 공급에 그치지 않고 구글 클라우드의 AI 서비스 전반으로 확대하고 있다. 구글은 엔비디아 블랙웰과 블랙웰 울트라 GPU에서 구동하는 구글 분산형 클라우드 기반 '제미나이' 프리뷰를 준비하고 있으며, 엔비디아 블랙웰 GPU를 탑재한 기밀 가상머신도 함께 제공할 예정이다. 에이전트형 AI 분야에서는 엔비디아 네모트론(Nemotron)과 엔비디아 니모(NeMo) 프레임워크를 구글의 기업용 AI 플랫폼과 통합해, 멀티모달 추론과 대규모 데이터 처리, 로보틱스·피지컬 AI 시뮬레이션까지 지원한다. 이는 단순 생성형 AI를 넘어 산업용 AI 운영 환경 전반을 겨냥한 전략이다. 이번 협업은 AI 인프라 경쟁의 방향 변화를 보여준다. 개별 GPU 성능을 넘어 초대형 클러스터 구축, 전력 효율, 네트워크 통합, 그리고 기업용 AI 플랫폼 연동이 핵심 경쟁력으로 부상하고 있다. .@GoogleCloud and NVIDIA are expanding their partnership across agentic and physical AI. At #GoogleCloudNext, the companies made several announcements, including: ✅ NVIDIA Vera Rubin-powered A5X instances, scaling up to nearly 1M Rubin GPUs — NVIDIA (@nvidia) April 22, 2026 ✅ Gemini on Google Distributed… pic.twitter.com/5RxjUtfRJl

원문 보기 ([AI] 베라 루빈)

요약

왜 중요한가

본문

관련 저널 읽기