HPE·엔비디아, AI 팩토리·슈퍼컴퓨팅 혁신 박차 - 데이터넷

[AI] suse ai factory | | {'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} 하드웨어/반도체
#ai 팩토리 #hpe #슈퍼컴퓨팅 #엔비디아 #혁신 #ai 칩 #피지컬 ai #하드웨어/반도체

요약

HPE는 엔비디아와 협력하여 차세대 AI 팩토리와 슈퍼컴퓨팅 포트폴리오를 강화하고, 최대 16개의 엔비디아 베라 CPU를 탑재한 액체 냉각 방식의 컴퓨트 블레이드 등을 선보였습니다. HPE 크레이 슈퍼컴퓨팅 GX5000 플랫폼에 엔비디아 기술을 결합해 HPC 워크로드와 AI 요구사항을 동시에 충족시키며, 아르곤 국립연구소와 KISTI 등 선도 기관들이 이를 도입해 혁신을 가속화하고 있습니다.

왜 중요한가

본문

엔비디아 베라 루빈·블랙웰 플랫폼 탑재 ‘HPE AI 팩토리’ 포트폴리오 강화 엔비디아 클라우드 프로바이더 인증 획득 준비 완료 [데이터넷] HPE는 고객이 AI를 보다 효율적으로 확장 및 배포하고, 인사이트 도출 시간을 단축할 수 있도록 대규모 AI 팩토리와 슈퍼컴퓨터를 위한 HPE 기반 엔비디아 AI 컴퓨팅 포트폴리오 혁신에 나섰다. 엔비디아와 협력으로 구축된 풀스택 AI 솔루션은 컴퓨트, GPU, 네트워킹, 액체 냉각, 소프트웨어, 서비스가 긴밀히 통합돼 대규모 환경 및 소버린 환경에 최적화됐다. 특히 아르곤 국립 연구소(Argonne National Laboratory), 독일 슈투트가르트 고성능 컴퓨팅 센터(HLRS), 허드슨 리버 트레이딩(HRT), 한국과학기술정보연구원(KISTI) 등 선도적인 연구 기관 및 AI 지향 기업들은 혁신 가속화를 위해 HPE의 AI 인프라와 엔비디아 기반 AI 팩토리를 채택했다. 연구소, 국가 기관 및 대기업들은 고성능컴퓨팅(HPC) 워크로드 강화를 위해 AI를 빠르게 도입하고 있다. 이에 HPE는 과학적 발견의 속도를 높이고자 하는 조직을 위해 AI와 HPC를 통합하도록 설계된 2세대 엑사스케일급 슈퍼컴퓨팅 플랫폼인 ‘HPE 크레이 슈퍼컴퓨팅 GX5000’에서 다양한 엔비디아 제품을 제공한다. 슈퍼컴퓨팅 플랫폼에 엔비디아 AI 솔루션 적용 HPE는 차세대 슈퍼컴퓨팅 솔루션 라인업에 액체 냉각 방식의 새로운 엔비디아 컴퓨트 블레이드 옵션을 추가했다. 각 ‘HPE 크레이 슈퍼컴퓨팅 GX240 컴퓨트 블레이드’는 최대 16개의 엔비디아 베라 CPU를 탑재하고 있으며, 까다로운 AI 컴퓨팅 워크로드를 지원하도록 설계됐다. GX240은 엔비디아 베라 플랫폼에서 업계 최고 수준의 집적도를 제공하며, 한 랙당 최대 40개의 블레이드와 640개의 엔비디아 베라 CPU, 5만6320개의 엔비디아 올림푸스 Arm 호환 코어를 탑재할 수 있도록 확장이 가능하다. 엔비디아 퀀텀-X800 인피니밴드를 포함해 대규모 시스템에 최적화된 다양한 네트워킹 옵션을 선택해 슈퍼컴퓨터를 맞춤형으로 구성할 수 있도록 고성능 네트워킹을 위한 선택폭도 확대됐다. ‘HPE 크레이 슈퍼컴퓨팅 GX5000’에서 이용 가능한 엔비디아 퀀텀-X800 인피니밴드 스위치는 포트당 800Gbps를 제공하는 144개의 포트를 갖췄고, 저전력 링크 상태 및 전력 프로파일링 기능을 통해 뛰어난 전력 효율성을 뒷받침한다. 트리시 담크로거(Trish Damkroger) HPE HPC 및 AI 인프라 솔루션 부문 수석부사장은 “세계 최고 성능의 엑사스케일 슈퍼컴퓨터 3대를 구축한 HPE는 최첨단 AI 워크로드와 기존 HPC를 결합해 과학적 혁신을 주도하고 있다”며 “엔비디아와 지속 협력해 의학, 생명과학, 엔지니어링, 제조 등 다양한 분야에서 한계를 뛰어넘는 데 필요한 고성능 집적도를 확보할 수 있도록 지원하고 있다”고 강조했다. 대규모·소버린 환경 위한 ‘HPE AI 팩토리’ 강화 HPE는 업계 선도적인 슈퍼컴퓨팅 플랫폼 강화에 더해 엔비디아 베라 루빈 플랫폼과 블랙웰 아키텍처를 통해 서비스 프로바이더, 국가 기관 및 대기업을 위한 ‘HPE AI 팩토리’ 포트폴리오도 확장했다. HPE는 1조 개 이상의 매개변수를 가진 프론티어급 모델을 위해 설계된 차세대 플래그십 AI 시스템인 ‘HPE 기반 엔비디아 베라 루빈 NVL72 랙 스케일 시스템’을 선보였다. 네오 클라우드용으로 설계된 이 시스템은 36개의 엔비디아 베라 CPU, 72개의 엔비디아 루빈 GPU, 6세대 엔비디아 NV링크 스케일업 네트워킹, 엔비디아 커넥트X-9 슈퍼NIC 및 블루필드-4 DPU를 탑재해 대규모 환경에서 높은 효율성을 제공한다. 또한 HPE의 액체 냉각 통합 기술, 서비스 및 데이터센터 설계3 전문성을 결합해 대규모 AI 구축을 간소화한다. ‘HPE 컴퓨트 XD700’은 엔비디아 HGX 루빈 NVL8을 기반으로 구축된 새로운 오픈 컴퓨트 프로젝트(OCP) 기반 AI 서버로, 랙당 높은 GPU 집적도를 제공해 공간, 전력 및 냉각 비용을 절감하는 동시에 AI 학습 및 추론 처리량을 높였다. 랙당 최대 128개의 루빈 GPU를 지원해 이전 세대 대비 2배 향상된 GPU 집적도를 제공한다. 뿐만 아니라 엔비디아 블랙웰 접근성도 확대돼 HPE AI 팩토리 포트폴리오 전반에서 엔비디아 RTX 프로 6000 블랙웰 서버 에디션 GPU를 이용할 수 있다. 이러한 솔루션들은 대규모 AI 프로젝트를 추진하는 고객이 보다 빠르게 AI를 배포할 수 있도록 돕는 다양한 HPE 및 엔비디아의 소프트웨어와 서비스 업데이트를 통해 강화됐다. HPE의 AI 팩토리는 클라우드 서비스 프로바이더는 검증 프로세스를 간소화할 수 있도록 엔비디아 클라우드 프로바이더 인증 획득 준비를 마쳤다. 또 수세 가상화 및 수세 랜처 프라임 스위트 기반의 엔비디아 멀티 인스턴스 GPU(MIG)를 통해 가상머신(VM)용 GPU 패스스루 및 보안 쿠버네티스 네임스페이스를 위한 멀티 테넌시 모델도 지원해 서비스 프로바이더는 고객의 요구사항에 맞춰 하드 및 소프트 테넌시 구축 모델을 선택할 수 있다. HPE AI 팩토리 포트폴리오는 엔터프라이즈 리눅스 운영체제를 원하는 고객을 위해 엔비디아 AI 엔터프라이즈 솔루션과 통합되는 레드햇 AI 엔터프라이즈의 구성 요소인 레드햇 엔터프라이즈 리눅스 및 오픈시프트 역시 지원한다. 이외에도 엔비디아 미션 컨트롤 소프트웨어도 제공할 예정이다. 엔비디아 런:ai(Run:ai)를 통한 워크로드 오케스트레이션부터 모니터링 및 자율 복구를 지원하는 엔비디아 다이나모에 이르기까지 AI 팩토리의 모든 측면을 간소화하고, 플랫폼 팀이 효율적으로 운영하고 안정적으로 확장할 수 있도록 지원한다. 크리스 매리어트(Chris Marriott) 엔비디아 엔터프라이즈 플랫폼 부문 부사장은 “AI의 잠재력을 실현하려면 대규모 모델 학습 및 HPC 워크로드를 처리할 인프라가 필수다”며 “HPE와 엔비디아가 공동 개발한 풀스택 AI 인프라는 가속 컴퓨팅, 고도화된 네트워킹 및 액체 냉각 기술을 결합해 대규모 및 소버린 환경에서 인사이트 도출 시간을 단축한다”고 말했다.

관련 저널 읽기

전체 보기 →