딥엑스, 엔비디아 독주 속 틈새 노린다...초저전력 NPU로 ‘피지컬 AI’ 승부수 - 이코노미트리뷴

[AI] ai 추론 | 2026년 4월 14일 17:29 | {'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} 하드웨어/반도체

#딥엑스 #엔비디아 #이코노미트리뷴 #초저전력 npu #피지컬 ai #npu #초저전력 ai #하드웨어/반도체

요약

딥엑스가 엔비디아 중심의 학습 시장과 달리 전력 효율이 중요한 추론 시장을 공략하며 피지컬 AI 생태계 구축을 선언했습니다. 현재 양산 중인 2~3W급 저전력 AI 반도체 DX-M1은 엔비디아 대비 가격은 10분의 1 수준이면서 전력 효율은 20배를 달성해 차별화를 모색하고 있습니다. 또한 2027년 양산을 목표로 삼성전자 2나노 공정을 적용한 차세대 칩 DX-M2를 통해 온디바이스 생성형 AI 시장을 확대하고 엔비디아 생태계와 호환되는 풀스택 전략을 추진할 계획입니다.

왜 중요한가

본문

[이코노미트리뷴 = 이진석 기자] 딥엑스가 초저전력 인공지능(AI) 반도체를 앞세워 ‘피지컬 AI’ 시장 공략에 속도를 내고 있다. 딥엑스는 국내 대표적인 시스템 반도체 설계회사(팹리스) 중 하나로 △현대차 △포스코 △LG유플러스 △롯데이노베이트 등과 협업했다. 특히 기존 AI 시장이 ‘학습(training)’ 중심으로 엔비디아가 압도적인 지배력을 구축한 것과 달리, ‘추론(inference)’ 시장은 성능뿐 아니라 전력과 비용 등 다양한 요소가 경쟁력으로 작용하면서 다수 기업이 진입하는 구조로 변화하고 있다. 이에 따라 정부와 업계에서도 국내 팹리스 기업들에 대한 기대가 커지는 분위기다. 14일 관련업계에 따르면 딥엑스는 전날 경기 성남 판교 본사에서 기자간담회를 열고 AI 반도체 로드맵과 풀스택 전략을 공개했다. 김녹원 딥엑스 대표는 “TSMC가 대만 반도체 산업을 구축한 것처럼, 딥엑스가 한국의 피지컬 AI 반도체 생태계를 구축하겠다”며 “AI를 수출하는 국가로 도약하는 데 핵심 역할을 하겠다”고 밝혔다. ◇ “GPU 한계 넘는다”…초저전력 추론칩으로 차별화 딥엑스는 현재 양산 중인 AI 반도체 ‘DX-M1’을 핵심 경쟁력으로 제시했다. DX-M1은 2~3W 수준의 저전력으로 동작한다. 엔비디아 온디바이스용 GPU ‘젯슨 오린’ 대비 약 10분의 1 가격에서 동일 연산 기준 전력 효율은 20배 수준이라는 게 회사 측 설명이다. 삼성 파운드리와 협업을 통해 양산 수율도 90% 이상 확보했다. 딥엑스의 기술적 초점은 ‘학습’이 아닌 ‘추론’에 있다. 대형 데이터센터에서 AI 모델을 학습하는 기존 구조와 달리, 기기 내부에서 AI 판단을 수행하는 저전력 NPU(신경망처리장치)에 집중하는 방식이다. 이에 따라 기기가 현장에서 데이터를 수집하면 핵심 데이터는 엔비디아 기반 데이터센터로 전달돼 학습에 활용된다. 반면 실제 판단은 카메라·로봇·공장 설비 등 현장에서 딥엑스 NPU가 즉시 연산해 수행하는 구조다. 이 같은 분산 구조를 통해 기존 클라우드 기반 방식 대비 지연을 줄이고 비용과 전력 부담을 낮출 수 있다는 설명이다. 김 대표는 “데이터센터 기반 GPU는 전력과 발열 측면에서 산업 현장 적용에 한계가 있다”며 “배터리 기반 기기에서도 구동 가능한 전성비가 핵심 경쟁력이 될 것”이라고 말했다. ◇ 삼성전자 2나노 공정 적용 ‘DX-M2’ 공개…온디바이스 생성형 AI 확장 딥엑스는 삼성 파운드리 2나노 공정을 적용한 차세대 칩 ‘DX-M2’ 개발 계획도 공개했다. DX-M2는 5W 미만 전력으로 최대 80TOPS(초당 80조회 연산) 성능을 목표로 하며, 2027년 양산이 예정돼 있다. 특히 수백억~수천억 개 매개변수(파라미터) 규모의 생성형 AI 모델을 배터리 기반 디바이스에서 구동하는 것을 목표로 한다. 이는 가전제품을 비롯한 다양한 전자기기에 AI 기능이 확산되는 흐름 속에서, 인터넷 연결이 제한된 환경에서도 생성형 AI 기능을 일부 구현할 수 있는 기반을 마련하겠다는 의미다. 최근 구글의 제마(Gemma) 등 경량화 모델을 중심으로 스마트폰 온디바이스 AI 경쟁이 본격화되는 흐름과도 맞닿아 있다. ◇ DXNN·DX-뉴턴 기반 풀스택 전략…엔비디아 생태계와 호환성 확보 딥엑스는 엔비디아 중심의 AI 개발 환경에서 자사 소프트웨어 플랫폼 ‘DXNN’을 통해 기존 모델을 손쉽게 이전할 수 있다는 점도 강조했다. GPU 기반에서 학습된 AI 모델을 변환·최적화해 자사 NPU에서 실행할 수 있도록 지원하는 구조다. 특히 로봇 분야에서는 엔비디아의 로봇 운영체제 ‘아이작(Isaac)’ 기반 개발 흐름을 유지하면서, AI 추론 가속 구간만 딥엑스 칩으로 전환할 수 있도록 API 레이어 ‘DX-뉴턴’을 지원할 계획이다. 기존 소프트웨어 구조를 유지한 채 연산 효율만 높이는 방식이다. 이 같은 전략을 바탕으로 딥엑스는 ‘3단계 레고형 풀스택’ 구조를 제시했다. 고객사가 AI 모델과 하드웨어를 선택하면 칩, 모듈, 소프트웨어가 결합된 형태로 빠르게 적용할 수 있도록 하겠다는 구상이다. 현재 딥엑스 칩은 퀄컴, 인텔, 르네사스 등 글로벌 주요 프로세서와 연동이 가능하다. 소프트웨어 측면에서는 아마존웹서비스(AWS), 바이두, 윈드리버 등과 협력하고 있다. 하드웨어 분야에서도 인텔, 삼성, 브로드컴, 레노버 등과 파트너십을 구축하며 생태계 확장을 추진 중이다. 김 대표는 “칩 위에 하드웨어 파트너가 모듈을 얹고 소프트웨어 파트너가 응용을 올리면 레고 블록처럼 AI가 완성되는 생태계를 만들겠다”며 “CPU·GPU 시대에 외산 기술에 의존했던 구조를 피지컬 AI 시대에는 반복하지 않겠다”고 밝혔다. [email protected]

원문 보기 ([AI] ai 추론)

뉴스 피드로 돌아가기