엔비디아 GPU 의존도 낮추기… 토종 AI 반도체, 양산 본격화 - 대한경제
[AI] ai 추론
|
|
{'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} 하드웨어/반도체
#ai 데이터센터
#gpu
#idtechex
#실리콘
#하드웨어/반도체
#gs건설
#니모클로
#피지컬 ai
요약
오는 7월 삼성SDS와 함께 2세대 NPU ‘레니게이드’ 기반의 구독형 서비스를 출시할 예정이다. 15일 관련 업계에 따르면 국내 주요 NPU 팹리스 기업들이 대형 클라우드 및 IT 서비스 기업과 손잡고 실질적인 매출 기반을 닦고 있다.
왜 중요한가
본문
[대한경제=이계풍 기자] 국내 인공지능(AI) 반도체 기업들이 기술 검증(PoC) 단계를 지나 실제 서비스 현장에 제품을 공급하기 시작했다. 클라우드 인프라부터 데이터센터 추론용 서버, 온디바이스(On-device) 로봇에 이르기까지 국산 NPU(신경망처리장치)의 적용 범위가 전방위로 확대되면서 시장 안착 여부가 시험대에 올랐다. 15일 관련 업계에 따르면 국내 주요 NPU 팹리스 기업들이 대형 클라우드 및 IT 서비스 기업과 손잡고 실질적인 매출 기반을 닦고 있다. 리벨리온은 최근 IT 서비스 기업 가비아와 협력해 AI 추론용 NPU ‘아톰 맥스’ 기반의 서비스형 NPU(NPUaaS)를 정식 출시했다. 고객사가 고가의 인프라를 직접 구축하지 않고도 국산 NPU를 통해 AI 추론 기능을 활용할 수 있는 길을 연 것이다. 퓨리오사AI 역시 기업용 AI 시장 공략에 속도를 내고 있다. 오는 7월 삼성SDS와 함께 2세대 NPU ‘레니게이드’ 기반의 구독형 서비스를 출시할 예정이다. LG CNS와는 AI 인프라 검증을 공동 진행하며 적용 범위를 넓히고 있다. 리벨리온과 퓨리오사AI는 각각 SK텔레콤, 글로벌 반도체 설계 자산 기업 Arm 등과 손잡고 차세대 AI 데이터센터 표준 아키텍처 수립에 나서는 등 ‘엔비디아 GPU’ 의존도를 낮추기 위한 추론 시장 선점 경쟁에 돌입했다. 온디바이스 AI 분야에서는 딥엑스의 성과가 돋보인다. 딥엑스는 이미 2024년부터 전 세계 350여개 기업에서 성능 검증을 완료했으며, 지난해 12월에는 중국 바이두로부터 초도 4만장 규모의 주문을 확보했다. 국산 NPU가 글로벌 빅테크 기업의 양산 라인에 직접 투입될 수 있음을 증명한 사례다. 특히 딥엑스는 현대자동차그룹 로보틱스랩과 공동 개발한 AI 컴퓨팅 설루션의 양산 검증을 마쳤다. 올해 말부터는 배송 로봇 ‘달이(DAL-e)’와 모빌리티 플랫폼 ‘모베드(MobED)’에 탑재돼 본격적인 양산에 들어간다. 김녹원 딥엑스 대표는 “칩과 소프트웨어, 글로벌 유통망을 모두 갖춘 피지컬 AI 인프라 기업으로 성장하겠다”고 했다. 이 외에도 모빌린트가 AI 가속기(에리스)와 칩(레귤러스)을 앞세워 엣지 AI 시장 공략에 나섰고, 하이퍼엑셀은 데이터센터용 가속기(베르타)로 시장 진입을 시도하고 있다. 정부도 지원 사격에 나섰다. 과학기술정보통신부와 금융위원회는 ‘K-엔비디아 육성 프로젝트’를 통해 향후 5년간 AI·반도체 분야에 총 50조원 규모의 자금을 투입하기로 했다. 저전력·고효율 NPU를 중심으로 글로벌 경쟁력을 단기간에 끌어올리려는 전략이다. 장밋빛 전망만 있는 것은 아니다. 엔비디아의 ‘쿠다(CUDA)’처럼 개발자들이 국산 NPU를 쉽고 빠르게 활용할 수 있는 소프트웨어 생태계 구축이 시급하다는 지적이다. 또한 대규모 데이터센터 환경에서 GPU를 실질적으로 대체할 수 있는 안정적인 성능과 가격 경쟁력을 증명해야 한다. 업계 관계자는 “단순한 하드웨어 성능 경쟁을 넘어 서비스 현장에서의 확산 속도가 향후 글로벌 주도권의 향방을 가를 변수”라고 진단했다. 이계풍 기자 kplee@ 〈ⓒ 대한경제신문(www.dnews.co.kr), 무단전재 및 수집, 재배포금지〉