리퀴드 AI, '갤럭시 S25 울트라'에서 작동하는 450M VLM 출시 - AI타임스
[AI] 멀티모달 ai
|
|
{'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} 하드웨어/반도체
#하드웨어/반도체
요약
리퀴드 AI는 클라우드 의존 없이 갤럭시 S25 울트라 등 스마트폰과 임베디드 기기에서 실시간 작동이 가능한 초경량 비전-언어 모델 ‘LFM2.5-VL-450M’을 공개했습니다. 이번 모델은 객체 위치 좌표를 출력하는 바운딩 박스 예측 기능과 다국어 지원, 함수 호출 등을 통해 창고 로봇이나 스마트 글래스 등 다양한 산업 현장에서 즉시 활용될 수 있습니다. 특히 개인정보 보호와 지연시간 문제를 해결하며, 기기 자체에서 초당 4프레임 수준의 실시간 영상 분석을 수행하는 것이 특징입니다.
왜 중요한가
관련 엔티티
리퀴드 AI
갤럭시 S25 울트라
450M VLM
LFM2.5-VL-450M
AI타임스
본문
'액체 신경망'으로 잘 알려진 리퀴드 AI가 엣지 환경에서 실시간으로 이미지와 영상을 이해하고 행동으로 이어질 수 있는 결과를 생성하는 멀티모달 AI 모델을 내놓았다. 실제 적용폭이 크게 확장됐다는 점에서 기대를 모으고 있다. 리퀴드 AI는 8일(현지시간) 클라우드 의존 없이 기기 자체에서 작동하는 초경량 비전-언어 모델(VLM) ‘LFM2.5-VL-450M’을 공개했다. 4억5000만개 매개변수 규모로, 스마트폰과 임베디드 장치에서 직접 실행 가능한 수준의 성능과 기능을 갖춘 것이 특징이다. 비전-언어 모델(VLM)은 이미지와 텍스트를 함께 이해하는 AI로, 사진을 보고 질문에 답하거나 상황을 설명할 수 있다. 하지만 기존 VLM은 대규모 GPU와 클라우드 인프라에 의존해 실제 산업 현장이나 모바일 환경에서 활용이 제한적이었다. LFM2.5-VL-450M은 이러한 한계를 해결하기 위해 설계됐다. 소형 모델이면서도 실용적인 수준의 시각·언어 이해 능력을 제공해, 창고 로봇, 스마트 글래스, 차량용 시스템 등 다양한 현장 환경에서 활용할 수 있도록 했다. 이번 모델의 가장 큰 변화는 ‘바운딩 박스 예측’ 기능이다. 이는 단순히 이미지 내용을 설명하는 것을 넘어, 특정 객체가 어디에 있는지 좌표 형태로 출력하는 기능이다. 성능 평가에서 객체 위치 인식 벤치마크(RefCOCO-M) 점수는 기존 0점에서 81.28점으로 크게 향상됐다. 모델은 JSON 형태로 객체 위치를 반환할 수 있어, 로봇 제어·영상 분석 등 실제 시스템과 직접 연동이 가능하다. 다국어 이해 능력도 크게 개선됐다. 한국어, 중국어, 일본어, 아랍어 등 다양한 언어를 지원하며, 관련 벤치마크 점수도 크게 상승했다. 사용자의 지시를 정확히 따르는 ‘명령 수행 능력’도 향상됐다. 특정 형식으로 답변하거나 제한된 정보만 출력하는 등, 실제 서비스 환경에서 필요한 정밀 제어가 가능해졌다. 여기에 ‘함수 호출(function calling)’ 기능도 추가돼, 외부 API 호출이나 시스템 제어 등 에이전트 기반 워크플로에도 활용할 수 있다. 이 모델의 핵심 경쟁력은 ‘엣지 실행’이다. 클라우드에 의존하지 않고도 다양한 디바이스에서 직접 구동할 수 있도록 설계됐다. 엔비디아 '젯슨 오린(Jetson Orin)'과 같은 임베디드 AI 모듈은 물론, AMD '라이젠 AI 맥스+ 395' 기반의 미니 PC, 그리고 삼성 갤럭시 S25 울트라와 같은 '스냅드래곤 8 엘리트' 탑재 스마트폰에서도 원활하게 실행된다. 이는 고성능 AI를 서버가 아닌 사용자 기기에서 실시간으로 활용할 수 있게 한다는 점에서 중요한 의미를 갖는다. 성능 측면에서도 실시간 활용이 가능하다. 젯슨 오린 기준으로 512×512 이미지 처리에 약 242밀리초(ms)가 소요되며, 이는 초당 4프레임 수준의 영상 분석이 가능한 속도다. 스마트폰에서도 1~2초 내 응답이 가능해 인터랙티브 애플리케이션 구현이 가능하다. 또 연구용 모델을 넘어, 실제 산업 현장에서 바로 활용할 수 있는 ‘현장형 AI’로 설계됐다. 산업 자동화 분야에서는 창고나 공장, 농업 장비 등에 적용돼 객체를 인식하는 것을 넘어 작업 흐름과 주변 상황까지 이해할 수 있다. 웨어러블 기기에서는 스마트 안경이나 바디캠 등에 탑재돼 사용자의 시야를 기반으로 실시간 상황을 분석하고 필요한 정보를 제공하는 역할을 수행한다. 유통·이커머스 환경에서는 상품 인식, 재고 관리, 매장 진열 상태 분석 등 다양한 업무를 자동화하며, 대규모 운영 환경에서도 효율성과 정확도를 동시에 높일 수 있는 솔루션으로 활용될 수 있다. 특히 클라우드 연결 없이도 동작할 수 있어, 개인정보 보호와 지연시간 문제를 동시에 해결할 수 있다는 점이 강점이다. 현재 모델은 허깅페이스에서 공개돼 누구나 활용할 수 있다. 박찬 기자 [email protected]