멀티모달 AI 같은 날 공개한 메타·LG… 목표도 공개 방식도 달랐다 - 더에이아이

[AI] 멀티모달 ai | | 🔬 연구
#gpt-5 #lg #review #멀티모달 ai #메타 #뮤즈 스파크 #엑사원 4.5
원문 출처: [AI] 멀티모달 ai · Genesis Park에서 요약 및 분석

요약

메타와 LG가 9일 각각 멀티모달 AI 모델인 ‘뮤즈 스파크’와 ‘엑사원 4.5’를 공개하며 개인 서비스와 산업 현장이라는 서로 다른 목표를 천명했습니다. 메타는 건강 관리 등 일상 생활을 돕는 개인용 비서에, LG는 복잡한 산업 문서 분석에 특화된 모델을 선보이며 효율성을 강조했습니다. 공개 방식에서도 메타가 독점 공개를 택한 반면 LG는 허깅페이스에 개방하는 등 차이를 보였습니다. 한편 메타의 모델은 테스트 상황에서만 잘할 수 있다는 신뢰성 문제가 제기되기도 했습니다.

본문

메타 ‘뮤즈 스파크’ 개인 일상 겨냥 vs LG ‘엑사원 4.5’ 산업 현장 정조준 오픈소스 상징 메타, 뮤즈 스파크는 독점 공개… LG는 허깅페이스에 개방 아폴로 리서치 “테스트서만 잘할 수도”… 뮤즈 스파크 신뢰성 문제도 제기 메타와 LG가 9일 나란히 멀티모달 AI 모델을 공개했다. 메타는 ‘뮤즈 스파크’를, LG AI연구원은 ‘엑사원 4.5’를 각각 선보였다. 뮤즈 스파크는 메타가 새롭게 출범시킨 ‘메타 슈퍼인텔리전스 랩스(MSL)’의 첫 작품이다. 엑사원 4.5는 LG AI연구원이 2021년 세계 최초로 양방향 멀티모달 AI를 개발한 이후 4년간 쌓아온 기술의 결실이다. 두 모델은 텍스트와 이미지를 동시에 이해하고 추론하는 AI라는 공통점이 있다. 하지만 두 모델이 가리키는 방향은 달랐다. ◇ 같은 날 등장한 멀티모달 AI, 뮤즈 스파크와 엑사원 4.5 뮤즈 스파크는 텍스트와 이미지를 함께 이해하고 추론하는 AI 모델이다. 사진을 보여주며 질문하거나, 복잡한 문서를 분석하고, 여러 도구를 활용해 작업을 처리하는 것이 가능하다. ‘컨템플레이팅(Contemplating) 모드’도 탑재했다. 하나의 AI가 순서대로 생각하는 기존 방식과 달리, 여러 AI가 동시에 같은 문제를 풀고 결과를 합치는 방식으로 작동한다. 속도는 유지하면서 더 어려운 문제에 답할 수 있다. 실제로 이 모드를 적용했을 때 최고 난이도 시험 벤치마크인 ‘휴머니티스 라스트 이그잼(Humanity's Last Exam)’에서 58%를 기록했다. 헬스케어도 핵심 영역으로 내세웠다. 의사 1000명 이상과 협업해 건강 관련 학습 데이터를 구축했다. 음식 영양 성분이나 운동 시 활성화되는 근육 등을 시각적으로 설명하는 기능을 갖췄다. 메타는 뮤즈 스파크를 개인의 건강, 생활, 학습 전반을 돕는 AI로 발전시키겠다는 구상이다. 엑사원 4.5는 텍스트뿐 아니라 이미지까지 함께 이해하는 LG AI연구원의 멀티모달 모델이다. 계약서, 기술 도면, 재무제표처럼 글자와 그림이 뒤섞인 복잡한 산업 문서를 읽고 분석하는 데 강점이 있다. 복잡한 에너지 통계 차트에서 특정 색깔을 구분해 한국과 일본에 공급되는 석유량을 정확히 읽어내는 식이다. 성능 면에서는 AI 시각 능력 평가 지표 13개 평균 점수에서 오픈AI GPT-5 미니, 앤트로픽 클로드 소넷 4.5, 중국 알리바바 큐웬3-VL을 모두 넘어섰다. 코딩 성능 지표인 라이브코드벤치(LiveCodeBench) v6에서도 구글 젬마 4를 앞질렀다. 규모는 330억 개(33B) 파라미터로 LG의 대형 모델 K-엑사원의 7분의 1 크기지만, 텍스트 이해·추론 영역에서 동등한 성능을 달성했다. LG AI연구원이 자체 개발한 하이브리드 어텐션 구조와 고속 추론 기술을 적용한 결과다. ◇ 같은 멀티모달, 다른 목적지 두 모델은 공통점이 있다. 텍스트와 이미지를 처음부터 함께 처리하도록 설계한 네이티브 멀티모달이다. 기존 AI 모델들이 텍스트 처리 기능에 이미지 인식을 나중에 덧붙이는 방식이었다면, 두 모델은 처음 설계 단계부터 텍스트와 이미지를 하나의 구조 안에서 함께 처리한다. 사람이 글을 읽으면서 동시에 그림을 보는 것처럼 두 가지 정보를 통합해 이해하는 방식이다. 규모 대비 효율성도 양쪽 모두 강조하는 지점이다. 메타는 이전 모델 ‘라마 4 매버릭’ 대비 10분의 1 수준의 컴퓨트로 동급 성능을 달성했다고 밝혔다. LG는 K-엑사원의 7분의 1 크기 파라미터로 동등한 추론 성능을 냈다. 더 적은 자원으로 더 많은 것을 할 수 있게 됐다는 얘기다. 지금 공개한 모델이 끝이 아니라는 점도 같다. 메타는 더 큰 모델을 예고했고, LG는 음성·영상·물리 환경까지 확장을 목표로 제시했다. 지향점은 갈린다. 메타가 겨냥하는 것은 개인이다. 건강 관리, 생활 맞춤형 서비스, 에이전트 기반의 개인 비서 등을 목표로 한다. 음식 사진을 찍으면 영양 성분을 분석해주고, 운동 자세를 보여주면 어떤 근육이 활성화되는지 설명해 주는 식이다. 일상 속 개인 맞춤형 초지능 비서를 만들겠다는 구상이다. LG는 산업 현장을 겨냥하고 있다. 기업 현장에는 계약서, 기술 도면, 재무제표처럼 글자와 그림이 뒤섞인 복잡한 문서 등이 많다. 사람이 일일이 읽고 분석하던 이 문서들을 AI로 정확히 이해하고 필요한 정보를 추출하는 것이 엑사원 4.5가 가진 강점이다. 이진식 LG AI연구원 엑사원랩장은 “음성과 영상, 물리 환경까지 AI의 이해 범위를 확장해 산업 현장에서 실질적으로 판단하고 행동하는 AI를 만들어가겠다”고 말했다. ◇ 오픈소스 기조도 갈렸다 공개 방식에서도 차이가 났다. 메타는 라마 시리즈로 오픈소스 AI의 대표 주자로 자리매김해 왔다. 누구나 모델을 내려받아 자유롭게 활용할 수 있도록 공개하는 방식으로 AI 민주화를 이끌었다. 하지만 뮤즈 스파크는 다르다. 현재 메타 AI 앱과 웹사이트에서만 사용할 수 있고, 응용프로그램인터페이스(API)는 일부 선택된 파트너에게만 비공개로 제공되는 독점 모델이다. 개발자나 일반 사용자가 모델을 직접 내려받아 자신의 컴퓨터에서 실행하는 것은 불가능하다. 메타는 향후 오픈소스로 공개할 의향이 있다고 밝혔지만 구체적인 일정은 없는 상태다. 커뮤니티에서는 “로컬에서 실행할 수 없다면 관심 없다”는 반응이 나왔고, 라마로 쌓아온 오픈소스 기조가 흔들리고 있다는 비판도 제기됐다. 기술적 신뢰성 문제도 제기됐다. AI 안전 연구 기관 아폴로 리서치(Apollo Research)는 뮤즈 스파크가 테스트 상황임을 스스로 인식하고 평가 환경에서 다르게 행동할 수 있다고 경고했다. 시험을 볼 때만 잘하고 실제 상황에서는 다를 수 있다는 뜻이다. 실제 테스트에서는 영문 소설에 폴란드어 대화가 섞여 나오는 언어 오염 현상도 보고됐다. 메타 측은 이를 인지하고 있으며 추가 연구가 필요하다고 밝혔다. 반면, LG AI연구원은 그동안 꾸준히 산업에서 성과를 내왔다. 엑사원 4.5 이전 모델부터 멀티모달 AI를 산업에 적용, 성능을 입증했다. LG전자는 주 단위 제품 판매 수요 예측에 엑사원을 도입해 50% 이상의 효율성 개선을 달성했고, LG이노텍은 카메라 렌즈 최적화 공정에 적용해 같은 수준의 성과를 거뒀다. 화학·소재 분야에서도 성과가 있다. 엑사원 기반 AI 모델 ‘엑사원 디스커버리’는 약 100여 종의 화학물질 특성을 학습해 기존 1년 10개월이 걸리던 기능성 화장품 핵심 성분 개발 기간을 단 하루로 단축했다. - 양방향 멀티모달 원조… LG, ‘엑사원 4.5’로 GPT·클로드 격파 - “AI 모델 빌리지 말고 소유하라”... 미스트랄, ‘포지’ 출시 - 텍스트부터 영상까지 하나로… 구글, ‘통합 임베딩’ 기술 공개 - LG AI연구원 ‘K-엑사원’, 독파모 1차 평가 1위 - 세미티에스 “전공정 자동화 기술, 넘볼 수 없는 해자” - E2E 자율주행의 현실, ‘혼자는 힘들다’ - 한국으로 전선 확대된 LPDDR6 IP 경쟁, 현실은? - 우주로 발 넓히는 스페이스X·구글·아마존, 늘어나는 우주 비관론 - [오늘의 대학] 노벨상 수상자와 AI로 단백질 설계(26.4.9) - [AI 스톡킹] 의료 AI 수익 “기술 아닌 ‘도메인’에서 나온다” - [덕규의 AIways] AI 붐에 우주로 돌린 눈길, 극복해야할 리스크는 - 앤트로픽 미토스가 27년 묵은 보안 결함 찾은 비결

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →