미니맥스, AI 에이전트용 명령줄 인터페이스 ‘MMX-CLI’ 공개 - AI타임스

[AI] ai 에이전트 | | {'이벤트': '📰', '머신러닝/연구': '📰', '하드웨어/반도체': '📰', '취약점/보안': '📰', '기타 AI': '📰', 'AI 딜': '📰', 'AI 모델': '📰', 'AI 서비스': '📰', 'discount': '📰', 'news': '📰', 'review': '📰', 'tip': '📰'} news
#ai 모델 #ai 에이전트 #mmx-cli #명령줄 인터페이스 #미니맥스 #생성 ai

요약

중국 미니맥스가 AI 에이전트가 멀티모달 작업을 자율적으로 수행할 수 있도록 설계된 명령줄 인터페이스 ‘MMX-CLI’를 공개했습니다. 이 도구는 텍스트, 이미지, 영상, 음성 등 7가지 생성 기능을 하나의 인터페이스로 통합해, 별도의 복잡한 API 연결 없이 터미널 명령어만으로 기능을 호출할 수 있는 것이 특징입니다. 기존 토큰 플랜을 그대로 사용할 수 있어 비용 부담 없이 도입 가능하며, 간단한 설치 과정을 통해 개발자와 AI 에이전트가 미니맥스 플랫폼의 기능을 손쉽게 활용할 수 있게 됩니다.

왜 중요한가

본문

기존의 인간 개발자용으로 설계된 명령줄 인터페이스(CLI)와 달리, AI 에이전트가 복잡한 멀티모달 워크플로우를 자율적으로 실행할 수 있도록 설계된 CLI가 등장했다. 중국 미니맥스는 13일(현지시간) 생성 AI 기능을 터미널 환경에서 직접 사용할 수 있는 명령줄 인터페이스 ‘MMX-CLI’를 공개했다고 밝혔다. MMX-CLI는 터미널에서 작업하는 개발자는 물론, 커서와 클로드 코드, 오픈코드와 같은 도구에서 실행되는 AI 에이전트에게도 미니맥스 AI 플랫폼의 모든 생성 기능을 제공한다. 미니맥스는 “기존 에이전트는 읽고 생각하고 쓰는 것은 가능하지만, 노래하거나 그림을 그리고 새로운 세상을 보여달라고 하면 멈춰 버린다”라며 “이는 이해하지 못해서가 아니라, 입도 손도 카메라도 없기 때문”이라고 지적했다. 따라서 MMX-CLI는 AI 에이전트에 ‘새로운 감각’을 부여하는 것이 핵심이다. 이번에 공개된 MMX-CLI는 텍스트 중심으로 제한돼 있던 기존 AI 에이전트의 한계를 확장하는 데 초점을 맞췄다. 지금까지 대다수 대형언어모델(LLM) 기반 에이전트는 문서 이해나 코드 생성 등 텍스트 처리에는 강점을 보였지만, 음성 합성, 음악 생성, 영상 제작, 이미지 이해(비전) 등 멀티모달 기능을 활용하려면 별도의 통합 작업이 필요했다. 특히 기존에는 MCP(Model Context Protocol)과 같은 인터페이스를 통해 API를 연결하고 인증 및 서버 구성을 따로 처리해야 했기 때문에 개발 복잡도가 높았다. MMX-CLI는 이러한 과정을 생략하고, 터미널 명령어만으로 다양한 AI 기능을 호출할 수 있도록 설계됐다. 또한 기존 토큰 플랜을 그대로 활용할 수 있어 별도의 비용 구조 변경 없이 도입이 가능하다. 이 도구는 텍스트, 이미지, 영상, 음성, 음악, 비전, 검색 등 총 7개 생성 기능을 하나의 인터페이스로 통합했다. 개발자는 ‘mmx text’, ‘mmx image’, ‘mmx video’와 같은 명령어를 통해 각각의 기능을 직접 실행할 수 있다. 텍스트 생성 기능은 멀티턴 대화, 스트리밍 출력, JSON 형식 응답 등을 지원하며, 다양한 모델을 선택해 사용할 수 있다. 이미지 생성 기능은 비율 조정이나 배치 생성은 물론, 특정 객체나 캐릭터를 일관되게 유지하는 ‘참조 이미지’ 기능도 제공한다. 영상 생성 기능도 주목된다. 기본적으로 작업을 제출한 뒤 결과가 나올 때까지 동기적으로 대기하지만, 비동기 옵션을 활용하면 작업 ID를 받아 별도로 진행 상황을 추적할 수 있다. 또 특정 이미지를 첫 프레임으로 활용하는 기능도 지원, 정교한 영상 제작이 가능하다. 음성 합성 기능은 30개 이상의 목소리를 제공하며, 속도·음량·피치 조절은 물론 자막 데이터 출력까지 지원한다. 음악 생성 기능도 장르, 분위기, 악기 구성, 템포 등을 세밀하게 제어할 수 있어 콘텐츠 제작 활용도가 높다. 이미지 이해 기능은 비전-언어 모델(VLM)을 기반으로 작동하며, 로컬 파일이나 URL을 입력해 이미지에 대한 질문을 던지고 분석 결과를 받을 수 있다. 검색 기능은 미니맥스의 자체 검색 인프라를 활용해 결과를 텍스트 또는 JSON 형태로 제공한다. MMX-CLI는 깃허브를 통해 복잡한 설정 없이 간단한 설치만으로 즉시 사용할 수 있는 것이 특징이다. 사용자는 ‘npx skills add MiniMax-AI/cli -y -g’와 ‘npm install -g mmx-cli’ 두 줄의 명령어만 실행하면 환경 구성이 완료된다. 이후 에이전트에게 “mmx 명령어를 사용할 수 있다”고 알려주면, 별도의 추가 설정 없이도 에이전트가 스스로 활용 방식을 학습하며 기능을 점진적으로 확장해 나간다. 기술적으로도 개발 친화적인 구조를 갖췄다. 대부분이 타입스크립트로 작성됐으며, Node.js 18 이상 환경에서 실행 가능하다. 설정 관리도 CLI 플래그, 환경 변수, 설정 파일 순으로 우선순위를 둬, 컨테이너나 CI 환경에서도 쉽게 배포할 수 있도록 했다. 글로벌과 중국 지역을 구분해 API를 자동으로 라우팅하는 기능도 포함돼 있어, 다양한 지역 환경에서 유연하게 사용할 수 있다. 박찬 기자 [email protected]