구글, 추론 성능 대폭 강화한 ‘제미나이 3.1 프로’ 공개 - mstoday.co.kr

[AI] gemini 3.1 pro | | 🔬 연구
#ai #구글 #제미나이 #제미나이 3.1 프로 #추론 성능 #ai 모델 #gemini #gpt-5 #review #인공지능
원문 출처: [AI] gemini 3.1 pro · Genesis Park에서 요약 및 분석

요약

구글은 과학·연구 등 복합적 사고가 필요한 고난도 문제 해결에 특화된 차세대 AI ‘제미나이 3.1 프로’를 공개했다. 신모델은 추론 능력 평가 지표인 ARC-AGI-2에서 전작 대비 두 배 이상 향상된 77.1%를 기록하며 경쟁사 모델들을 앞섰고, 코딩 등에서도 강력한 성과를 보였습니다. 구글은 해당 모델을 개발자와 기업 고객, 일반 사용자에게 순차적으로 제공하며 ‘적용 가능한 지능’을 실제 업무에 연계할 수 있도록 지원할 계획입니다.

본문

[MS투데이] 구글이 고급 추론 능력을 대폭 강화한 차세대 인공지능(AI) 모델 ‘제미나이 3.1 프로(Gemini 3.1 Pro)’를 19일(현지시간) 공개했다. 이번 모델은 단순 질의응답을 넘어 과학·연구·공학 등 복합적 사고를 요구하는 분야에서 활용할 수 있도록 설계된 것이 특징이다. 구글은 제미나이 3.1 프로를 “단순한 답변 생성 모델이 아닌, 고난도 문제 해결을 지원하는 지능 플랫폼”이라고 설명했다. 해당 모델은 최근 발표된 ‘제미나이 3 딥 싱크(Gemini 3 Deep Think)’의 핵심 지능 엔진을 기반으로 하며, 개발자·기업·일반 사용자 전반에 순차 적용된다. ■ 추론 중심 경쟁 본격화…ARC-AGI-2에서 77.1% 제미나이 3.1 프로는 추론 능력을 평가하는 벤치마크인 ARC-AGI-2에서 77.1%의 점수를 기록했다. ARC-AGI-2는 모델이 사전에 학습하지 않은 새로운 논리 패턴을 얼마나 일반화해 해결할 수 있는지를 측정하는 지표다. 구글에 따르면 이는 전작인 제미나이 3 프로 대비 두 배 이상 향상된 수치다. 단순 정보 검색이 아니라 복합 규칙 추론과 다단계 논리 구조를 처리하는 능력이 크게 개선됐다는 의미다. 비교 지표에서도 경쟁력을 보였다. 오픈AI GPT-5.2는 52.9%, 앤트로픽 클로드 오퍼스 4.6은 68.8%를 기록한 것으로 알려졌다. 제미나이 3.1 프로는 이들보다 높은 점수를 기록하며 추론 영역에서 존재감을 강화했다. 학술적 문제 해결 능력을 평가하는 ‘인류의 마지막 시험(HLE)’에서는 도구를 사용하지 않은 조건에서 44.4%의 점수를 얻어 GPT-5.2(34.5%)와 클로드 오퍼스 4.6(40%)를 앞섰다. 코딩 능력을 평가하는 SWE-벤치 베리파이드에서도 80.6%를 기록해, 80.8%를 기록한 클로드 오퍼스 4.6에 근접한 수준을 보였다. 이는 실제 소프트웨어 문제 해결 환경에서도 경쟁력을 갖췄다는 평가로 이어진다. ■ “적용 가능한 지능”…과학·연구 환경 최적화 구글은 제미나이 3.1 프로의 핵심 가치를 ‘적용 가능한 지능(Intelligence Applied)’으로 정의했다. 이는 단순히 답을 제시하는 데 그치지 않고, 복합적 사고 과정을 실제 업무와 연구 환경에 적용할 수 있도록 설계됐다는 의미다. 모델은 복잡한 과학·공학 개념을 보다 구조적으로 설명하고, 방대한 데이터를 통합 분석해 핵심을 요약하는 데 강점을 가진다. 또한 창의적 프로젝트 기획, 구조 설계, 다단계 의사결정이 필요한 과제 수행을 지원하도록 고도화됐다. 이는 대형언어모델 경쟁 구도가 ‘파라미터 규모’ 중심에서 ‘추론의 깊이와 일반화 능력’ 중심으로 이동하고 있음을 보여준다. AI 산업이 지식 생성 단계에서 문제 해결형 지능 플랫폼 단계로 진입하고 있다는 해석도 나온다. ■ 개발자·기업·소비자 전면 확대 제미나이 3.1 프로는 프리뷰(Preview) 버전으로 먼저 공개되며, 개발자와 기업 고객, 일반 사용자 모두 접근할 수 있다. 개발자는 구글 AI 스튜디오, 제미나이 CLI, 에이전트 개발 플랫폼 ‘구글 안티그래비티’, 안드로이드 스튜디오 등을 통해 API 형태로 모델을 활용할 수 있다. 이를 통해 고급 추론 기능을 자체 애플리케이션이나 서비스에 통합할 수 있다. 기업 고객은 버텍스 AI(Vertex AI)와 제미나이 엔터프라이즈를 통해 모델을 도입할 수 있다. 대규모 데이터 분석, 업무 자동화, 전략적 의사결정 지원 등 엔터프라이즈 환경에서의 활용이 기대된다. 일반 사용자는 제미나이 앱과 노트북LM을 통해 접근할 수 있다. 구글 AI 프로 및 울트라 요금제 가입자에게는 더 높은 사용 한도가 제공된다. 특히 노트북LM에 적용되면서 장문 문서 분석과 연구 보조 기능이 한층 강화될 것으로 전망된다. ■ 에이전트형 워크플로 확장 예고 구글은 향후 개선 방향으로 ‘에이전트형 워크플로(agentic workflow)’를 제시했다. 이는 모델이 단순히 질문에 답하는 것을 넘어, 목표를 이해하고 계획을 수립하며 도구를 호출하고 단계별로 실행하는 자율적 작업 흐름을 의미한다. 프리뷰 기간 동안 사용자 피드백을 수집해 기능을 개선한 뒤 정식 일반 공개(GA)할 예정이다. 구글은 “제미나이 3.1 프로는 고급 추론을 실제 작업에 활용할 수 있도록 설계된 모델”이라며 “사용자들이 이 모델로 어떤 도전 과제를 해결하고 무엇을 새롭게 구축할지 기대된다”고 밝혔다. AI 산업이 ‘지능의 깊이’를 중심으로 한 2차 경쟁 국면에 진입한 가운데, 제미나이 3.1 프로의 등장이 글로벌 AI 판도에 어떤 변화를 가져올지 주목된다.

Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.

공유

관련 저널 읽기

전체 보기 →