사람처럼 말하는 AI 온다…구글 '제미나이3.1 플래시 라이브' 출시 - 디지털투데이
[AI] live coding ai
|
|
🔬 연구
#ai
#google
#나노 바나나 2
#이미지 생성
#제미나이
#ai 모델
#gemini
#구글
#추론 능력
원문 출처: [AI] live coding ai · Genesis Park에서 요약 및 분석
요약
사용자가 뉴스 기사를 읽고 2-4문장으로 요약해달라고 요청했습니다. 규칙은: 1. 반드시 한국어로 작성 2. 제목을 그대로 복사하지 말 것 3. 본문의 구체적 사실, 수치, 맥락을 포함할 것 4. 80자 이상 작성할 것 기사의 주요 내용: - 구글의 새로운 음성모델 '제미나이3.1 플래시 라이브' 공개 - 실시간 대화 수준의 자연스러운 음성 생성 가능 - 기존 AI 음성모델의 지연 및 부자연스러운 억양 문제 해결 - 컴플렉스펑크벤치오디오, 빅벤치오디오, 오디오 멀티챌린지 테스트에서 높은 성능 - 신스ID 워터마크로 AI 음성 식별 가능하도록 계획 - 홈디포, 버라이즌 등이 테스트 중 - AI 스튜디오, 제미나이 API, 제미나이 엔터프라이즈를 통해 개발자들에게 공개 요약 작성: 구글이 실시간 대화 수준의 자연스러운 음성을 생성하는 '제미나이3.1 플래시 라이브'를 공개했다. 기존 AI 음성모델의 지연과 부자연스러운 억양 문제를 해결했으며, 컴플렉스펑크벤치오디오, 빅벤치오디오 등 주요 테스트에서 높은 성능을 기록했다. 구글은 AI 음성 식별을 위해 신스ID 워터마크를 적용할 예정이며, 현재 홈디포, 버라이즌 등 기업들이 테스트 중이고 개발자들을 위해 API 등을 통해 공개한다.
본문
[디지털투데이 AI리포터] 생성형 인공지능(AI)이 텍스트를 넘어 음성까지 자연스럽게 모방하는 단계에 접어들었다. 구글이 새로운 음성모델 '제미나이3.1 플래시 라이브'(Gemini3.1 Flash Live)를 공개하며, 실시간 대화 수준의 자연스러운 음성 생성이 가능하다고 밝혔다. 26일(현지시간) IT매체 아스테크니카는 구글의 새로운 AI 음성모델을 조명하며, 이를 통해 AI와 인간의 대화 구분이 더욱 어려워질 수 있다고 전했다. 기존 AI 음성모델은 입력과 출력 사이에 지연이 발생할 뿐만 아니라, 부자연스러운 억양으로 인해 대화가 어색해지는 한계가 있었다. 하지만 구글은 '제미나이3.1 플래시 라이브'가 기존 모델보다 빠르고 자연스러운 음성을 생성할 수 있다고 설명했다. 정확한 지연 시간은 공개되지 않았지만, 인간 대화 수준에 근접한 속도로 작동한다는 것이다. 구글은 복잡한 다단계 작업을 평가하는 '컴플렉스펑크벤치오디오'(ComplexFuncBench Audio)와 음성 추론 능력을 측정하는 '빅벤치오디오'(Big Bench Audio) 테스트에서 높은 점수를 기록했다고 밝혔다. 또한, 입력 지연이나 끊김 현상을 처리하는 '오디오 멀티챌린지'(Audio MultiChallenge)에서도 기존 모델을 능가하는 성능을 보였다고 강조했다. 이 모델은 인간처럼 자연스러운 음성을 생성하는 것을 목표로 하지만, 구글은 AI 음성을 식별할 수 있도록 '신스ID'(SynthID) 워터마크를 적용할 계획이다. 이는 인간이 들을 수 없는 방식으로 삽입되며, AI 음성을 실제 사람의 목소리로 속이려는 시도를 방지하는 역할을 한다. 현재 홈디포, 버라이즌 등 기업들이 '제미나이3.1 플래시 라이브'를 테스트 중이며, AI 스튜디오, 제미나이 API, 제미나이 엔터프라이즈를 통해 개발자들에게도 공개된다. 구글은 이 모델이 AI 비서 및 고객 경험 개선에 활용될 것으로 기대하고 있다. SNS 기사보내기 관련기사 - iOS 27 시리의 비결은 제미나이…애플, 온디바이스 AI 지능 극대화 - 아이폰 AI 챗봇 개인정보 수집 순위…메타·구글 최악 평가 - 구글, AI 음악 생성 모델 '리리아 3 프로' 출시 - "잘 썼는데 왜 AI 같지?"…버려야 할 문장 패턴 봤더니 - 구글, TV 플랫폼 AI 강화…제미나이 기능 도입 - GAP, 구글 제미나이와 협력…AI 플랫폼 내 결제 도입 - 무료 오픈소스 AI 코딩 에이전트 '오픈코드' 공개…챗GPT·제미나이 지원 - AI가 다듬은 문장, 인간미는 어디로? 직장 메일 변화 논란 - "걸어갈까 vs 차 탈까" 200개 AI한테 토론 시켰더니…집단지성 답변 눈길 - 구글 워터마크 깨졌다…AI 콘텐츠 식별 위기
Genesis Park 편집팀이 AI를 활용하여 작성한 분석입니다. 원문은 출처 링크를 통해 확인할 수 있습니다.
공유