뉴스피드 큐레이션 SNS 대시보드 저널

이스트소프트, 페르소에이아이 AI 더빙 서비스 고도화… 감정 표현 강화하고 더빙 언어 33개로 확대

인공지능신문 (AI Times) | | ⚡ AI 서비스
#ai 더빙 #감정 표현 #구독 서비스 #이스트소프트 #페르소에이아이

요약

인공지능 서비스 전문기업 이스트소프트(대표 정상원)는 AI 더빙 구독 서비스 ‘페르소에이아이(Perso AI)’의 더빙 품질을 원작에 가까운 감정 표현 수준으로 대폭 고도화했다고 25일 밝혔다. 이번 업데이트로 페르소에이아이의 AI 더빙 서비스는 감정 표현과 억양, 발화 타이밍이 전반적으로 개선되며 한층 더 실제 음성에 가까운 더빙 구현이 가능해졌다. 특히 감정 기복이 큰 대사나 강조 표현, 속삭임, 웃음 등 다양한 상황에서도 자연스럽고 몰입감 있는 결과물 생성을 지원한다. 이와 함께, 지원 언어는 확대됐고 생성 속도는 빨라졌다.

왜 중요한가

개발자 관점

검토중입니다

연구자 관점

검토중입니다

비즈니스 관점

검토중입니다

본문

감정 표현·억양 자연스러움 등 개선, 지속적 기술 협업과 고도화로 업그레이드 인공지능 서비스 전문기업 이스트소프트(대표 정상원)는 AI 더빙 구독 서비스 ‘페르소에이아이(Perso AI)’의 더빙 품질을 원작에 가까운 감정 표현 수준으로 대폭 고도화했다고 25일 밝혔다. 이번 업데이트로 페르소에이아이의 AI 더빙 서비스는 감정 표현과 억양, 발화 타이밍이 전반적으로 개선되며 한층 더 실제 음성에 가까운 더빙 구현이 가능해졌다. 특히 감정 기복이 큰 대사나 강조 표현, 속삭임, 웃음 등 다양한 상황에서도 자연스럽고 몰입감 있는 결과물 생성을 지원한다. 이와 함께, 지원 언어는 확대됐고 생성 속도는 빨라졌다. 이번 업데이트에 따라 페르소에이아이 AI 더빙 서비스는 100개 언어를 인식하고, 33개 언어로 더빙을 지원하기 시작한다. 또한 생성 시간은 기존 대비 크게 단축돼 콘텐츠 제작 효율성을 한층 높였다. 사용자 경험도 함께 강화됐다. 작업 편의성과 속도를 개선하기 위해 ‘보이스톤(VoiceTone) 카드형 선택기’를 새롭게 추가했다. 즉, 교육, 마케팅, 엔터테인먼트 등 콘텐츠 유형에 맞는 음성 스타일을 사용자가 직관적으로 선택할 수 있도록 한 것이다. 페르소에이아이의 AI 더빙은 단순 음성 합성을 넘어 영상 전체를 처리하는 통합형 서비스다. 영상을 업로드하면 오디오 소스 분리, 스크립트 추출 및 맥락 기반 번역, 감정 반영 음성 합성, 프레임 단위 립싱크, 최종 영상 출력까지 전 과정을 하나의 파이프라인으로 자동 처리한다. 이스트소프트는 통합형 AI 더빙 서비스의 글로벌 서비스와 품질 고도화를 위해 전략적으로 자동 처리 과정에서 여러 테크 기업들과 단위별 협업을 이어가고 있다. 글로벌 AI 음성 기술 기업 일레븐랩스(ElevenLabs)도 주요 파트너 중 하나다. 현재 페르소에이아이가 독일, 스페인, 브라질, 러시아 등 글로벌 AI 더빙 시장에서 활발히 활용되고 있는 만큼, 이번 업데이트가 글로벌 콘텐츠 제작자들로부터 긍정적인 반응을 끌어낼 것으로 이스트소프트 측은 기대하고 있다. 권택순 이스트소프트 CTO는 “이번 업데이트는 단순히 새로운 엔진을 얹는 것이 아니라, 이스트소프트의 음성 기술 역량을 더빙 품질에 직접 녹여낸 결과”라며 “앞으로도 음성 표현의 정교함과 다국어 안정성을 함께 끌어올려, AI 더빙이 모든 콘텐츠 제작자의 기본 워크플로우가 되는 환경을 만들어가겠다”고 밝혔다.

관련 저널 읽기

전체 보기 →