‘AI 목소리’ 한계 넘었다… 네오사피엔스 ‘타입캐스트’, 10배 학습 데이터로 ‘감정’ 입히다

‘AI 목소리’ 한계 넘었다… 네오사피엔스 ‘타입캐스트’, 10배 학습 데이터로 ‘감정’ 입히다

‘AI 목소리’ 한계 넘었다… 네오사피엔스 ‘타입캐스트’, 10배 학습 데이터로 ‘감정’ 입히다

생성형 인공지능(AI) 콘텐츠 제작 서비스 ‘타입캐스트’를 운영하는 네오사피엔스가 사람의 목소리에 더 가까워진 AI 음성 기술과 편집 기능을 담은 대규모 업데이트를 단행했다. 이번 업데이트의 핵심은 AI 음성 학습 데이터를 기존 대비 10배 이상 확장해, AI가 단순히 텍스트를 읽는 것을 넘어 실제 사람처럼 미묘한 감정의 흐름과 자연스러운 억양을 담아낼 수 있게 된 점이다.

네오사피엔스는 “AI가 글의 문맥을 분석해 장면에 맞는 감정을 자동으로 적용하는 ‘스마트 이모션’ 기능을 새롭게 선보였다”고 26일 밝혔다. 예를 들어, 감동적인 내용의 스크립트를 입력하면 AI가 자동으로 부드럽고 따뜻한 톤으로 변환해 음성을 생성하는 방식이다.

특히, 대폭 늘어난 학습 데이터를 기반으로 문장 사이의 볼륨, 억양, 톤 흐름이 한층 부드러워져 실제 사람이 말하는 것과 같은 생동감을 구현했다는 평가다. 단순히 정해진 텍스트를 기계적으로 읽는 것이 아니라, 문맥에 맞춰 강약과 높낮이를 조절하는 자연스러움이 특징이다.

감정 표현의 자유도를 높인 ‘커스텀 이모션’ 기능도 주목할 만하다. 사용자가 직접 프롬프트를 입력해 기쁨, 슬픔, 화남 같은 기본 감정 외에 “뛸 듯이 기뻐하며”, “답답한 듯 짜증내며” 등 섬세한 뉘앙스까지 자유롭게 표현할 수 있게 됐다. 또한, 많은 이용자가 기다려온 ‘속삭임’ 기능이 모든 캐릭터에 적용돼 ASMR이나 힐링 콘텐츠 제작에 최적화된 환경을 제공한다.

이번 업데이트에서 ‘마이 보이스 메이커(보이스클로닝)’ 기능 역시 개선됐다. 기존 사용자 목소리를 AI 음성으로 만드는 수준을 넘어, 스마트 이모션 및 커스텀 이모션 기능과 결합해 사용자의 목소리를 전문적이거나 경쾌하고 역동적인 톤 등 완성도 높은 새로운 스타일로 재구성할 수 있도록 발전했다. 개인 크리에이터는 오리지널 보이스를, 기업 고객은 일관된 브랜드 보이스를 관리하고 확장하는 도구로 활용할 수 있어 차별화된 경쟁력을 갖추게 됐다는 분석이다.

글로벌 콘텐츠 제작 환경을 위한 다국어 지원도 크게 향상됐다. 한국어뿐만 아니라 영어, 일본어, 중국어, 스페인어, 베트남어까지 모든 AI 캐릭터가 자연스러운 억양과 감정으로 구사할 수 있게 되었다. 더불어 직관적으로 전면 개편된 에디터 UI는 스크립트 입력, 감정 조절, 다국어 전환 등 모든 작업을 더욱 손쉽고 빠르게 진행할 수 있도록 사용자 편의성을 높였다.

네오사피엔스 김태수 대표는 “타입캐스트는 항상 ‘실제 사람보다 더 자연스러운 목소리’와 ‘더 창의적이고 손쉬운 제작 경험’을 추구해왔다”며, “이번 업데이트가 감정, 억양, 리듬의 섬세한 보이스 디테일과 크리에이터의 업무 효율을 동시에 끌어올리는 결과물이 될 것”이라고 밝혔다.

이번 기능 강화를 통해 타입캐스트는 미디어, 게임, 교육, 광고, 글로벌 콘텐츠 등 광범위한 분야에서 더욱 풍부하고 매력적인 콘텐츠 제작을 지원할 것으로 기대된다.

한편, 네오사피엔스는 지난 7년간 전 세계 225개국, 누적 가입자 204만 명을 확보했으며, 유료 구독자 기준으로 2020년부터 2024년까지 약 21배 성장하는 견고한 성장세를 이어오고 있다.

Author: NEWSPIC

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다