다양한 기업에 인공지능(AI) 음성합성을 제공하고 있는 리드스피커(readspeaker)는 세계 최고의 사운드 기업 소노스(Sonos)의 Sonos Voice Control에 맞춤형 음성합성기를 제공했다고 밝혔다.
이번 사례는 기존 보유 음색을 제공한 것이 아닌 고객이 원하는 목소리를 음성합성으로 개발해 맞춤 제공한 것으로, Sonos가 최첨단 AI 기반 TTS(텍스트 음성 변환) 분야에서 입증된 경험과 전문성을 보유한 ReadSpeaker의 VoiceLab을 선택했다는데 의미가 있다.
ReadSpeaker VoiceLab은 드라마·영화로 알려진 할리우드 배우 지안카를로 에스포지토(Giancarlo Esposito)의 △목소리 녹음 △녹음된 데이터 처리 △해당 데이터에 대한 DNN 모델 교육 △품질 관리 △전달 및 필요한 모든 품질 보증 단계 관리를 포함한 개발 프로세스를 관리했다.
Sonos의 맞춤형 음성합성 핵심 과제는 음악 산업에서 흔히 볼 수 있는 비표준 텍스트 콘텐츠를 이해하고 발음해야 한다는 것이었다. 또 어시스턴트가 아티스트 트랙이나 앨범 정보를 다양한 언어로 읽어내는 것도 중요했다. VoiceLab팀은 Sonos 및 Esposito와 긴밀하게 협력해 이 방대한 영역에 대한 음성 출력을 최적화할 수 있었고, 완성도 높은 결과물을 얻을 수 있었다.
Giancarlo Esposito의 목소리가 적용된 Sonos Voice Control은 미국에서는 6월, 프랑스에서는 올해 말부터 모든 음성 지원 Sonos 제품에서 사용할 수 있다.