思必驰全链路语音交互技术,助力酷狗潘多拉 mini 音箱语控无「限」制
思必驰语音合成技术,助力 AI 虚拟形象探索声音的价值
思必驰语音合成方案满足你对 TTS 的全部幻想。
12 月 2 日~8 日,第十届中国国际新媒体短片节在深圳举办。AI 数字人「陆川导演」与国内首个 AI 虚拟偶像「子书美」与观众见面,可实现面对面互动交流,为观众带来打破虚拟空间和现实空间次元壁的实时实感交流互动体验。
虚拟形象不仅要看的见,其高辨识度的「嗓音」更是重要的声音名片。值得一提的是,这两位虚拟形象的「造声」,均由思必驰提供的技术支持。
与真人相比,AI 虚拟形象具有其独特的传播优势,兼有其原本次元中的无限创造性与现实世界中人文价值的 AI 虚拟形象,通过 AI 融媒体提升媒体生产能力和水平,创作出更贴近艺术创想形态的作品形式,甚至还可以替代真人偶像的部分工作。
其中,AI 数字人陆川导演「造声」是基于思必驰神经网络建立的语音合成学习模型,将采集录制的陆川导演本人的音频进行训练学习,合成出了以假乱真的 AI 数字人陆川导演的声音。
与复刻 AI 数字人陆川导演的嗓音不同,子书美的合成音需要「凭空创造」。思必驰结合子书美形象性格与人设属性,为其量身打造了一款知性优雅的合成音。
语音合成技术也是当今国际人机交互领域竞相研究的热门技术之一,合成音的应用极大减少了人力录音的成本,成为了智能机器的标配能力,帮助厂商打造 voice-IP。
思必驰提供数十种语音合成预设方案作为音色选择,同时还可以对合成音进行大数据深度定制与小数据快速定制服务。
此外,关于语音合成的效果,一方面依赖算法模型,另一方面,依赖于用户提供音频语料的质量。因此在音频语料的采集上,建议在安静的环境下进行,说话语速匀速、声音大小适当、音色尽量一致、不要喷麦。语料音频质量越高,合成音效果自然越贴近真实人声。
语音合成,好比 AI 时代的活字印刷术,创建一套合成模型,便可以「印出」你想要的声音。语音合成出的声音,以前所未有的方式改变着信息传播交流的形式。
资讯来源:思必驰