思必驰语音合成技术，助力 AI 虚拟形象探索声音的价值

2019-12-04

思必驰语音合成方案满足你对 TTS 的全部幻想。

12 月 2 日～8 日，第十届中国国际新媒体短片节在深圳举办。AI 数字人「陆川导演」与国内首个 AI 虚拟偶像「子书美」与观众见面，可实现面对面互动交流，为观众带来打破虚拟空间和现实空间次元壁的实时实感交流互动体验。

虚拟形象不仅要看的见，其高辨识度的「嗓音」更是重要的声音名片。值得一提的是，这两位虚拟形象的「造声」，均由思必驰提供的技术支持。

与真人相比，AI 虚拟形象具有其独特的传播优势，兼有其原本次元中的无限创造性与现实世界中人文价值的 AI 虚拟形象，通过 AI 融媒体提升媒体生产能力和水平，创作出更贴近艺术创想形态的作品形式，甚至还可以替代真人偶像的部分工作。

其中，AI 数字人陆川导演「造声」是基于思必驰神经网络建立的语音合成学习模型，将采集录制的陆川导演本人的音频进行训练学习，合成出了以假乱真的 AI 数字人陆川导演的声音。

与复刻 AI 数字人陆川导演的嗓音不同，子书美的合成音需要「凭空创造」。思必驰结合子书美形象性格与人设属性，为其量身打造了一款知性优雅的合成音。

语音合成技术也是当今国际人机交互领域竞相研究的热门技术之一，合成音的应用极大减少了人力录音的成本，成为了智能机器的标配能力，帮助厂商打造 voice-IP。

思必驰提供数十种语音合成预设方案作为音色选择，同时还可以对合成音进行大数据深度定制与小数据快速定制服务。

此外，关于语音合成的效果，一方面依赖算法模型，另一方面，依赖于用户提供音频语料的质量。因此在音频语料的采集上，建议在安静的环境下进行，说话语速匀速、声音大小适当、音色尽量一致、不要喷麦。语料音频质量越高，合成音效果自然越贴近真实人声。

语音合成，好比 AI 时代的活字印刷术，创建一套合成模型，便可以「印出」你想要的声音。语音合成出的声音，以前所未有的方式改变着信息传播交流的形式。

资讯来源：思必驰

合作：方案发布，或联络洽谈，请微信联络客服小炫（warexx），更多方案发布参考案例，请点击https://www.shenzhenware.com/solutions_hub

深圳湾（微信公众号 ID：shenzhenware）是最早也是最活跃的硬件创新社区和媒体，关注「软件+硬件」带来的场景和交互创新，以及与平台和应用相连的产业链升级。

上一篇：识别面积扩大 17 倍、支持双手指使用，高通推出新型 3D Sonic Max 超声波指纹识别技术

下一篇：把万元级影音体验打进千元档，雷鸟在 618 交了一份什么答卷？