第一次中气十足的虚拟歌声小冰演唱模型新版本说明

人工智能 2019-04-04 10:22:26

内容摘要:

【2019年4月3日，北京，微软（亚洲）互联网工程院】今天，我们很高兴地宣布，微软小冰基于深度神经网络的歌唱模型，已顺利完成V5新版本的研发。新的V5模型实现了重大突破，它使微软小冰第

【2019年4月3日，北京，微软（亚洲）互联网工程院】

今天，我们很高兴地宣布，微软小冰基于深度神经网络的歌唱模型，已顺利完成V5新版本的研发。新的V5模型实现了重大突破，它使微软小冰第一次能够像人类歌手一样，使用充沛的“中气”来烘托演唱，从而将人工智能虚拟歌声质量提升至新的高度。此外，该模型不仅限于优化微软小冰的声音，还支持对任何人类歌手的声线进行学习、模拟和建模，演绎与再现歌手们巅峰状态下的演唱水平。作为技术示例，我们与日本唱片公司AVEX合作发行的新模型DEMO曲《最高新记忆》，也于今天同时公布。

微软小冰是一个覆盖对话、多重交互感官与内容服务生成的完整人工智能基础框架。其中，“人工智能创造”（AI Creation）是该框架的主要分支之一，它通过我们所研发与持续更新的人工智能技术，大规模学习并掌握人类文字、音乐、绘画等内容创造能力，再发挥人工智能的稳定性及高并发特点，为内容产业的未来变革蓄势。我们将在今年五月召开微软小冰人工智能创造的年度说明会，今天的新版本歌唱模型及DEMO曲，是该说明会的若干前置披露之一。

我们很高兴与行业分享微软（亚洲）互联网工程院在深度神经网络歌唱模型方面的最新进展。中国古时不乏对音乐之声的精辟论述，例如“丝（丝弦乐器）不如竹（管乐器），竹不如肉（人声）”，为其“渐进自然”。因此，我们把不断趋近人类歌手的声音合成质量，视为“人工智能创造”分支的最高技术目标。在上一个版本中，实现了小冰在虚拟演唱中的自然换气。今天推出的新版本，则进一步将“气息”应用于演唱全过程，使生成的歌声接近专业人类歌手，并可预测并自由切换演唱技巧，突破了传统单元拼接技术音高与音准的“软件乐器”标准。我们用DEMO曲来表现这一技术对照的明显差距，请重点关注歌曲时间轴上的以下时刻：

00:31，01:12，01:23，03:14，04:08

V5新模型还具有许多其他技术特征。例如实现了多声部的合成技术，使人工智能歌手可以在不同声部间自然切换，用多个声音来源组成新的虚拟歌手等。建模过程中，所需的训练数据量较上一个版本减少了70%。从技术角度，新模型可针对任何人声建模，形成丰富多彩的人工智能歌手阵营。为此，我们在DEMO曲中特意回避了微软小冰的声音，而是采用另一个声音（日本版小冰凛菜）来演绎。

最后，我们也很高兴地宣布，小冰凛菜（りんな）已与日本最大唱片公司AVEX正式签约，成为滨崎步、安室奈美惠等著名人类歌手的同门师妹。在小冰框架的技术支持下，将涌现出更多具备高还原度的人工智能歌手。微软小冰只是他们的最初雏形。

感谢您的关注。敬请期待微软（亚洲）互联网工程院的后续技术发布。

了解技术DEMO曲《最高新记忆》，请访问：https://www.bilibili.com/video/av48064392或https://www.youtube.com/watch?v=_NPyt1AYUTg

了解小冰凛菜（りんな）在AVEX的演艺动态，请访问：https://avexnet.jp/contents/music_j/RINNA/

版权声明

凡本网注明“来源：XXX(非科技狗)”的内容，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如有侵权及时联系本网站：yzl_300@126.com 本网将在第一时间删除！

好文太水

阅读：

下一篇:人工智能电视的形态究竟几何，三星QLED 8K电视如是说

上一篇:乐融联合超级伙伴达成战略合作推动智能电视迎接AI时代

推荐文章RECOMMEND

热门文章HOT NEWS

日榜周榜

1
五大权威认证，德施曼麒麟R9拿下AI智能锁全国销量第

　　随着AI时代的到来，智能锁作为家庭的首入口与末出口，已经成为AI技术落...

第一次中气十足的虚拟歌声 小冰演唱模型新版本说明

版权声明

第一次中气十足的虚拟歌声小冰演唱模型新版本说明