IT之家5月16日消息 今天,微软(亚洲)互联网工程院在北京举行了微软小冰五月媒体沟通会,宣布了关于小冰人工智能创造方面的新进展。基于此前预告的人工智能小冰演唱模型第五个版本,微软演示了小冰在唱腔过渡、戏腔训练方面的成果。
小冰演唱《少年弦》Demo:点此链接。
微软小冰基于深度神经网络的歌唱模型,已顺利完成V5新版本的研发。新的V5模型实现了重大突破,它使微软小冰第一次能够像人类歌手一样,使用充沛的“中气”来烘托演唱,从而将人工智能虚拟歌声质量提升至新的高度。此外,该模型不仅限于优化微软小冰的声音,还支持对任何人类歌手的声线进行学习、模拟和建模,演绎与再现歌手们巅峰状态下的演唱水平。
据微软介绍,在V5新版本中,拥有十余个高质量的声音,提升了人工智能在歌声演绎中的预测参数的能力,除了大幅度提高中气水平之外,还改善了歌声唱腔转换的自然度,并且首次公布了戏腔的训练成果。
小冰演唱《新贵妃醉酒》Demo:点此链接。
V5新模型还具有许多其他技术特征。例如实现了多声部的合成技术,使人工智能歌手可以在不同声部间自然切换,用多个声音来源组成新的虚拟歌手等。建模过程中,所需的训练数据量较上一个版本减少了70%。从技术角度,新模型可针对任何人声建模,形成丰富多彩的人工智能歌手阵营。
微软小冰是一个覆盖对话、多重交互感官与内容服务生成的完整人工智能基础框架。其中,“人工智能创造”(AI Creation)是该框架的主要分支之一,它通过我们所研发与持续更新的人工智能技术,大规模学习并掌握人类文字、音乐、绘画等内容创造能力,再发挥人工智能的稳定性及高并发特点,为内容产业的未来变革蓄势。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。