Amphion是一个集成了语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的音频AIGC开源平台(https://github.com/open-mmlab/Amphion)。在本次报告中,我们将针对于歌声转换(Singing Voice Conversion),介绍该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计。
除此之外,我们还将介绍Amphion的整体系统架构、代码开发逻辑,以及各类文档的设计思路。最后,我们将通过实例说明,如何基于Amphion来进行各项音频生成任务的研究与开发。
张雪遥,香港中文大学(深圳)2022级博士生,导师为武执政教授。音频生成开源工具包Amphion的联合发起人。研究兴趣为人工智能音乐、歌声生成等。曾入选2023年腾讯犀牛鸟精英人才计划,曾在MM、WWW、ACL、ICASSP等顶级学术会议上发表论文7篇,谷歌学术引用数百次,参与维护多项学术开源项目。本硕毕业于武汉大学、中国科学院大学,曾获国家奖学金、校园十佳歌手等荣誉。
个人主页:https://www.zhangxueyao.com/
正文完
可以使用微信扫码关注公众号(ID:xzluomor)