小互: DiffRhythm:全球首个基于扩散模型的端到端音乐模型

能够在 10 秒内生成一首完整包含人声和伴奏的歌曲

端到端自动生成完整歌曲(无需人工干预)
输入歌词 + 风格提示,即可生成完整音乐
10 秒生成一整首 4 分 45 秒歌曲(人声 + 伴奏)
高质量音乐,歌词与旋律同步自然
基于扩散变换器(DiT),避免传统自回归模型(LLM)慢速推理问题

相比 MusicLM,DiffRhythm 生成速度快 50 倍

📌 输入:

歌词(例如:“在夜色中,我听见风的声音”)

风格提示(例如:“流行”、“电子”、“爵士”)

即可生成完整音乐

还可以上传音乐片段作为提示来生成相应的音乐风格。

----------------------
Tue Mar 04 2025 22:32:36 GMT+0800 (China Standard Time)

via Twitter @小互
 
 
Back to Top
oaibest.com 2023-2025
[email protected]