Riffusion是一个利用人工智能生成音乐的工具,它可以根据用户输入的任何文本,创作出相应的音乐片段。它的原理是将文本转换成声音的图像,也就是频谱图,然后再将频谱图转换成音频。Riffusion是基于Stable Diffusion,一个开源的文本到图像的模型,对频谱图进行微调的结果。生成的音乐风...