首页>>音频与视频>>AI音频生成

riffusion

2024-09-05 15:10:00 4

站点介绍

Riffusion是一个利用人工智能生成音乐的工具,它可以根据用户输入的任何文本,创作出相应的音乐片段。它的原理是将文本转换成声音的图像,也就是频谱图,然后再将频谱图转换成音频。Riffusion是基于Stable Diffusion,一个开源的文本到图像的模型,对频谱图进行微调的结果。生成的音乐风格多样,有时候甚至有点超现实,但并不打算取代人类的音乐创作。

Riffusion是Seth Forsgren和Hayk Martiros两位爱好音乐的朋友的业余项目,他们于2022年12月15日发布了Riffusion的模型和代码,并提供了一个网页应用,让任何人都可以免费体验Riffusion的魅力。

它的功能特色:
  • 它可以根据用户输入的任何文本,生成相应的音乐片段,无论是歌词、诗句、故事、情感还是其他主题。
  • 它使用声音的图像,也就是频谱图,而不是音频来创作音乐,这使得它能够更好地捕捉声音的细节和变化。
  • 它是基于Stable Diffusion,一个开源的文本到图像的模型,对频谱图进行微调的结果,这使得它能够利用已有的技术和数据。
  • 它的音乐风格多样,有时候甚至有点超现实,但并不打算取代人类的音乐创作,而是提供一个新的音乐探索和创意的工具。
riffusionriffusion-根据文本提示生成音乐的AI工具的使用教程

该工具使用起来非常简单,首先我们先进入riffusion的官网。

riffusion

然后在输入框中输入您想要的文本提示,比如“funk bassline with a jazzy saxophone solo”,然后点击“Generate”按钮,就可以看到生成的频谱图,并听到生成的音频。您还可以点击“Similar”按钮,生成类似的音乐片段,或者点击“Download”按钮,下载生成的音频文件。

riffusion