Mastodawn

[Google] MusicLM: Generating Music From Text

"We introduce MusicLM, a model generating high-fidelity music from text descriptions such as 'a calming violin melody backed by a distorted guitar riff'. MusicLM casts the process of conditional music generation as a hierarchical sequence-to-sequence modeling task, and it generates music at 24 kHz that remains consistent over several minutes. "

https://google-research.github.io/seanet/musiclm/examples

MusicLM

SingSong: Generating musical accompaniments from singing (Online Supplement)