Brie Wensleydale (@SlipperyGem)

Omni2Sound라는 새로운 사운드 생성 모델이 공개되었으며, T2A, V2A, TV2A와 오디오 캡셔닝을 지원한다. 포oley 작업에 유용한 잠재적 옵션으로 언급되었고, 현재 ComfyUI는 아직 지원하지 않는다. Hugging Face에도 배포되어 있다.

https://x.com/SlipperyGem/status/2049315902903234888

#aigeneration #soundmodel #audio #huggingface #foley

Brie Wensleydale🧀🐭 (@SlipperyGem) on X

Another sound model is out, this one can not only do T2A, V2A and TV2A but also audio captioning. Seems like another potential option for foley stuff, which I'm always looking forward to. No support for Comfy yet. https://t.co/55zHUFahTq https://t.co/ORHqwj5k1o

X (formerly Twitter)