Stability AI запустила модель Stable Audio для генерации музыки по текстовому описанию — SAMESOUND

По словам разработчиков, диффузионная модель Stable Audio обучалась на наборе из текстовых метаданных и коллекции из 800 000 аудиофайлов. Среди данных присутствовали как коммерческие записи и звуковые эффекты, так и отдельные партии инструментов. Отмечается, что общее количество аудиоматериалов превышает 19,5 тысяч часов. Stability AI  заявляют , что Stable Audio отличается полной юридической прозрачностью. Так, например, данные для обучения были предоставлены компанией AudioSparx, владеющей внушительнымПродолжить чтение