
Компания MiniMax представила новое поколение своей музыкальной модели — Music 2.0. Это инструмент, который превращает текстовые описания в полноценные песни с вокалом, аранжировкой и инструментальным сопровождением.
В MiniMax говорят, что теперь ИИ способен создавать треки «профессионального уровня» с реалистичным звучанием голоса и точной передачей эмоций. Postium выделил главное.


Что умеет нейросеть MiniMax Music 2.0?
Music 2.0 позволяет пользователям просто ввести текстовую подсказку — например, «энергичная поп-песня о начале осени с женским вокалом» — и получить готовую композицию длиной до нескольких минут.
Сервис генерирует:
- вокал, звучащий максимально «живым» — с контролем тона, тембра и эмоций;
- инструментальные партии (гитара, барабаны, клавиши и др.);
- продолжительность до 5 минут;
- полную структуру песни — куплеты, припевы и переходы;
- аудиофайл высокого качества, готовый к использованию или доработке.
Музыку можно создавать в разных стилях — поп, джаз, рок, фолк, электронная, саундтрек и другие. Отдельно MiniMax подчёркивает «гибкость вокала» (Versatile Vocals) и «точный контроль инструментов» (Precise Instrument Control).
Как создавать треки и песни в MiniMax Music 2.0?
Интерфейс Music 2.0 интегрирован в веб-приложение MiniMax в разделе Audio → Music.


Пользователь может:
- Ввести тему или идею песни в текстовое поле.
- Добавить собственный текст (Lyrics).
- Настроить параметры — жанр, настроение, количество треков.
- Нажать «Create» — через несколько минут появляется готовая песня.
Созданные треки сохраняются во вкладке My Work, откуда их можно прослушать, скачать или доработать. Для доступа к расширенным функциям (например, больше треков или сложные инструменты) требуется подписка или кредиты внутри платформы.
Кроме веб-интерфейса Music 2.0 доступна через API. На момент запуска модель поддерживает английский язык и базовые вокальные стили.
Почему это важно? Выход Music 2.0 продолжает серию крупных релизов MiniMax в октябре 2025 года. Неделей ранее компания выпустила Speech 2.6 — быструю и естественную модель озвучки текста с откликом менее 250 мс. За день до этого появилась Hailuo 2.3 — нейросеть для генерации видео с реалистичными движениями и мимикой. А чуть раньше MiniMax представила MiniMax-M2 — открытую языковую модель на 230 млрд параметров для создания ИИ-агентов.
Таким образом, Music 2.0 завершает октябрьскую волну обновлений MiniMax, охватившую все ключевые направления — текст, речь, видео и музыку.
Ранее Cartesia выпустила нейросеть для синтеза речи Sonic-3.
⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: .
Тэги MiniMax Нейросети