Вебмастерская

ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек


											
							ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек

Стартап ElevenLabs представил новую модель генерации речи — Eleven V3 (alpha). Это самая выразительная и реалистичная TTS-модель на сегодня: она умеет передавать эмоции, интонации, паузы и даже такие детали, как шёпот, смех или кашель.

Теперь ИИ-голоса звучат по-настоящему естественно — настолько, что их сложно отличить от человеческих.


											
							ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек

Что умеет Eleven V3

ИИ-озвучка наконец перестала звучать, как робот из навигатора. С Eleven V3 можно делать аудиокниги, озвучку роликов, диалоги для игр — и всё это с нужным настроением и живыми эмоциями.

Детали:

  • В тексте теперь можно задавать тон и эмоции через специальные теги: [sad], [excited], [angry], [whispers], [coughs] и т.д.
  • Модель генерирует сразу два варианта фразы, чтобы выбрать наиболее удачный.
  • Появился полноценный диалоговый режим: можно создавать сцену с несколькими голосами, без ограничений по количеству спикеров.
  • Поддерживается более 70 языков, включая русский.
  • Новая модель доступна даже бесплатным пользователям. Весь июнь генерации на V3 расходуют всего 20% кредитов — это десятки минут звука без доплат.

Как использовать: Eleven V3 — самая выразительная модель генерации речи. Но чтобы она звучала как надо, нужно уметь правильно ей «подсказывать». Вот что важно.

Выбирайте подходящий голос: если вы хотите шепот — не берите голос, обученный на крике.


											
							ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек

Нажав на голос, можно посмотреть его подробное описание:


											
							ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек

Настройте стабильность — переведите ползунок в нужное положение:

  • Creative — больше эмоций, но могут быть ошибки.
  • Natural — баланс между выразительностью и точностью.
  • Reliable — стабильнее, но хуже реагирует на теги.


											
							ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек

Используйте аудиотеги: [laughs], [whispers], [angry], [sigh], [sarcastic], [gunshot], [applause], [strong French accent] и др. Не забывайте про пунктуацию — точки, паузы и заглавные буквы влияют на ритм и интонацию.


											
							ElevenLabs выпустила Eleven V3 — теперь ИИ говорит как живой человек

Пример: [whispers] I never knew it could be this way… [sigh] But I’m glad we’re here.

Попробовать можно уже сейчас — модель доступна в интерфейсе ElevenLabs.

Ранее ChatGPT научился читать документы из Google Диска.

⭐ Тестим нейросети каждый день, а то, что реально работает — сливаем в Telegram-канал: .

Источник

Читайте также:  Как восстановить эскизы и обрезать изображения в WordPress

Вам также может понравиться...

Добавить комментарий