· iskusstvennyi intellekt · 1 min read

Meta презентовала свою text2speech нейросеть, которая в 20 раз быстрее аналогичных моделей

Voicebox позволяет создавать звуковые дорожки с нуля и редактировать существующие образцы, а также копировать голос по звуковому референсу.

При этом Voicebox от Meta — это не просто ИИ-конвертер текста в речь. Нейросеть может создавать звуковые дорожки с нуля и редактировать уже существующие образцы, например, чистить их от шума. Ещё Voicebox достаточно звукового референса в 2 секунды, чтобы скопировать голос.

Работает искусственный интеллект пока только на шести языках: английский, французский, немецкий, испанский, польский и португальский. Но, как и всегда, список планируют расширять.

По словам разработчиков, Voicebox превосходит другие нейросети, вроде VALL-E и YourTTS, по качеству звука и понятности речи, и при этом работает до 20 раз быстрее.

И как раз из-за впечатляющих возможностей Meta не торопится сливать ИИ-модель в широкий доступ: боятся, что нейросетью злоупотребят.

Что касается минусов, то пока можно сказать, что искусственный интеллект Voicebox хуже различает разговорную речь, так как обучался на аудиокнигах. Но, думаем, и это временно.

А если ты уже сейчас хочешь создавать контент для продвижения в соцсетях так же легко и быстро, опережая конкурентов в 20 раз, тогда тебе следует узнать побольше об ИИ-инструменте SMMart!

Наша нейронка генерит текст для постов и изображения к ним по твоему запросу всего в несколько кликов. Читай подробнее на нашем сайте и обзаведись личным ИИ-помощником уже сегодня.

#Нейросети #ИскусственныйИнтеллект #ИИ #SMM #SMMart #Voicebox

Поделиться
Назад