Как озвучить текст с помощью нейросети. STEOS

И сэкономить деньги и время

Многим из нас не нравится, как звучит наш голос в записи. Слишком высокий, слишком низкий, с акцентом или невыговариванием букв. И что делать, если вы сняли видеоролик, которому нужна озвучка? Нанимать профессиональных дикторов — дорого и сложно. Искать знакомых с хорошей дикцией? Долго. Позовите на помощь нейросеть! Вы готовите текст для видео, ИИ — преображает его в «голос», аудиодорожку, которую потом можно наложить на видео.

Попробуем поработать с нейросетевым сервисом SteosVoice, который позволяет озвучить текст и преобразовать слова в аудио с помощью дикторского голоса. Возьмём часть поста из телеграм-канала «Спроси Силантьеву» и озвучим часть поста — «Чек-лист безопасности создателя медиаканала».

Как озвучить текст голосом диктора

Зайдите на сайт. Регистрация обязательная, но очень простая. Нажмите на иконку «человека» в правом верхнем углу и введите любую действующую почту — этого будет достаточно для начала работы.


Как писать тексты с помощью нейросетей


Мы протестировали 8 нейросетей для генерации текстов. Все выбранные нами нейросети понимают запросы на русском языке и отвечают на нём же. Работают без VPN. Протестировали их, отправляя им один и тот же запрос.


Что получилось? 

Сервис не требует подтверждения регистрации через письмо, что значительно ускоряет процесс.

Сервис открывается с «Галереи голосов», где представлено множество вариантов для озвучки.

В правом верхнем углу отображаются начальные токены, которые доступны при регистрации. Нажав на их количество, можно ознакомиться с тарифами.

Чтобы создать новый проект, нажмите на кнопку «Проекты» в левом меню. Затем выберите синюю кнопку «+ Создать» в правом верхнем углу или «+» на серой панели. Введите название проекта (описание указывать не обязательно) и нажмите кнопку «Создать».

Откройте проект, кликнув по нему левой кнопкой мыши. Добавьте текст, который нужно озвучить. Справа отобразится информация о количестве символов. Учтите, что на бесплатном тарифе ограничение составляет 1000 символов.

Далее необходимо выбрать голос, который будет озвучивать ваш текст. Для этого нажмите на иконку «+» слева от текста. Откроется «Галерея голосов». Выберите раздел «Dictor voices». Прослушайте понравившихся дикторов, нажав на их аватар, и подтвердите выбор, нажав на иконку галочки справа.

После добавления текста и выбора диктора можно настроить параметры синтеза. Для этого нажмите на кнопку «Настройка синтеза», где можно выбрать тембр и скорость речи диктора. Завершив настройку, нажмите на синюю кнопку «Сохранить».


Как нарисовать картинку по описанию


Мы протестировали 10 нейросетей, умеющих по текстовому описанию рисовать изображения. Все доступны без VPN и дают возможность сгенерировать изображения бесплатно или за токены — это специальная валюта нейросетей, которую можно покупать за деньги.


Читать обзор 

После внесения настроек нажмите «Синтезировать речь». На то, чтобы озвучить наш текст, мы потратили 7 секунд и 7,60 токенов (1 токен = 100 символов). Затем можно прослушать результат с помощью кнопки «Воспроизвести» и скачать его в формате MP3, нажав «Скачать реплику».

Вот такая озвучка у нас получилась. Не все слова виртуальный диктор произносит с правильной интонацией. Кое где ударения неправильные. Но в целом — очень даже неплохой результат.


Над материалом работали:
Сергей Пахоруков
Иллюстрации:
скриншоты сайта https://cybervoice.io/ru/
Инструкция актуальна:
на сентябрь 2024 года

Подводя итоги:

1
Подготовьте текст для озвучивания
2
Выберите диктора
3
Скачайте аудиофайл