Как с помощью нейросети создать виртуального диктора. D-ID

Чем заменить нейросеть «Диктор» от Mail.ru

Слышали ли вы о виртуальных дикторах? Цифровых аватарах, которые озвучивают нужный вам текст? Очень классная нейросетевая штука для тех, кто не хочет «светиться» в ролике и предпочитает делегировать эти полномочия нейросети. Расскажем о сервисе, с помощью которого можно озвучить любой текст для новости, презентации, анонса материала и даже для открытки.

Сервис англоязычный, работает без VPN. Он специализируется на ИИ-аватарах с уникальной внешностью и голосом. Сервис платный, но есть пробный бесплатный период.

Trial20 кредитов (примерно 5 минут видео), водяной знак на весь экран
Lite, $5,9 в месяц (оплатить можно только зарубежной картой)40 кредитов (примерно 10 минут видео), водяной знак в углу

Покажем, как оживить сгенерированное лицо и заставить виртуального персонажа произнести заранее написанный текст.

Зайдите на сайт сервиса. Нажмите кнопку «Start free trial» в правом верхнем углу экрана. Откроется студия, где будут отображаться все ваши проекты. В левом нижнем углу найдите название своего аккаунта (по умолчанию это «Guest»), кликните на него, выберите пункт «Login/Signup» и пройдите авторизацию через почтовый ящик. После авторизации вы получаете 20 кредитов на trial-аккаунте (каждый кредит — это 15 секунд видео).

В правом верхнем углу нажмите на кнопку «+ Create video». Откроется окно с аватарами. Добавьте своё фото или фото человека (персонажа, котика, мультяшку), который будет в кадре, нажав на чёрную кнопку «+ADD» под окном предпросмотра. Минимальный размер изображения 200×200 пикселей, размером до 10 Mb. Сервис не даст загрузить изображение, на котором невозможно определить лицо.

В окне справа введите текст, который будет произносить виртуальный диктор. В меню «Language» установите правильный язык, а в меню «Voices» выберите голос, которым будет произнесён текст. Голоса с оранжевой пометкой «PRO+» работают только в платной подписке.

В trial-версии можно предварительно прослушать отрывок, не превышающий 10 слов. Обязательно послушайте звучание голоса, нажав на иконку громкоговорителя. При необходимости уберите несколько пробелов, чтобы прослушать более длинный отрывок. Длина превью голоса не равна длине всего текста — сервис поддерживает тексты размером до 3875 символов.

В любой момент можно нажать кнопку «Discard video», чтобы сбросить все настройки и вернуться к чистому проекту. Если вы довольны результатом, нажмите оранжевую кнопку «Generate video» в правом верхнем углу. Вы увидите предполагаемую длину будущего ролика и то количество кредита, которое потратится на его создание. Запустите создание файла кнопкой «Generate».

Название ролика соответствует названию проекта, указанному в левом верхнем углу окна (по умолчанию — «Untitled video»)

Готовое видео отображается в вашей студии. Кликните по превью, чтобы открыть ролик, кнопка «Download» позволяет скачать файл в формате mp4. Также можно поделиться прямой ссылкой на видео.

Вот как выглядит результат: медиатренер Оксана Силантьева читает хокку (в сервис мы загрузили её фото).

А здесь сгенерированный нейросетью аватар Капитана Немо цитирует Жюля Верна.

Видеоинструкция

Для тех, кому проще воспринимать инструкции в видеоформате, подготовили для вас ролик.

Над материалом работали:
Сергей Пахоруков
Иллюстрации:
скриншоты сервиса с d-id.com
Инструкция актуальна:
на январь 2024 года

Подводя итоги:

1
Выберите персонажа
2
Напишите текст
3
Сгенерируйте видео в сервисе