Как быстро и бесплатно расшифровать интервью. ВКонтакте

Если вы ещё расшифровываете текст вручную, то тратите время зря. Нейросети избавят вас от этого утомительного занятия. Рассказываем о сервисе в «ВКонтакте», который даёт вам возможность быстро и бесплатно расшифровывать интервью.

Социальная сеть «ВКонтакте» предоставляет доступ к бесплатной технологии распознавания речи. Процесс прост: загрузите аудио, нажмите кнопку распознания и получите текст. Покажем, как выглядит расшифровка фрагмента интервью об эффекте информационных пузырей.

Сервис русскоязычный, бесплатный и работает без VPN. Расшифровывает речь только на русском языке. В сутки вы можете транскрибировать аудио длительностью до 100 минут. Как заявляют разработчики, сервис разбивает текст на предложения и старается расставлять знаки препинания.

Чтобы начать работу, необходим аккаунт «ВКонтакте» — это единственный доступный вариант авторизации.

Перед загрузкой аудиофайла обязательно выберите «спонтанный» (голосовые сообщения, сленг, обсценная лексика) или «нейтральный» тип речи. После изменить его не получится.

Перетащите аудиофайл в серую область или нажмите на ссылку «Выбрать файл». Откроется окно проводника компьютера, найдите нужный файл и добавьте его в сервис.

Сервис подгружает только файлы форматов: MP3, OGG, WAV. Одновременно он работает только с одним файлом и не поддерживает пакетную загрузку.

После загрузки аудиофайла нажмите кнопку «Распознать текст». Двухминутное аудио обрабатывается за 5-6 секунд. Распознанный текст появляется в этом же окне. Его можно скопировать в буфер обмена или сохранить в формате txt.

Распознавание речи построено на технологиях искусственного интеллекта и полностью автоматизировано. У сотрудников «ВКонтакте» и третьих лиц нет доступа к вашим аудиофайлам.

Файл получает автоматическое название «asr». Текст выглядит сплошным, без разбивки на спикеров. Границы предложений и абзацев определены не всегда верно, пунктуация не всегда соответствует нормам русского языка.

Вот так выглядит полученная расшифровка.

Резюмируем

Плюсы:
— отсутствие платы и «танцев с бубнами» с VPN
— можно расшифровывать достаточно длинные аудиофайлы
— приличная скорость работы сервиса

Минусы:
— нельзя расшифровать видеозапись
— есть пунктуационные ошибки. В итоге полученный текст не похож на готовый продукт — это, скорее, сырой исходник для дальнейшей обработки
— нет разбивки текста по спикерам. Если у вас интервью с несколькими людьми, в таком сплошном тексте легко запутаться при дальнейшей его редактуре.

В общем, вполне себе рабочий инструмент для быстрой и «грязной» расшифровки текста. Зачастую этого вполне достаточно для дальнейшей работы с текстом.

Над материалом работали:
Сергей Пахоруков
Иллюстрации:
скриншоты с сайта https://vk.com/voice-tech
Инструкция актуальна:
на ноябрь 2023 года

Подводя итоги:

1
Выберите тип речи
2
Загрузите аудиофайл
3
Выполните и сохраните расшифровку

Возможно, вам пригодится: