технология

Сервис, чтобы «вытащить» текст из PDF-файла или фотографии
Извлекайте текст в три клика и бесплатно.
У вас есть сфотографированный документ или PDF-файл, и вам нужен оттуда текст? Не перенабирайте его, воспользуйтесь онлайн-сервисом. Рассказываем, как им пользоваться.
Сервис OnlineOCR.net
Бесплатный сервис Online OCR для распознавания текста в отсканированных PDF-документах (в том числе многостраничных файлов), факсах и фотографиях (jpg, tiff, bmp, gif). На выходе пользователь получает текст в форматах Word, Excel и Text. На сервисе сказано, что выходные документы имеют исходную структуру — таблицы, колонки и графические объекты.

Без регистрации бесплатно можно распознать 15 страниц в час. Регистрация дает доступ к дополнительным возможностям сервиса: конвертирование больших файлов, ZIP архивов и многостраничных PDF, выбор языков распознавания, больший выбор выходных форматов.

Открывайте OnlineOCR.net. Извлекать и конвертировать текст просто как в гостевом режиме, так и после регистрации. Схема действий идентичная.

Нажимайте «Файл» для загрузки документа. Выбирайте язык и выходной формат. Кликайте на «Конвертировать». Скачивайте готовый файл.

На фото ниже — пошаговая инструкция для работы на сервисе без регистрации.

После регистрации сначала выбирайте язык и выходной формат, после загружайте файл и нажимайте «Конвертировать».

У сервисов есть минус: если исходный файл не очень хорошего качества, то некоторые слова или фразы ни тот, ни другой сервис не распознают и выдадут их набором букв. Просмотрите документ и в случае необходимости подкорректируйте.

Инструкция актуальна на май 2019 года.

Над материалом работала
Ольга Бердецкая

Иллюстрации:
скриншоты сервисов ABBYY FineReader Onlain и OnlineOCR.net.

Знаете похожие технологии? Расскажите о своем опыте, нам интересно!

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: