технология

Два сервиса, чтобы «вытащить» текст из PDF-файла или фотографии

Извлекайте текст в три клика и бесплатно.

У вас есть сфотографированный документ или PDF-файл, и вам нужен оттуда текст? Не перенабирайте его, воспользуйтесь онлайн-сервисами. Рассказываем, как ими пользоваться.

Сервис ABBYY FineReader Onlain

ABBYY FineReader Onlain поможет извлечь текст из PDF документов и изображений (jpg, jpeg, tif, tiff, bmp, png) и конвертировать его в форматы Word, Excel и Text. На бесплатном аккаунте в месяц сервис извлечет текст из 10 страниц документа. При платной подписке — есть три варианта от 3 190 до 17 790 рублей в год — от 2 до 10 тысяч страниц в год.

Пользоваться сервисом легко. Чтобы в нем работать, нужно зарегистрироваться или войти через свои аккаунты в Facebook, Google или Microsoft.

Загружайте на сервис файлы, из которых нужно извлечь текст, выбирайте язык и формат документа.

Нажимайте «Распознать». Когда сервис закончит извлекать и конвертировать текст, на экране появится список с файлами в текстовом формате. Кликайте на них, они автоматически загрузятся на компьютер.

Готово.

Сервис OnlineOCR.net

Бесплатный сервис Online OCR для распознавания текста в отсканированных PDF-документах (в том числе многостраничных файлов), факсах и фотографиях (jpg, tiff, bmp, gif). На выходе пользователь получает текст в форматах Word, Excel и Text. На сервисе сказано, что выходные документы имеют исходную структуру — таблицы, колонки и графические объекты.

Без регистрации бесплатно можно распознать 15 страниц в час. Регистрация дает доступ к дополнительным возможностям сервиса: конвертирование больших файлов, ZIP архивов и многостраничных PDF, выбор языков распознавания, больший выбор выходных форматов.

Открывайте OnlineOCR.net. Извлекать и конвертировать текст просто как в гостевом режиме, так и после регистрации. Схема действий идентичная.

Нажимайте «Файл» для загрузки документа. Выбирайте язык и выходной формат. Кликайте на «Конвертировать». Скачивайте готовый файл.

На фото ниже — пошаговая инструкция для работы на сервисе без регистрации.

После регистрации сначала выбирайте язык и выходной формат, после загружайте файл и нажимайте «Конвертировать».

У сервисов есть минус: если исходный файл не очень хорошего качества, то некоторые слова или фразы ни тот, ни другой сервис не распознают и выдадут их набором букв. Просмотрите документ и в случае необходимости подкорректируйте.

С помощью этой технологии были реализованы следующие проекты

Над материалом работала
Ольга Бердецкая

Иллюстрации:
скриншоты сервисов ABBYY FineReader Onlain и OnlineOCR.net.

Знаете похожие технологии? Расскажите о своем опыте, нам интересно!