Хотите распознать текст в документе PDF?
Поможет специализированная программа!
PDF Commander
PDF Commander — современный редактор PDF-документов от российского разработчика. Умеет напрямую взаимодействовать со сканерами. Функция OCR работает в том числе с графическими форматами — поддерживаются JPEG, TIFF, PNG, BMP и GIF. После сканирования и распознавания можно кадрировать страницу (например, чтобы удалить большие поля и другие пустые фрагменты), добавить нумерацию, текстовые блоки, иллюстрации и схемы. Есть функции для работы с подписями и штампами.
- Понятный и полностью русифицированный интерфейс.
- Подходит для обычных пользователей и организаций.
- Позволяет редактировать метаданные и защищать файлы.
- Может автоматически извлекать иллюстрации и тексты в отдельные файлы (пакетно или по отдельности).
- Доступен только под Windows.
ABBYY FineReader
ABBYY FineReader — программа оптического сканирования и распознавания текста с фото. Доступна под Windows и macOS. Прежде также разрабатывались версии для iOS и Android, но их поддержка заканчивается и скоро они будут удалены из магазинов приложений (им на смену пришла ABBYY Capture). В FineReader есть продвинутые инструменты редактирования. Они позволяют работать с текстами, накладывать водяные знаки, вставлять штампы, добавлять электронные формы и прочее. Приложение поддерживает математические и химические формулы, что упрощает обработку инженерных, учебных и научных материалов.
- Есть функция автоматического сравнения двух документов. С ее помощью проще найти и исправить ошибки, допущенные при OCR.
- Встроены словари для 198 языков (среди них есть даже несколько языков программирования, например С++ и Java).
- Может напрямую взаимодействовать с офисными пакетами MS Office, OpenOffice и LibreOffice.
- Относительно высокая стоимость — $69 в год за версию для Mac и от $99 в год за версию для Windows.
- Потребуется время, чтобы разобраться в основных инструментах приложения.
- ABBYY прекратила продажи для российских клиентов.
Adobe Acrobat Pro
Acrobat Pro — программа OCR для распознавания текста на изображении и в документах. После обработки материалы можно редактировать как в обычных офисных приложениях. При помощи специальной функции программа автоматически определяет фрагменты, которые предположительно распознались с ошибками. Они выделяются цветом и допущенные неточности можно устранить вручную. Также поддерживается работа с сертификатами, формами и подписями.
Обратите внимание! Существует бесплатная версия — Acrobat Reader. Она предназначена только для просмотра PDF-файлов. Все инструменты, которые так или иначе связаны с редактированием (OCR в том числе) в ней отключены.
- Есть инструмент для автоматического сравнения двух версий одного PDF-файла.
- Поддерживается многопользовательский доступ к документам с возможностью комментирования и совместного редактирования.
- Может конвертировать графические файлы, презентации, таблицы и текстовые документы в PDF и обратно
(например, из PDF в JPEG).
- Adobe приостановила продажу своих товаров и услуг пользователям, которые находятся на территории России.
- Достаточно большая цена на подписку — от $12,99 в месяц.
- Для обычных пользователей функционал избыточен.
VueScan
VueScan — программа распознавания текста со сканера. Оцифровывает материалы с заданными параметрами и сохраняет в выбранном формате. Содержит собственные драйверы устройств (всего поддерживается более 7100 моделей). Это полезно, если производитель прекратил поддержку вашего оборудования или для него в принципе никогда не выходило ПО под нужную вам ОС.
- Есть версии для всех актуальных десктопных платформ — Windows, Linux, macOS.
- Предусмотрены отдельные режимы для оцифровки бумажных материалов и пленок.
- Умеет автоматически устранять разные дефекты
и делать цветокоррекцию.
- В пробной версии накладывает водяной знак.
- Доступно только три формата — TIFF, JPEG, PDF.
- OCR предусмотрено только для самой дорогой лицензии — Professional Edition.
CuneiForm
CuneiForm — программа для распознавания текста в PDF. Также умеет взаимодействовать со сканерами. Разрабатывалась и выпускалась с начала 1990-х годов как коммерческое решение. Позже стала проектом с открытым исходным кодом и теперь распространяется бесплатно для всех пользователей.
- Поддерживает более 20 языков, включая русский.
- Понятный русифицированный интерфейс.
- Подходит для устаревших компьютеров и ОС.
- Много лет не обновляется и стабильно работает только под Linux и macOS. В актуальных версиях Windows может не запускаться или вылетать.
- Нет инструментов для редактирования.
- Скудный функционал.
DocuFreezer
DocuFreezer — программа для распознавания текста с картинки и из оцифрованных документов. Позиционируется разработчиком как конвертер файлов. В качестве конечных форматов, помимо PDF, поддерживает JPEG, TIFF, BMP, PNG и TXT. Исходные материалы могут в любом из десятков совместимых типов файлов (например, в HTML, EPUB, GUF, XML и других).
- Поддерживает пакетную обработку.
- Распознает 11 языков, включая русский.
- Простой интерфейс.
- Интерфейс переведен не полностью.
- В бесплатной версии накладывает вотермарк.
- Мало возможностей по редактированию (добавление водяного знака, кадрирование, поворот страниц).
Smallpdf
Smallpdf — онлайн-сервис и десктопная программа. Распознать текст из PDF в Word, развернуть лист, добавить подпись, сконвертировать один формат в другой — это лишь часть ее возможностей. Также доступны мобильные версии для iOS и Android. Они могут использовать камеру планшета или смартфона в качестве сканера.
- Удобный современный интерфейс.
- Есть простой редактор, в котором можно вставлять надписи, изображения, делать пометки и небольшие схемы.
- Предусмотрен инструмент для работы с подписями. Другим подписантам можно высылать приглашения на электронную почту.
- Не все разделы сайта переведены на русский.
- Относительно большая цена подписки — от $9 в месяц.
- Иногда некорректно обрабатывает русскоязычные тексты — в результате может получиться набор символов.
OnlineOCR.net
OnlineOCR.net — онлайн программа распознавания текста с ПДФ в Ворд и в другие форматы. Сервисом можно пользоваться без регистрации и бесплатно, но с некоторыми ограничениями, которые не критичны, для редких задач. При предварительной настройке можно указывать, какие листы нуждаются в обработке, и преобразовывать документ в черно-белую палитру (например, чтобы он занимал меньше места).
- Распознает тексты на 46 языках (в том числе русский).
- Можно загружать ZIP-архивы. Если в них находится несколько файлов, система обработает их все.
- Доступно 7 форматов для экспорта — PDF, TXT, XLS,
XLSX, DOC, DOCX, RTF.
- Без регистрации можно добавлять файлы с размером не более 15 МБ (после создания учетной записи — до 200 МБ).
- Не предусмотрены инструменты для редактирования.
- В течение часа бесплатно можно загружать
только 15 страниц.
CamScanner
CamScanner — мультиплатформенное приложение, которое может распознать текст с картинки, программа также позволяет конвертировать материалы в различные форматы. Поддерживаются JPEG, PPT, PDF, XLS, PNG и другие типы файлов.
- Можно синхронизировать с облачными дисками Google Drive, Dropbox и OneDrive и хранить в них материалы.
- После подписки (от $4,99 в месяц) открывается функционал переводчика с поддержкой свыше 60 языков.
- В мобильном приложении есть специальные режимы сканирования книг, лекционных досок и документов (паспортов, водительских удостоверений и т.п.).
- Десктопная и онлайн-версии не русифицированы.
- Для бесплатных аккаунтов OCR выполняется
с меньшей точностью. - Без подписки демонстрирует рекламу и вставляет вотермарки на результат.
Scannable
Scannable — мобильный сканер документов от создателей Evernote (популярного менеджера заметок). Автоматически определяет границы листов и устраняет различные искажения, например если камера телефона была направлена не совсем ровно.
- Не содержит встроенных покупок и не показывает рекламу.
- Понятный и простой интерфейс.
- Может синхронизироваться с аккаунтом Evernote.
- Доступен только на iPhone и iPad.
- Редко обновляется.
- Иногда некорректно взаимодействует с камерой — неправильно наводит фокус и устанавливает яркость, искажает цвета и прочее.
Заключение
Мы рассмотрели 10 приложений, которые помогут отсканировать, а затем распознать документы. Среди этих решений есть онлайн-сервисы и софт для десктопных и мобильных ОС. Хорошо реализованный и сбалансированный функционал предлагает PDF Commander. Большое число дополнительных инструментов (например, многопользовательский доступ, работу с формами, сравнение файлов и прочее) содержат FineReader и Acrobat Pro, но они больше не продаются в России. Среди ПО для смартфонов стоит обратить внимание на CamScanner. Из веб-сервисов выделяется DocuFreezer.
Оставьте ваш комментарий
Cохраните себе статью, чтобы не потерять: