Capture2Text: обзор на OCR-программу



На любых изображениях нельзя копировать и редактировать тексты. Проблема особенно актуальна для фотографий страниц и отсканированных документов. Вручную перепечатывать их содержание — слишком долго и сложно. К счастью, задачу можно автоматизировать при помощи специального программного обеспечения с технологией OCR (Optical Character Recognition или оптического распознавания символов).
OCR изучает изображение, находит визуальные образы, которые похожи на надписи, и заменяет их на печатный текст. Распознавание выполняется по словарям, встроенным в софт. Если страница содержит другой язык или набор символов (например, химические или математические формулы), приложение не сможет ее корректно обработать.
Инструменты OCR реализованы в том числе в Capture 2 Text. Программа позволяет:
Capture to Text не подходит для полноценной работы с документами, книгами и другими материалами. С помощью этой программы неудобно извлекать данные из нескольких страниц. В дальнейшем не получится настроить форматирование и сохранить результат в формате, в котором оно не будет утрачено.
Перечисленных недостатков нет в приложении PDF Commander. Оно поддерживает распознавание на более чем 100 языках, в число которых входит и русский. За раз можно обрабатывать любое количество страниц. Редактор включен в Реестр российского ПО, умеет напрямую взаимодействовать со сканерами и принтерами, позволяет создавать любое форматирование.
Оставьте ваш комментарий