Программы для распознавания текста
В этой статье мы собрали 8 лучших программ распознавания текста с изображений и отсканированных документов. Они с легкостью переведут pdf, jpg, png или «бумажный файл» в редактируемый формат для Word и прочих офисных приложений.
Общие сведения:
Функции сканирования распознавания:
Дополнительные возможности:
Программа ABBYY FineReader – признанный флагман отрасли и лидер по количеству и качеству задействованных технологий оптического распознавания, сжатия и перевода. Приложение работает со сканером, поддерживает формат изображений jpg, jpeg, png, gif, bmp, переводит pdf в Word, Excell и даже упаковывает свежие сканы в редактируемую ПДФ-ку, HTML страницу. У него всего два недостатка – это стоимость и системные требования. В остальном, равных Файн Ридеру просто нет.
Преимущества продукта ABBYY FineReader:
- Работа с большим количеством разнообразных источников текста;
- Практически неограниченное количество языков распознавания (больше 170);
- Встроенная проверка правописания;
- Способность сжимать оригинальные файлы изображений без видимой потери качества;
- Поддерживается распознавание многостраничных документов;
- В пробной версии полностью функциональна.
OCR CuneiForm, пожалуй, лучшая бесплатная программа – аналог FineReader. Она менее требовательна, менее сложна, но и не столь развита. Это простая, удобная утилита захвата текста с интуитивно понятным интерфейсом и приятным внешним видом. Умеет сканировать документ в Microsoft Word или другое приложение из офисного пакета, обрабатывать сразу несколько файлов форматов jpeg, tiff и т.д., проверять редактируемый текст на ошибки. Лучшего бесплатного решения для дома просто нет.
Особенности OCR CuneiForm:
- Работает как программа сканирования и распознавания текста (в любом из режимов);
- Хорошая реализация оптического распознавания символов, низкий процент брака;
- Программа поддерживает небольшое количество языков (около 20), включая русский;
- Текст сразу готов для последующего редактирования, ведь передается в офисное приложение;
- Отлично «отсеивает» текст на изображении от пятен, образовавшихся в процессе ксерокопирования.
Readiris Pro – чрезвычайно мощная, но и недешевая программа распознавания текста со сканера, документа pdf, djvu, tiff, jpeg. Единственная среди аналогов включает интеллектуальную систему распознавания отсканированного бумажного документа (рукописного текста), причем, выполняет подобную работу на качественно высоком уровне. Конечно, если вы не собираетесь «скармливать» приложению изображение текста с назначения лечащего врача. Каллиграфически верный почерк воспринимается хорошо, украинский и русский поддерживаются.
Характеристики приложения Readiris:
- Хорошее качество распознавания на 100+ языках, включая таблицы и рукописные документы;
- Возможность извлечь текст с картинки в разных форматах, из электронной книги djvu;
- Полученный текст можно экспортировать не только в Microsoft Office Word, Excel, но и PDF, OpenOffice, XPS;
- Инструмент компрессии сжимает изображения со сканера в 200 раз без потерь;
- Программа платная, но простая в использовании – все действия выполняют в 2 клика.
Freemore OCR, как и другие бесплатные программы распознавания текста, не блещет количеством функций, но и не требует от вас приобретения дорогостоящей подписки. Согласно заявленным характеристикам, технология Side-by-Side помогает приложению отлично отделять картинки от символов, чтобы не захватывать лишние блоки. Утилита сохраняет распознанные документы текстовом формате doc, txt или pdf. Разработчики особо акцентируют внимание на отсутствии необходимости установки редакторов ПДФ от Adobe, мол, все нужные функции уже включены.
Особенности Freemore OCR:
- Позволяет распознать документ, pdf, изображение почти всех поддерживаемых форматов;
- Отсутствует полноценный захват русского текста, только латиница;
- Меню программы простое и понятное, для работы не нужны знания английского;
- Заявлены полезные «бизнес» функции – шифрование пдф, добавление водяного знака;
- Программное обеспечение часто обновляется с официального сайта.
ABBYY Screenshot Reader - программа распознавания текста со скриншотов! Работает по следующему принципу: вы нажимаете комбинацию клавиш, захватываете необходимую область экрана, ждете несколько секунд и сохраняете полученный результат в виде текста из окна утилиты в любой редактор через буфер обмена. Интерфейса обмена данными здесь нет, зато есть переводчик, словарь и другие приятные фишки от ABBYY.
Преимущества и недостатки Screenshot Reader:
- Использует минимум ресурсов, срабатывает моментально;
- Не требует запуска с рабочего стола, если вы выполните необходимые настройки горячих клавиш;
- Может распознать текст с любого открытого на вашем компьютере файла или защищенной веб-страницы;
- Интегрированы функции перевода и проверки орфографии;
- Здесь не получится открыть файл – только захват области экрана в ручном режиме;
- Пакетная обработка также отсутствует, устройство считывания не подключается;
- Чтобы сохранить полученные данные в редактор, нужно скопировать их вручную.
Мы бы не рекомендовали использовать Adobe Acrobat как полноценный сервис распознания текста, но если пакет уже установлен на ПК, а вам нужно позарез сейчас выполнить работу, он может достойно справиться с поставленной задачей. О том, как активировать функцию, читайте в онлайн-справке Adobe. Справится с ней легко, но вы должны понимать, что на выходе получите не полноценный текстовый документ, а редактируемый pdf, содержимое которого можно импортировать в Блокнот и Word.
Характеристики Adobe Acrobat Pro DC:
- Представляет собой пакет для создания и редактирования pdf;
- Включает функцию импорта с внешних устройств;
- Предлагает большое количество профильных возможностей, например, загрузку файлов в облако Creative Cloud (аналог Google Диск для продуктов Adobe);
- Утилита полностью совместима со всеми новыми версиями ОС Windows.
Scanitto Pro - программа для распознания текста с ксерокопии. Представляет собой альтернативный интерфейс сканера с опцией захвата текста для импорта в стандартный форматы редакторов. Позволяет выделять, разворачивать элементы на странице, помечать фрагменты, которые требуется распознать.
Особенности Scanitto Pro:
- Распознание по любому выбранному языку из 7 интегрированных (включая русский);
- Множество форматов экспорта готового материала;
- Удобный интерфейс работы с подключаемыми устройствами;
- Высокая скорость ответов на запросы, низкие требования к ПК;
- Недорогая лицензия.
RiDoc, возможно, не самый функциональный продукт из представленных, но он явно лучше любого free online ocr (онлайн сервиса бесплатного распознания). У приложения много собственных интересных «фишек» - каталогизатор документов, инструментарий наложения водяных знаков, собственный виртуальный принтер, сохранение пресетов для качественного распознавания в пакетном режиме. Но в некоторых случаях возможностей РиДока явно мало.
Полезные функции RiDoc:
- Собственный интерфейс обмена с внешним считывающим устройством;
- Наложение водяных знаков, цифровой подписи, создание ключа шифрования;
- Создание одинаковых настроек распознания для неограниченного количества страниц;
- Экспорт результата в MS Word, bmp, jpeg, tiff, png и, конечно, pdf.
Использую OCR CuneiForm. Она не сказать что прямо самая крутая, но зато бесплатная. Никакой мороки с кряками и серийниками не нужно. Поставил и пользуешься когда надо.
Тоже OCR CuneiForm пробовал, неплохо работает. Но побольше функций при хорошем интерфейсе вы найдете в ABBYY FineReader. Распознаёт фактически любые шрифты, порадовал встроенный переводчик, в нём точно больше сотни языков определяется.