- Файн ридер для линукса
- Системные требования
- Языки распознавания
- Поддерживаемые форматы изображений:
- Технологии FineReader для Linux
- Бесплатные аналоги ABBYY FineReader для Linux
- Сохранить ссылку
- Смотрите также
- Бесплатные аналоги ABBYY FineReader для Linux
- img2txt
- www.free-ocr.com
- Free Online OCR
- SimpleOCR
- ABBYY FineReader for Linux
- ABBYY Fine Reader Engine: теперь и для Linux
Файн ридер для линукса
Системные требования
ABBYY FineReader Engine требует наличия библиотеки glibc версии 2.11 и выше. Если необходим ABBYY FineReader Engine для более ранних версий glibc, свяжитесь с офисом ABBYY.
Для использования динамической библиотеки ABBYY FineReader Engine необходимы стандартные библиотеки libstdc++.so.6 и libgcc_s.so.1.
Работоспособность ABBYY FineReader Engine проверялась на следующих операционных системах:
- Fedora 25, 24, 23
- Red Hat Enterprise Linux 7.2, 6.8
- openSUSE 42.1
- SUSE Linux Enterprise Server 12 SP1, 11 SP1
- Debian GNU/Linux 8.7, 8.0
- Ubuntu 16.04.1 LTS, 15.10, 14.04.5 LTS, 12.04.5 LTS
- CentOS 7.1
ABBYY FineReader Engine был протестирован в следующих платформах облачных вычислений:
ABBYY FineReader Engine был протестирован в следующих виртуальных средах:
- Microsoft Hyper-V (only with software protection key)
- Oracle VM VirtualBox 3, 4 (Windows hosts only)
- VMware Server 2 (Windows hosts only)
- VMware ESXi 5
- Linux KVM/QEMU 2.0.0
Компания ABBYY также предоставляет услугу профессиональной адаптации ПО для других платформ.
ПК Intel® Pentium® или совместимый (с тактовой частотой 1 ГГц или выше) с поддержкой SSE и SSE 2.
- минимум 400 Мб (рекомендовано 1 Гб) для обработки одностраничных документов,
- минимум 1Гб Мб (рекомендовано 1,5 Гб) для обработки многостраничных документов.
Свободное место на диске: 800 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.
Языки распознавания
Ниже представлен список поддерживаемых языков распознавания в ABBYY FineReader Engine. Доступность этих языков распознавания зависит от наличия соответствующих модулей в файлах ABBYY FineReader Engine.
ABBYY FineReader Engine 11 распознает документы на 202 языках, включая:
- 47 основных языков с Латинскими, Кириллическими, Греческими или Армянскими символами, для которых FineReader Engine предоставляет словарную поддержку: Армянский (Западный, Восточный, Грабар), Башкирский, Болгарский, Каталанский, Хорватский, Чешский, Датский, Нидерландский (Нидерланды и Бельгия), Английский, Эстонский, Финский, Французский, Немецкий (новая и старая орфография), Греческий, Венгерский, Итальянский, Индонезийский, Латвийский, Литовский, Норвежский (Нюнорск и Букмол), Польский, Португальский (Португалия и Бразилияl), Румынский, Русский, Словацкий, Словенский, Испанский, Шведский, Татарский, Турецкий и Украинский.
- Японский и Корейский со словарной поддержкой.
- Тайский язык со словарной поддержкой.
- Иврит и Идиш со словарной поддержкой.
- Арабский со словарной поддержкой.
- Латинский, Азербайджанский (латиница), Русский (старая орфография) со словарной поддержкой
- 6 FineReader XIX языки со словарной поддержкой, для распознавания старых европейских документов 17-19 веков: Английский, Французский, Немецкий, Итальянский, Славянский и Испанский языки.
- 134 дополнительных языков с Латинскими, Кириллическими и Греческими символами: Абхазский, Аварский,Агульский, Адыгейский,Азербайджанский (Кириллица), Азербайджанский (Латиница), Аймара, Албанский, Алтайский, Африкаанс,Баскский, Белорусский, Бемба, Блэкфут, Бретонский, Буготу, Бурятский,Волоф, Гавайский, Гагаузский, Галисийский, Ганда, Гуарани, Гэльский (Шотландия), Дакота, Даргинский, Дунганский,Зулу. Ингушский, Ирландский, Исландский, Кабардинский, Казахский, Калмыцкий, Каракалпакский, Карачаево-Балкарский, Кашубский, Кечуа, Кикуйю, Киргизский, Конго, Корсиканский, Корякский, Коса, Кпелле, Кроу, Крымскотатарский, Кумыкский, Курдский, Лакский, Латинский, Лезгинский, Луба, Лужицкий, Майя, Македонский, Малагасийский, Малайский, Малинке, Мальтийский, Мансийский, Маори, Марийский, Минангкабау, Могавк, Молдавский, Монгольский, Мордовский, Мяо, Науатль, Немецкий (Люксембург), Ненецкий, Нивхский, Ногайский, Ньянджа, Оджибве, Окситанский (Провансальский), Осетинский, Папьяменто, Ретороманский, Руанда, Рунди, Саамский, Самоа, Сапотек, Свази, Себуанский, Селькупский, Сербский (Кириллица, Латиница), Сомали, Суахили, Сунданский, Суто, Табасаранский, Тагальский, Таджикский, Таити, Ток-Писин, Тонга, Тсвана, Тувинский, Туркменский (Кириллица, Латиница), Удмурский, Узбекский (Кириллица, Латиница), Уйгурский (Кириллица, Латиница), Уэльский, Фарерский, Фиджи, Фризский, Фриульский, Хакасский, Хани, Хантыйский, Хауса, Цзингпо, Цыганский, Чаморро, Чеченский, Чувашский, Чукотский, Шона, Эвенкийский, Эвенский, Эскимосский (Кириллица), Эскимосский (Латиница), Якутский
- Китайский традиционный и упрощенный.
- 4 искусственных языка: Эсперанто, Интерлингва, Идо и Окциденталь.
- 6 языков программирования: Basic, C/C++, COBOL, Fortran, JAVA и Pascal.
- Простые химические формулы.
- Цифры.
- Инструменты для создания языков, определяемых пользователями.
Поддерживаемые форматы изображений:
- PDF: файлы формата PDF (версия 1.7 или более ранние)
- BMP:
- 2-битный – несжатый черно-белый
- 4- и 8- битный – несжатый Palette
- 16- битный – несжатый Mask
- 24- битный – несжатый Palette and TrueColor
- 32- битный – несжатый Mask
- PCX, DCX:
- 2- битный – черно-белый
- 4- и 8- битный – градации серого
- TrueColor
- JPEG: серый, цветной
- JPEG 2000, part1: серый, цветной
- PNG: чёрно-белый, серый, цветной
- TIFF: чёрно-белый, серый, цветной, многостраничный. Способы сжатия: несжатый, CCITT Group 3, CCITT Group 3 FAX (2D), CCITT Group 4, PackBits, JPEG, ZIP
- GIF (только открытие): чёрно-белый, серый, цветной
- DjVu (только открытие): чёрно-белый, серый, цветной
- JBIG2: черно-белый
- WDP, WIC-совместимый (только открытие): чёрно-белый, серый, цветной
Внимание: ABBYY FineReader Engine поддерживает открытие изображений с разрешением не более 32512*32512 пикселей.
Источник
Технологии FineReader для Linux
Вы спрашивали: что ABBYY выпускает помимо всем известных FineReader и Lingvo? А на нашем форуме люди часто спрашивают: не планируем ли мы выпустить FineReader под Linux? Так вот, этот пост — ответ на оба этих вопроса! Файн под линукс уже давно существует в виде API и называется FineReader Engine. А совсем недавно мы выпустили новую, 9-ю версию энжина для линукс, которая ещё быстрее, ещё точнее распознаёт большее число языков. Подробнее о том, что такое FREngine и кому он нужен, написал Василий Панфёров — Руководитель отдела разработки технологических продуктов.
Главное отличие Engine от коробочного файна – в целевой аудитории. В этом продукте мы в основном ориентируемся на разработчиков программ, которым нужна надёжная функциональность по распознаванию и предобработке документов, страниц или просто кусочков текста в виде картинок (нет, FineReader Engine не распознаёт капчи 🙂 ).
И здесь Engine проявляет всю свою гибкость. Надо встроить в систему документооборота и сделать доступными для индексирования сканы документов? Пожалуйста. Хотите автоматическую сортировку бумажной почты? Легко! А можно даже встроить движок в какой-нибудь сканер, и тогда вам не надо будет задумываться, какой стороной поворачивать документ перед сканированием – к вам на почту придёт pdf в нужной ориентации, который вы потом сможете найти по ключевым словам.
Одним словом, если нужна какая-нибудь нетривиальная функциональность по обработке и распознаванию текста, то с FRE это будет сделать легко и удобно. Разработчик получает все возможности десктопного FineReader’a и даже больше.
А если хочется что-нибудь совсем простое и сразу работающее, то для этого у нас есть оболочка для командной строки. С ней вы можете преобразовать изображения в формат, который вам больше нравится, будь то pdf, простой txt-файл или форматированный rtf.
И как всегда, если у пользователя возникают вопросы, то наша служба технической поддержки не оставит ни один из них без ответа и объяснит, как пользоваться нашими продуктами самым эффективным образом.
Источник
Бесплатные аналоги ABBYY FineReader для Linux
Сохранить ссылку
Смотрите также
Бесплатные аналоги ABBYY FineReader для Linux
Используя бесплатный аналог ABBYY FineReader вы экономите 3590 рублей.
img2txt
img2txt — онлайн сервис по распознаванию текстов из отсканированных изображений. Сервис работает с английским, русским и украинским языками. Стоит отметить, что загружаемое изображение не должно содержать таблицы, изображения, диаграммы, а также превышать 4 Мб. Кроме того, оно должно быть представлено в одном из следующих форматов: jpg, jpeg, png. подробнее.
www.free-ocr.com
www.free-ocr.com — онлайн сервис для распознавания текста. Качество распознавания хорошее, даже при невысоком качестве изображения. Имеет ограничение на размер распознаваемого файла в 2 Mb. Поддерживает такие языки как: русский, английский, немецкий, французский, испанский, итальянский, чешский, датский, нидерландский, финский, греческий, норвежский, польский, португальский, шведский, турецкий, украинский. подробнее.
Free Online OCR
Free Online OCR — бесплатный онлайн сервис для распознавания текста. К достоинствам аналога ABBYY FineReader можно отнести хорошее качество распознавания текста; неограниченное количество загрузок; работа с 70 языками, в том числе русским; распознавание текста, содержащего сразу несколько языков; отсутствие регистрации. Free Online OCR предоставляет возможность выделять, а также разворачивать часть документа, предназначенную для дальнейшей обработки. Распознает следующие форматы: JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM и PCX. Работает с такими форматами сжатия как Unix compress, bzip2, bzip и gzip; со следующими мультистраничными документами: TIFF, PDF и DjVu. Распознает файлы DOCX и ODT с изображениями. Работает с ZIP архивами. Результат может быть получен в виде простого текста (TXT), документа Microsoft Word (DOC) и PDF-файла Adobe Acrobat. подробнее.
SimpleOCR
SimpleOCR — бесплатное приложение для распознавания текста. Умеет распознавать рукописный текст. Поддерживаемые языки: английский, голландский, французский. Умеет читать изображения со сканера. подробнее.
Источник
ABBYY FineReader for Linux
Коммерческая система оптического распознавания.
FineReader — система оптического распознавания символов разрабатываемая российской компанией ABBYY.
ABBYY FineReader for Linux — коммерческое приложение для конвертирования сканированных изображений документов или PDF файлов в редактируемые электронные форматы.
ABBYY FineReader for Linux консольная утилита распознавания и » движок » (набор подключаемых библиотек) распознавания для встраивания в различные корпоративные системы документооборота и др.
ABBYY FineReader for Linux использует интеллектуальную систему оптического распознавания OCR (Optical Character Recognition) и собственную технологию распознавания позволяющую точно распознавать документы и точно воссоздать документы со сложным форматированием.
Полная версия ABBYY FineReader for Linux стоит около 150€, но на сайте проекта имеется так же и демоверсия позволяющая распознать 100 страниц (после регистрации на сайте и получения серийного номера для демоверсии) . Установка ABBYY FineReader for Linux сводится к запуску (от администратора / root) бинарного файла (./abbyyocr.bin) из архива скачанного с сайта проекта и введение во время установки серийного номера.
ABBYY FineReader for Linux поддерживает распознавание текста (полное и частичное) на более чем двухстах языках. Имеет множество опций командной строки для гибкой настройки параметров распознавания.
Для сохранения результатов распознавания в ABBYY FineReader for Linux используются коммерческие (проприетарные) ыорматы хранения текстовых документов, основной формат сохранения RTF (Rich Text Format) .
Команда для запуска распознавания выглядит так:
ABBYY FineReader for Linux имеет встроенную справочную систему, в HTML формате на английском языке, содержащей описание, и сведения о лицензировании и активации.
Лицензия: Коммерческая (проприетарная) + триальная демоверсия
Источник
ABBYY Fine Reader Engine: теперь и для Linux
Дополнительно доступно большое количество модулей, включая экспорт в PDF и XML, распознавание рукописного текста, меток, двумерных штрих-кодов, распознавание китайского и японского языков. Модуль FineReader XIX позволяет осуществлять распознавание староевропейских документов на пяти европейских языках (английский, немецкий, французский, испанский, итальянский) с фрактурными шрифтами прошлого столетия, популярными в Германии и Испании.
FineReader Engine имеет две специальные технологии, направленные на решение задачи, связанной с распознаванием документов с текстом, напечатанным поверх картинки, с цветным текстом на цветном фоне, с низкой контрастностью: адаптивная бинаризация (преобразование исходного изображения в черно-белое) и интеллектуальные алгоритмы фильтрации текстур. Интеллектуальные алгоритмы фильтрации текстур позволяют эффективно отделять текст от фона в процессе бинаризации. Метод адаптивной бинаризации позволяет на каждом фрагменте изображения размером в слово подбирать индивидуальные параметры яркости.
Система ABBYY FineReader поддерживает распознавание символов, написанных шрифтами OCR-A, OCR-B и MICR (E13B), которые часто используются на различных финансовых документах, паспортах, кредитных карточках.
Помимо этого, ABBYY FineReader Engine обладает следующими особенностями:
- Режим ускоренного распознавания специально разработан для потокового ввода документов, где точность распознавания не играет основной роли. В этом режиме скорость ввода в среднем возрастает в 2-2,5 раза.
- Сохранение исходного оформления документа при передаче результатов распознавания в форматы RTF, PDF и HTML.
- Автоматическое определение ориентации страницы, расположения текстовых блоков, таблиц и картинок, а также ориентации вертикального текста в таблицах.
- Возможность манипулирования/редактирования блоков (удаление)
- Сохранение результатов распознавания во множество форматов для Windows: RTF, PDF, XML, HTML, PPT, XLS, TXT, CSV и DBF; для LINUX: RTF, PDF, HTML, TXT и CSV.
- Различные режимы и уровни сохранения форматирования от «простого текста» без какого-либо форматирования до полного сохранения форматирования, включая таблицы, абзацы, разбиение на колонки, сохранение типов и начертаний шрифта, обрамлений и т.д.
ABBYY предлагает гибкую систему лицензирования: для разработчиков и для использования/распространения. Цена лицензии на комплект для разработчика фиксированная – $4500 для Windows и $9000 для Linux. Цена на дополнительный комплект распознавания китайского и японского языков – $2200. Цены на лицензии для использования/распространения полностью зависят от сложности проекта, объема предполагаемой обрабатываемой документации и могут варьироваться от нескольких долларов до нескольких десятков тысяч долларов.
Источник