- Djvu shell extension pack для windows 10
- Shell Extensions — подборка компонентов для отображения эскизов в Windows
- SageThumbs — просмотр различных форматов изображений
- Icaros Shell Extensions — настройка отображения эскизов мультимедийных файлов, книг и комиксов
- FB2 Thumbnails Provider — просмотр эскизов электронных книг формата FictionBook
- Djvu shell extension pack для windows 10
- DjVu Viewer Extension for Google Chrome
- Document Express Desktop Evaluation Edition
- Document Express Enterprise Evaluation Edition
- DjVu Shell Extension Pack
- Cuminas DjVu SDK for C/C++ Evaluation Edition
- Cuminas DjVu SDK for .NET Evaluation Edition
- DjVu Reader
- Как просматривать djvu файлы?
- Особенности DjVu Reader
- Список возможностей
- Преимущества
- Недостатки
- Djvu shell extension pack для windows 10
- Базовый набор софта для DjVu-книгосканирования
- Небольшой FAQ по DjVu-программам (Часто Задаваемые Вопросы):
- 1. Что это за формат такой — «DjVu»? Зачем он? Что он из себя представляет?
- 2. Как именно пользоваться форматом DjVu?
- 3. Какой программой кодировать файлы в формат DjVu (OC Windows)?
- 4. Какой программой декодировать DjVu-файлы в обычные графические файлы (OC Windows)?
- 5. Как декодировать один многостраничный DjVu-файл во множество одностраничных (обычных) графических файлов?
- 6. Как собрать многостраничный DjVu-файл из множества одностраничных DjVu-файлов?
- 7. Как добавить одностраничный DjVu-файл в имеющийся многостраничный DjVu-файл?
- 8. Чем просматривать DjVu-файлы (OC Windows)?
- 9. Как напрямую переконвертировать Pdf-файл в DjVu-файл (Pdf -> DjVu)?
- 10. Как напрямую переконвертировать DjVu-файл в Pdf-файл?
- 11. Как напрямую переконвертировать DjVu-файл в Word’овский Doc-файл?
- 12. Что делать, если при открытии DjVu-файла в программе DjVuSolo v3.1 NonComm она выдаёт сообщение: «DjVu Decoder: Cannot decode DjVu files with version >=25»?
- 13. Имеют ли DjVu-файлы встроенный текстовый OCR-слой?
- 14. Зачем вставлять текстовый OCR-слой в DjVu-файл?
- 15. Как разобрать многостраничный DjVu-файл на одностраничные DjVu-файлы?
- 16. Что делать, если у меня ни один DjVu-просмотрщик не работает?
- 17. Почему не следует использовать один большой словарь на всю книгу при кодировании в DjVu?
- 18. Как распечатать файл формата DjVu?
- 19. Как напрямую преобразовать Word’овский Doc-файл в файл формата DjVu?
- 20. Как закодировать множество одностраничных графических файлов в соответствующее множество одностраничных DjVu-файлов?
- 21. Как закодировать в DjVu цветные журналы?
- 22. Как осуществлять полнотекстовый поиск по страницам множества DjVu-книг?
- Копирайт и электронные библиотеки
Djvu shell extension pack для windows 10
You are using an outdated browser. Please upgrade your browser or activate Google Chrome Frame to improve your experience.
Have any questions? Just call us 1-800-246-7725
DjVu Browser Plug-in
The DjVu Browser Plug-in is the primary means of viewing DjVu documents. It runs inside most modern browsers such as Internet Explorer, Firefox and Safari.
Document Express Desktop Evaluation Edition
Document Express with DjVu Desktop Edition is the solution for Desktop, low-volume DjVu-conversion needs. It includes Document Express Editor scanning/editing application and the Virtual Printer.
You can evaluate the software for 7 days from installation.
DjVu Shell Extension Pack
DjVu Shell Extension Pack is an extension package for Windows, which enables you to take advantages of DjVu’s various features.
- You can see DjVu thumbnails on Windows Explorer.
- You can search DjVu files using Windows Search.
- You can see DjVu preview on Windows Explorer and Microsoft Outlook.
- You can see/edit DjVu metadata on Windows Explorer.
- You can see DjVu files using Windows Photo Gallery, Windows Live Photo Gallery and any .NET Framework 3.0/Windows Imaging Codec based applications.
The package contains IFilter, WIC codec and Property Store.
Cuminas DjVu SDK Evaluation Edition
Cuminas DjVu SDK allows you to develop any applications which encode/decode/edit DjVu files. SDK come with comprehensive documentation and various examples.
The applications you built with the SDK work for 15 days from the day of build without any limitations so that you can start application development before paying loyality to us.
Document Express Enterprise Evaluation Edition
Document Express with DjVu Enterprise Edition is the solution for high-volume batch DjVu-conversion needs. It includes Workflow Manager watchfolder application, Configuration Manager and the Virtual Printer scripting tools.
You can evaluate the software for 7 days from installation.
Shell Extensions — подборка компонентов для отображения эскизов в Windows
Shell Extensions — компоненты, позволяющие интегрироваться в оболочку операционной системы Windows .
В данной подборке рассматриваются компоненты для отображения миниатюр изображений различных типов файлов. При помощи них можно наглядно определять нужный файл без его открытия. Если в проводнике настроено отображение эскизов, вы сможете увидеть обложки различных электронных книг ( Electronic Publication EPUB, FictionBook FB2), комиксов ( Comic Book Archive CBR, CBZ), фотографии с iPhone (HEIC), множество форматов изображений, эскизы для мультимедийных файлов — видео и аудио.
SageThumbs — просмотр различных форматов изображений
SageThumbs представляет собой расширение оболочки, позволяющее просматривать огромное количество форматов изображений непосредственно в проводнике Windows с помощью библиотеки GFL от создателя XnView . Программа поможет конвертировать изображения в различные форматы (JPG, BMP, PNG, GIF). Кроме того SageThumbs дает возможность установить картинку в качестве фона рабочего стола, скопировать изображения в буфер обмена или отправить по почте.
Возможности SageThumbs:
- расширенный просмотр миниатюрных изображений;
- миниатюра изображения в контекстном меню проводника;
- расширенная информация о файле;
- поддержка 162 форматов изображений, (224 расширения) через библиотеку GFL;
- поддержка дополнительных 26 форматов изображений посредством плагинов XnView ;
- преобразование изображения в другие форматы;
- поддержка смены обоев рабочего стола;
- отправка файлов по почте;
- поддержка копирования в буфер обмена.
Расширение можно скачать с сайта автора .
Icaros Shell Extensions — настройка отображения эскизов мультимедийных файлов, книг и комиксов
Icaros Shell Extensions позволяет настроить отображение эскизов видео, книг, комиксов в проводнике Windows и добавляет в него удобную панель со свойствами мультимедийных файлов (продолжительность, разрешение и информацию об исполнителе). Данная утилита способна отображать эскизы практически любого формата видео, поддерживающего FFmpeg . Благодаря данному расширению вы сможете включить эскизы для огромного количества форматов. Список форматов можно настроить и расширить самостоятельно, например так:
Icaros Shell Extensions может исключать добавление в превью черного или белого кадров, добавлять на эскиз значок с обозначением формата и включать эффект перфорации. Также поддерживается ряд музыкальных форматов, в случае с музыкой роль эскиза будет выполнять обложка или любой другой графический файл, который лежит в папке с композициями. В отдельном разделе панели управления можно включить кэширование эскизов, установить максимальный и минимальный размер кэша. Панель управления служит для настройки всех параметров и позволяет включать/отключать интеграцию с проводником Windows . В любой момент можно вернуть стандартные эскизы файлов, отключить кэширование и отображение свойств файла. В случае удаления Icaros Shell Extensions с компьютера, она не оставит после себя каких-либо следов и отменит все внесенные изменения.
Новую версию программы можно получить с официального форума .
FB2 Thumbnails Provider — просмотр эскизов электронных книг формата FictionBook
Расширение оболочки FB2 Thumbnails Provider предназначено для предварительного просмотра миниатюр книг в формате FB2 , совместимо с 32 и 64-битной версией Windows .
Скачать можно с GitHub-репозитория автора расширения.
Djvu shell extension pack для windows 10
The DjVu Browser Plug-in is the primary means of viewing DjVu documents. It runs on Internet Explorer.
DjVu Viewer Extension for Google Chrome
This is yet another DjVu Viewer for Google Chrome. It runs on Windows, OS X, Linux, and Chrome OS.
Document Express Desktop Evaluation Edition
Document Express with DjVu Desktop Edition is the solution for Desktop, low-volume DjVu-conversion needs. It includes Document Express Editor scanning/editing application and the Virtual Printer.
You can evaluate the software for 7 days from installation.
Document Express Enterprise Evaluation Edition
Document Express with DjVu Enterprise Edition is the solution for high-volume batch DjVu-conversion needs. It includes Workflow Manager watchfolder application, Configuration Manager and the Virtual Printer scripting tools.
You can evaluate the software for 7 days from installation.
DjVu Shell Extension Pack
DjVu Shell Extension Pack is an extension package for Windows, which enables you to take advantages of DjVu’s various features.
- You can see DjVu thumbnails on Windows Explorer.
- You can search DjVu files using Windows Search.
- You can see DjVu preview on Windows Explorer and Microsoft Outlook.
- You can see/edit DjVu metadata on Windows Explorer.
- You can see DjVu files using Windows Photo Gallery, Windows Live Photo Gallery and any .NET Framework 3.0/Windows Imaging Codec based applications.
The package contains IFilter, WIC codec and Property Store.
Cuminas DjVu SDK for C/C++ Evaluation Edition
Cuminas DjVu SDK allows you to develop any applications which encode/decode/edit DjVu files. SDK come with comprehensive documentation and various examples.
The applications you built with the SDK work for 15 days from the day of build without any limitations so that you can start application development before paying loyality to us.
Cuminas DjVu SDK for .NET Evaluation Edition
Cuminas DjVu SDK allows you to develop any applications which encode/decode/edit DjVu files. SDK come with comprehensive documentation and various examples.
The applications you built with the SDK work for 15 days from the day of build without any limitations so that you can start application development before paying loyality to us.
DjVu Reader
DjVu Reader – это одна из первых программ для просмотра файлов в формате «.djvu». В этом формате хранятся электронные копии реальных бумажных книг, сделанные на сканере. Таким способом оцифровывают научную и техническую литературу, методические пособия для студентов и редкие издания художественных произведений. Программа создана для удобного чтения таких копий на компьютере.
Интерфейс у DjVu Reader состоит из блоков. Значки на панелях инструментов сгруппированы по функциям, которые они выполняют. Любой блок можно отключить или переместить в другое место, с верхней панели на нижнюю, к примеру. Таким образом внешний вид читалки настраивается под индивидуальные предпочтения пользователя. Настройки расположения окон и кнопок сохраняются после перезапуска.
Как просматривать djvu файлы?
Запустите DjVu Reader и нажмите на клавиатуре сочетание клавиш CTRL+O. В открывшемся окне перейдите в папку с электронными книгами на вашем компьютере, выберите и откройте ту, которая нужна.
В следующий раз ее можно будет быстро открыть через меню на верхней панели. Там сохраняется список ранее открываемых файлов.
Где брать djvu файлы? В интернете. Наберите в Яндексе или в Google название интересующей книги/документа, добавив в конце название формата и слово «скачать». Смотрите пример.
Особенности DjVu Reader
«Дежавю Ридер» – это портативная программа, не требующая установки. После того, как скачаете архив с файлами читалки, распакуйте его в новую папку в корне системного жесткого диска или на флешку. Для запуска кликните левой кнопкой мыши по файлу с расширением «EXE». Чтобы каждый раз не запускать программу через папку, отправьте на рабочий стол ярлык для исполняемого файла.
Список возможностей
- открытие цветных и черно-белых книг в формате djvu без ограничений на размер файла и количество страниц;
- настройка масштаба отображения по ширине и высоте окна программы. Поддерживается выставление произвольного значения масштабирования в процентах;
- коррекция отображения страниц. Меняется яркость от -255 до +255 и контрастность от -100 до +100;
- предпросмотр всех страниц открытого файла в виде маленьких эскизов;
- поддержка оглавлений с кликабельными ссылками – для быстрого перемещения по книге;
- 4 режима просмотра – постраничный (включен по умолчанию), в виде альбома, книги или буклета;
- вывод технической информации об открытом файле – качество в dpi, размер в байтах, ширина и высота оригинальной страницы пикселях.
Преимущества
- Удобная навигация по книгам стрелками на верхней панели или кнопками Page Up / Page Down на клавиатуре;
- Поддерживается копирование изображений и текста на страницах в буфер обмена. Скопированная таким образом информация может быть вставлена в любой текстовый редактор;
- Одновременное открытие нескольких книг во вкладках.
Недостатки
- Не поддерживается перелистывание страниц скроллом мышки, нет режима отображения книги в виде непрерывной прокручиваемой ленты соединённых между собой страниц.
На сайте DjVuReader2.ru вы всегда можете скачать DjVu Reader бесплатно на русском языке для компьютера или телефона по ссылкам ниже. Также, по просьбам пользователей добавили ссылку на альтернативную читалку WinDjView.
Djvu shell extension pack для windows 10
Меня часто спрашивают: «Какие именно программы для создания электронных версий бумажных книг в формате DjVu лучше всего скачать с сайта?»
Я составил небольшой и тщательно отобранный список, в который вошли самые действительно нужные, полезные, и по-настоящему популярные программы по теме (на мой личный взгляд, естественно). Всё это рекомендуется скачать (кряки не нужны).
Кстати, я хотел бы обратить Ваше внимание на тот факт, что до сих пор не существует общепринятого, краткого и удобного термина для обозначения понятия «Создание электронных версий бумажных книг в формате DjVu» (хотя потребность в таком термине существует уже давно). За неимением лучшего я предлагаю временно использовать для этой цели термин «DjVu-книгосканирование» (возможно, не самый удачный — надеюсь, кто-нибудь придумает что-то получше).
На сегодняшний день усилиями многих людей создан некоторый базовый набор программ для DjVu-книгосканирования.
Важная особенность : Навсегда в прошлое ушли те времена, когда для DjVu-книгосканирования нужно было скачивать из Интернета какие-то гигантские программные пакеты размером в десятки, а то и в сотни мегабайт. Теперь весь действительно нужный софт имеет малый размер — обычно — 1-2 МБ, иногда 5-6 МБ, и в редких случаях — 10-12 МБ. Это сделано специально — для того, чтобы такой софт реально было распространять через Интернет и чтобы он был доступен даже для тех, кто сидит на простом модеме.
Приведённый ниже базовый список программ является полностью достаточным для целей DjVu-книгосканирования.
Базовый набор софта для DjVu-книгосканирования
Рус.
Есть
Рус.
Document Express Editor v6.0.1 Build 1320 LE 9x (Light Edition for 9x)
1,16 МБ
Рус.
Новое:
— Редактирование дерева-оглавления.
— Работа с новыми аннотациями: Text и Line.
— Работа с двойными сканами.
Нет
Есть
Есть
eu_sh [at] mail.ru
Нет
Нет
Нет
Нет
Скопируйте файл djvu.dll в /IrfanView/Plugins.
Рус.
Есть
Есть
Есть
Автор инсталлятора: namchik.
Нет
Есть
Исходники (73 КБ) для MSVC++ 6.
Небольшой FAQ по DjVu-программам (Часто Задаваемые Вопросы):
1. Что это за формат такой — «DjVu»? Зачем он? Что он из себя представляет?
DjVu («Дежавю») — это графический формат. То есть DjVu-файлы — это просто «картинки». Основное полезное свойство формата DjVu состоит в том, что он умеет наиболее хорошо (по сравнению со всеми остальными графическими форматами) «сжимать» сканированные изображения страниц бумажных книг — из-за чего этот формат широко применяется для создания электронных версий бумажных книг. Более подробную информацию о формате DjVu смотрите на главной странице сайта.
2. Как именно пользоваться форматом DjVu?
Как правило, это делается так: сначала необходимо каким-либо способом получить обычные графические файлы — «картинки» — содержащие изображения страниц бумажных книг. Обычно их получают путём сканирования бумажных книг. Потом эти обычные графические файлы кодируют в формат DjVu, отчего их размер сильно уменьшается — без потери качества изображения текста. Полученный DjVu-файл используется как электронная книга: его можно читать с экрана монитора, можно обмениваться друг с другом такими самодельными файлами через Интернет, можно распечатывать на принтере.
Но вообще-то закодировать в формат DjVu можно и текстовый файл (посредством виртуального DjVu-принтера) — только вряд ли это имеет смысл — текстовый файл всегда занимает гораздо меньший размер, чем любой соответствующий ему графический файл.
3. Какой программой кодировать файлы в формат DjVu (OC Windows)?
Используйте DjVu Small. Эта программа использует «фирменные» консольные утилиты от LizardTech — поэтому она ничем не хуже оригинального пакета LizardTech Document Express Enterpise with DjVu 5.1. Зато DjVu Small более удобна в работе и имеет маленький размер.
Кроме того, для этой цели можно использовать программы: LizardTech Document Express Enterpise with DjVu 5.1 (DEE 5.1), LizardTech Document Express Enterpise with DjVu 5.1 Light Edition (DEE 5.1 LE), Document Express Editor (5 или 6 версии), DjVu Solo 3.1. Однако все эти программы по разным причинам менее предпочтительны (либо они огромного размера, что затрудняет скачивание, либо крайне неудобны для пакетного кодирования).
4. Какой программой декодировать DjVu-файлы в обычные графические файлы (OC Windows)?
Используйте DjVu OCR 2 или выше. Это единственная программа, которая не даёт сбой при декодировании, если в многостраничном DjVu-файле некоторые «страницы» повреждены.
Кроме того, для этой цели можно использовать программы: DjVu Small, Irfan View + Irfan View DjVu Plugin v3.95 или выше, и любой обычный виртуальный принтер. Однако все эти программы по разным причинам менее предпочтительны (или это вероятность сбоя, или относительная сложность настройки).
5. Как декодировать один многостраничный DjVu-файл во множество одностраничных (обычных) графических файлов?
Используйте DjVu OCR 2 или выше. Он принимает на входе один многостраничный файл и декодирует его во множество одностраничных простых графических файлов.
Кстати — это вообще один из практических приёмов работы с форматом DjVu — преимущественная работа с многостраничными файлами. Если мы, работая с обычными графическими файлами, стараемся иметь дело в основном с одностраничными файлами (хотя бывают и многостраничные простые графические файлы), то в случае DjVu — наоборот — все стараются иметь дело с одним многостраничным DjVu-файлом, нежели чем с множеством составляющих его одностраничных DjVu-файлов. Это объясняется тем фактом, что обычные графические файлы мы можем редактировать, а DjVu-файлы — нет, а можем только просматривать их и декодировать в обычные файлы.
Поэтому Вы даже не сможете напрямую преобразовать множество одностраничных DjVu-файлов в соответствующее ему множество простых одностраничных графических файлов — Вам потребуется сначала собрать имеющееся множество одностраничных DjVu-файлов в один многостраничный DjVu-файл, и только потом декодировать его в желаемое множество простых одностраничных графических файлов — это политика LizardTech (судя по DEE 5.1) — поэтому она реализована также и в DjVu Small.
Добавлено 28.02.2011: На сегодняшний день наиболее рекомендованная программа для декодирования DjVu — это MiniDjVu Plus v1.3 (893 КБ). Пока что это единственная программа, которая при декодировании «битых» страниц многостраничного DjVu-файла (а также пустых белых) создаёт чистые белые листы (а все остальные программы в лучшем случае просто пропускают такие DjVu-страницы при декодировании). В дальнейшем такой функционал планируется добавить в DjVu Small.
6. Как собрать многостраничный DjVu-файл из множества одностраничных DjVu-файлов?
Используйте Document Express Editor v5.0.0 Build 16 plus (без OCR и справки). Откройте в нём первый в последовательности одностраничный DjVu-файл, затем выберите в меню Edit -> Insert Page(s) After. выберите в появившемся окне все остальные одностраничные DjVu-файлы из данной последовательности, и сохраните полученный многостраничный файл.
7. Как добавить одностраничный DjVu-файл в имеющийся многостраничный DjVu-файл?
См. предыдущий вопрос — нужно проделать точно такие же действия, только добавлять надо не множество, а один данный одностраничный DjVu-файл.
8. Чем просматривать DjVu-файлы (OC Windows)?
Используйте WinDjView. Это наилучший выбор — данная программа превосходит все прочие DjVu-просмотрщики — и даже «фирменный» броузерный DjVu-плагин от LizardTech.
9. Как напрямую переконвертировать Pdf-файл в DjVu-файл (Pdf -> DjVu)?
Для именно прямой конвертации используйте пакет Pdftodjvu LE. Преимущество такой конвертации в том, что при этом из Pdf-файла в DjVu-файл переносится OCR-слой и гиперссылки (но иногда бывают проблемы с русскими кодировками).
Однако, далеко не всегда имеет смысл делать именно прямую конвертацию Pdf -> DjVu. В отличие от формата DjVu, формат Pdf не является графическим. Формат Pdf — это формат-контейнер, который может содержать любой тип данных — текст, картинки, таблицы, даже аудио- и видеоинформацию. Формат Pdf обычно делится на такие виды:
— Векторный : в таком Pdf-файле содержится только символьная информация — текст, таблицы, графики, формулы, чертежи. Такие Pdf-файлы (внешне они выглядят как текст, набранный типографским шрифтом) лучше всего конвертировать в формат DjVu напрямую — получите отличное качество и наименьший размер DjVu-файла.
— Растровый : в таком Pdf-файле содержится только неформализованная информация — растровые картинки. Такие Pdf-файлы (внешне они выглядят как сканированное изображение текста) лучше всего конвертировать в формат DjVu НЕ напрямую — а по схеме «Pdf -> Tif -> DjVu». Всё дело в том, что прямой конвертер Pdftodjvu LE «заточен» именно на векторные Pdf-файлы, а растровые он плохо кодирует — получаются большие DjVu-файлы.
— Растрово-векторный : Такие Pdf-файлы, как правило, лучше конвертировать в формат DjVu НЕ напрямую — по схеме «Pdf -> Tif -> DjVu». И только в отдельных редких случаях можно применить прямое конвертирование «Pdf -> DjVu». Всё это зависит от конкретного Pdf-файла, от вида и соотношения растрового и векторного содержимого. Попробуйте оба варианта конвертирования и выберите наилучший.
10. Как напрямую переконвертировать DjVu-файл в Pdf-файл?
Это можно сделать при помощи какого-либо обычного виртуального принтера, например, Acrobat Distiller (устанавливается автоматически при инсталляции полного Adobe Acrobat (не-Reader’а) (показал наилучший результат), FinePrint v5.29, pdfFactory или LEADTOOLS ePrint v4.0. Правда, не все они корректно работают с русским языком.
При такой конвертации OCR-слой и гиперссылки не переносятся из DjVu-файла в Pdf-файл.
И ещё тут есть одна тонкость: если Вы печатаете из броузерного DjVu-плагина, то нельзя отправлять файл на печать выбором в пункте меню броузера «Файл» подпункта «Печать» — из-за этого DjVu-файл напечатается в виде пустых листов (видимо, какая-то ошибка реализации), а надо, кликнув правой кнопкой мыши на отображении файла в броузере, выбрать в контекстном меню пункт «Print. » и т.д.
11. Как напрямую переконвертировать DjVu-файл в Word’овский Doc-файл?
Это невозможно. Формат DjVu — это графический, а не текстовый формат. Поэтому DjVu-файлы не содержат никакой информации о структуре документа — в лучшем случае только внедрённый текстовый OCR-слой — так что информацию для подобной прямой переконвертации брать в DjVu-файле просто неоткуда.
Поэтому для создания Word’овского Doc-файла из DjVu-файла используется традиционный путь: DjVu-файл преобразуется в какой-нибудь обычный графический формат (см. п.5) и распознаётся в ABBYY FineReader v7.0 (или v8.0). В последних релизах ABBYY FineReader v9.0 предусмотрена прямая поддержка на чтение формата DjVu (при формировании пакета на распознавание).
12. Что делать, если при открытии DjVu-файла в программе DjVuSolo v3.1 NonComm она выдаёт сообщение: «DjVu Decoder: Cannot decode DjVu files with version >=25»?
Есть 2 способа решения этой проблемы:
А. Открывать этот файл и работать с ним в Document Express Editor v5.0.0 Build 16 plus (без OCR и справки) (2,0 МБ), а не в DjVuSolo v3.1 NonComm.
Б. Понизить версию этого djvu-файла при помощи утилиты DjVuVersion и тогда станет возможной полноценная работа с ним в DjVuSolo v3.1 NonComm.
13. Имеют ли DjVu-файлы встроенный текстовый OCR-слой?
И да, и нет. То есть возможность добавить в DjVu-файл текстовый OCR-слой существует (предусмотрена cпецификациями DjVu). Обычно содержимое DjVu-файла распознаётся посредством ABBYY FineReader v7.0 (или v8.0) и затем результат распознавания вставляется в DjVu-файл посредством программы DjVuOCR 2.1.
Но в то же время, есть и множество DjVu-файлов, где такой текстовый слой отсутствует (т.е. не был никем создан и вставлен) — потому-то и существует до сих пор ошибочное мнение, что DjVu-файл якобы не поддерживает встроенный OCR-слой.
14. Зачем вставлять текстовый OCR-слой в DjVu-файл?
Вопрос не так прост, как может показаться. Есть люди, которые делают DjVu-книги (т.е. DjVu-файлы) и умышленно не вставляют туда OCR-слой — т.к. из-за этого возрастает размер эл. книги и поэтому её становится дороже скачать из Интернета.
Обычно текстовый OCR-слой вставляют в DjVu-книгу просто для удобства — чтобы, читая такую книгу, можно было бы выделить мышкой нужный кусочек текста, скопировать его в буфер и вставить в текстовый файл.
Кстати — встроенный текстовый OCR-слой НЕ содержит никакой информации о структуре документа — это всего лишь простой сплошной текст без какого-либо форматирования (хотя в DjVu-файле при этом ещё имеется служебная информация и местоположении слов (или букв — опционально) текста).
Но есть и неизмеримо более важная и менее очевидная причина — почему нужно вставлять текстовый OCR-слой в DjVu-книги — для того, чтобы обеспечить возможность поиска информации внутри множества DjVu-книг по ключевым словам (если это не нужно Вам лично — то это потребуется тем, кто будет пользоваться Вашей книгой в числе прочих).
Для такого поиска используют разные программные средства — например, Google Desktop Search + DjVu Indexer Plugin или (что лучше всего) dtSearch + LizardTech DjVu iFilter.
В пределах одной DjVu-книги можно искать по ключевому слову прямо в DjVu-просмотрщике — например, в WinDjView (в броузерном DjVu-плагине тоже можно).
Не исключено, что когда-нибудь и популярные поисковые сервера Интернета сделают у себя поддержку такой возможности (хотя пока, к сожалению, налицо прямо противоположная тенденция).
Однако, далеко не во все DjVu-книги имеет смысл вставлять текстовый OCR-слой — в основном, только в DjVu-книги учебно-справочного характера. Скажем, в развлекательные DjVu-книги (например, о плаваниях капитана Кусто) вставлять текстовый OCR-слой смысла почти нет.
15. Как разобрать многостраничный DjVu-файл на одностраничные DjVu-файлы?
А зачем это Вам? Подобная необходимость практически никогда не должна возникать. Хотите декодировать многостраничный DjVu-файл в набор простых одностраничных графических файлов? Или же переконвертировать его в Pdf? Или осуществить иное преобразование? Так для этого вовсе не надо предварительно разбирать многостраничный DjVu-файл на составляющие его «страницы»- см. предыдущие вопросы.
Общий принцип таков:
С форматом DjVu наиболее удобно работать в форме многостраничных файлов — а не в форме соответствующего множества одностраничных DjVu-файлов.
А как же быть, если Вы хотите сделать выборку из имеющегося многостраничного DjVu-файла — то есть Вам нужно оформить некое подмножество «страниц» многостраничного DjVu-файла как новый отдельный многостраничный DjVu-файл?
Наиболее правильно это можно сделать так: декодируйте желаемый диапазон «страниц» многостраничного DjVu-файла в соответствующий ему набор простых одностраничных графических файлов (при помощи DjVu Small), а потом закодируйте полученные одностраничные графические файлы в новый DjVu-файл (также при помощи DjVu Small; и сделайте OCR по необходимости).
А почему же эту задачу нельзя выполнить разборкой-сборкой многостраничного DjVu-файла? И можно ли вообще проделать подобную разборку-сборку?
Да, такую разборку-сборку проделать можно. Но крайне нежелательно — сильно увеличивается размер файла. Причина в том, что при создании многостраничного DjVu-файла любой LizardTech DjVu-кодировщик использует т.н. «словари» (другое название — «djbz-словари»). Словарь — это особенная уловка для снижения размера многостраничного DjVu-файла. Словарь содержит список геометрических форм, повторяющихся на ряде DjVu-страниц и общих для них. Как правило, это буквы текста. Словарь обычно автоматически создаётся для каждых 10-20 страниц (это настраиваемый параметр) многостраничного DjVu-файла DjVu-кодировщиком при кодировании и автоматически интегрируется в получающийся многостраничный DjVu-файл.
Таким образом, в многостраничном DjVu-файле словари повторяются через каждые 10-20 страниц, и в словарях хранятся символы, общие для соответствующей группы 10-20 страниц — что в итоге даёт солидное снижение размера многостраничного DjVu-файла.
Практически все нынешние многостраничные DjVu-файлы имеют такие встроенные словари.
При разборке многостраничного DjVu-файла на одностраничные разбирающей программе приходится добавлять символы словаря в каждый полученный одностраничный DjVu-файл — что приводит к росту их размера. У меня в тестовом примере получилось увеличение примерно в полтора раза. И при обратной сборке полученных одностраничных DjVu-файлов результирующий многостраничный DjVu-файл остаётся с завышенным размером, равным сумме размеров «собранных» одностраничных DjVu-файлов — то есть словари не восстанавливаются при сборке.
Если же Вам, несмотря на все эти объяснения, всё-таки хочется проделать подобную разборку-сборку, то приведу описание этой процедуры.
Начнём с разборки: для этой операции можно использовать Document Express Editor v5.0.0 Build 16 plus (без OCR и справки) — выделять вручную отдельно каждую «страницу» в многостраничном DjVu-файле и сохранять её отдельно через «Save Page As. » — получите соответствующий набор одностраничных DjVu-файлов.
Однако, подобный ручной способ разборки неприемлем для больших DjVu-файлов. Для облегчения этой процедуры я сделал специальную простейшую консольную программу DjVu Unbundler (275 КБ).
Сборку полученных «разобранных» одностраничных DjVu-файлов можно осуществлять как обычно — при помощи программы Document Express Editor v5.0.0 Build 16 plus (без OCR и справки) — см. вопрос № 6.
16. Что делать, если у меня ни один DjVu-просмотрщик не работает?
Отключите 2-е ядро на своём 2-ядерном микропроцессоре (Хотя бы при помощи диспетчера задач) — и всё заработает.
17. Почему не следует использовать один большой словарь на всю книгу при кодировании в DjVu?
Отвечает Cptn_Cook:
1) Если файл смотрится по сети, то ничего не отобразится, пока не загрузится весь нужный словарь. Для типичной книги, словарь имеет размер 200-300 KB, для модема это существенно.
2) Если редактировать DjVu-файл при помощи DjVuLibre, то резка и склейка очень быстро приводит к тому, что словари начинают повторяться (не трудно понять, почему). При этом, если словарь порядка 10 КБ, то это не страшно, а если 200 КБ, то уже неприятно.
3) DjVu — довольно устойчивый к ошибкам формат, но если ошибка возникает в словаре, то ни одна страница, которая этим словарем пользуется, не отобразится (читай, вся книга при pages-per-dict = 10000).
4) Книга с одним большим словарём медленнее открывается в DjVu-просмотрщике — это заметно на глаз и вызывает раздражение у пользователя.
5) Большой словарь потребляет слишком много оперативной памяти — при работе с WinDjView.
На самом деле, совершенно не обязательно делать pages-per-dict = 10000. Такое значение дает выигрыш в размере файла 20%, но если использовать pages-per-dict = 20, то выигрыш (по сравнению с pages-per-dict = 10) 10%. Похоже, это неплохой компромис. Между прочим, any2djvu использовал pages-per-dict = 20, но потом поменял на pages-per-dict = 10, наверное потому, что в этом случае обработка быстрее.
18. Как распечатать файл формата DjVu?
Скачайте и установите программу WinDjView. Откройте в ней DjVu-файл, выберите в меню пункт «Файл» — «Печать» и распечатайте его.
19. Как напрямую преобразовать Word’овский Doc-файл в файл формата DjVu?
Есть 2 варианта:
1. Установите программу «виртуальный DjVu-принтер» и, открыв Doc-файл в Word’е, отправьте его на печать на этот виртуальный принтер.
2. Если у Вас стоит MS Word 2007, то скачайте с http://tokage.celartem.com/beta Office 2007 DjVu Exporter, проинсталлируйте его и, открыв Doc-файл в Word’е 2007, сохраните его в формат DjVu.
20. Как закодировать множество одностраничных графических файлов в соответствующее множество одностраничных DjVu-файлов?
Лучше не делать этого. Наиболее правильно кодировать множество обычных графических файлов в один многостраничный DjVu-файл — т.к. при этом создаются словари разделённых символов, что заметно снижает размер получаемого DjVu-файла.
Если Вам это всё-таки действительно очень нужно, то используйте Document Express Enterprise 5.1 (можно Light Edition).
21. Как закодировать в DjVu цветные журналы?
Кодируйте обработанные сканы целиком либо в DjVuPhoto (при помощи DjVu Small или MiniDjVu Plus), либо в PDF-JPEG2000 (Adobe Acrobat Pro).
22. Как осуществлять полнотекстовый поиск по страницам множества DjVu-книг?
1. Яндекс Персональный поиск. http://desktop.yandex.ru/ . Самое рекомендуемое решение. Свободно-бесплатная программа.
2. Архивариус 3000 (коммерческая программа). Очень хороший вариант.
Копирайт и электронные библиотеки
Путин разобрался с интернет-библиотеками (С 28.07.2004 вступил в силу новый «Закон об авторских и смежных правах»)
. Автора! (Е. Любарская) (Очень важная статья — разъяснение текущего состояния эл. копирайта — прочитать обязательно!)
На пути к абсолютному знанию — 2 (Общие рассуждения о возможности и необходимости изменения российского копирайтного законодательства с целью учёта существования электронных библиотек)
Автор: monday2000.
Дата создания: 3 ноября 2006 г.
Последнее обновление: 4 апреля 2011 г.
Примечание: На этой странице всегда находятся самые свежие и актуальные версии наиболее важных DjVu-программ.