djvubind 1.2.1
Weblapja: https://code.google.com/p/djvubind/
A djvubind egy python3-ban írt, parancssoros program, DjVu fájlok gyors és egyszerű létrehozására. A program a beszkennelt és feldolgozott képekből (lásd könyvek szkennelése) készít DjVu dokumentumot. A TIFF képek egymás után fűzésén kívül támogatja színes borító, tartalomjegyzék és dokumentumjellemzők hozzáadását is.
Bizonyos esetekben zavaró lehet, hogy elfedi a pontos beállítási lehetőségeket a felhasználó elől. Habár a beállíátsainál megadhatók minden egyes DjVu segédprogramhoz további opciók, de félek ez nem mindig általánosítható. Tesztemben gyanúsan kisebb fájlt hozott létre mint a MiniDjVu, de végül olyan erősen tömörítettnek bizonyult, hogy már hasonló karakterek keveredtek össze (lásd a cikk végén).
Telepítés
Mivel Python szkript, akár telepítés nélkül is futtatható a kicsomagolás után. De ha mégis telepíteni szeretnénk akkor:
python3 ./setup.py install
(Python 2 általában az alap, ezért kell külön megadni, hogy a 3-assal futtassa.)
Követelmények:
- python3
- djvulibre
- imagemagick
- tessseract OCR
Opcionális:
- minidjvu - Ha fel van telepítve, akkor jobb tömörítés érhető el a fekete-fehér oldalakon, mint a djvulibre alap cjb2-jét használva.
- cuneiform - Ha valaki ezzel jobb eredményket szokott elérni mint a tesseracttal.
Beállítások
A docs/config
fájlt másoljuk át a ~/.config/djvubind/
könyvtárba
majd ott szerkesszük át. Állítsuk át a karakterfelismerőt magyarra
(habár ez futtatáskor is megadható):
tesseract_options = -l hun
A djvubind használata
Az előkészített kép fájlokat TIFF formátumban tegyük egy könyvtárba, majd
ott adjuk ki a djvubind
parancsot. Ekkor egy book.djvu
fájlba elkészül
a dokumentum. Ha beállítottuk, a karakterfelismerés is lefut.
A könyvtárban a TIFF fájlokon kívül szerepelhet még első és hátsó borító, tartalomjegyzék fájl és dokumentumjellemzők.
cover_front.jpg
cover_back.jpg
bookmarks
metadata
Más fájlnevek is megadhatók, például --cover-front=000.cimlap.tif
opcióval megadjuk.
A djvubind --help
-re kiírja az elérhető opciókat, amik egy részét
a "config" fájlban is megadhatjuk.
A "bookmarks" fájl leírását a DjVu tartalomjegyzék fejezetben megadottakkal.
(bookmarks
("Cover" "#1" )
("Contents" "#7" )
)
A "metadata" fájl formátum a djvused program "set-meta" parancsa szerinti kulcs-érték pár lista:
author "John Smith"
title "Creating Quality Documents"
Ha frissítünk a tartalomjegyzék fájlon vagy a meta adatokon akkor semmiképpen sem kell az egész dokumentumot újra létrehozni, a frissítés a djvused programmal betölthető a meglévő DjVu fájlba!
Teszt
Anélkül, hogy bármilyen tömörítési opciót megadtam volna, az alábbi képen az első szó "i" betűjét az egész oldalon sok "l" betű helyett felhasznált a program.

A minidjvu még erős tömörítésnél (-l -a 200
) sem futott bele ebbe a hibába:
