DjVu fájlok készítése - a Document Express segítségével
A Cuminas Document Express egy fizetős alkalmazás. Próbaverzió letöltése és megvásárlás: https://www.cuminas.jp/en/downloads
DjVu létrehozása Document Expresszel
A leírt lépésekhez már készen kell legyen a digitalizálási munka, azaz a szkennelt könyv vagy dokumentum lapjai már feldolgozott kép fájlokként rendelkezésre kell álljanak, lehetőleg minél jobb minőségben és minél nagyobb felbontásban (300-600 DPI). Beleértve az egyes oldalak irányba forgatását, igény esetén az oldalak fekete-fehérre vágását (küszöbszint). A Szkennelésről és előkészítésről külön menüpontban található információ.
Első lépésként a File -> Open menüvel nyissuk meg az összes hozzáadni kívánt képet. (Egyszerre az összes képet kijelölve.) A bundled opicót kell választani, hogy egy DjVu dokumentumot készítsünk.

Ha nagyon előre akarok szaladni, akkor most a File -> Save as... menüvel máris indíthatjuk a mentést, ahol megadjuk a cél fájlnevet:

Ekkor a program meg fogja kérdezni, hogy az első oldalt milyen módon szeretnénk DjVu formátumra konvertálni, azaz milyen szegmentálási és tömörítési módszert használjon. Ehhez előre rendelkezésre áll sok konvertálási "profil" (lásd lentebb).
"Use same for sucessive pages" megadásával többet nem is kérdez, azaz minden oldalra érvényesíti a kiválasztott értéket.

Viszont mivel így "vaktába lövöldöztünk" az oldalak milyenségét tekintve, mentés helyett nyissuk meg a DjVu Profile Editort az "Edit..." gombbal.

Ha előre látjuk, hogy bizonyos oldalakat máshogy kell majd konvertálni mint a többit (pl fekete-fehér könyv színes borítóját!) akkor az előnézeti képeken jobb gombbal kattinva a "különleges" oldalakat előre átkonvertálhatjuk (A DjVu Encode menüvel).
DjVu konvertálási profilok
Alapértelmezetten a következő konvetálási opciók állnak rendelkezésre:
Profil | Típus | Leírás |
---|---|---|
scanXXX | Dokumentumok* | Kétszínű és színes dokumentumokhoz. A legáltalánosabb profil, dokumentumok konvertálásához. |
bitonalXXX | Fekete és fehér | Csak kétszínű dokumentumokhoz. Ez a profil nem végez szegmentálást. |
photoXXX | Fotók | Csak fényképekhez. Ez a profil nem végez szegmentálást, de az eredmény nagyobb mint a Dokumentum típusoknak. |
photo_netXXX | Fotók | Csak fényképekhez. Ez a profil nem végez szegmentálást, de az eredmény nagyobb mint a Dokumentum típusoknak. A méretet a fájl gyorsabb letöltéséhez optimalizálja. |
aggressiveAXXX aggressiveBXXX aggressiveCXXX | Dokumentumok | Kétszínű és színes dokumentumokhoz. Ezek a profilok érik el a legkisebb fájlméretet, de a minőség rosszabb mint a scanXXX profiloknál. A "CXXX" kisebbre tömörít mint az "AXXX". |
lossyAXXX lossyBXXX lossyCXXX | Dokumentumok | Kétszínű és színes dokumentumokhoz. Ezek a profilok kisebb fájlméretet eredményeznek mint a scanXXX, de a minőség jobb mint az agressiveXXX profiloknál. A lossyC gyengébb minőségű mint a lossyA. |
fineXXX | Dokumentumok | Kétszínű és színes dokumentumokhoz. Jobb a minőség, de a fájl is nagyobb lesz mint a scanXXX típusoknál. |
superfineXXX | Dokumentumok | Kétszínű és színes dokumentumokhoz. Ez a profil adja a legjobb minőséget, de a fájl nagyobb lesz a fineXXX típusoknál is. |
mapXXX | Dokumentumok | Kétszínű és színes dokumentumokhoz. A profil alapbeállítása hasonló a scanXXX profilhoz, de ez főként olyan dokumentumokhoz van optimalizálva, amelyek sok apró részletet tartalmaznak, mint például a térképek. Ez a profil hasznos magazinok címoldalához is, ami általában sok fotót és szöveget is tartalmaz. |
* Dokumentum: itt azt jelenti, hogy a konvertáló a kétszínű képeket kétszínűként a színes képeket pedig színesként kezeli. A színes dokumentumok így 2 vagy 3 rétegű, kompozit DjVu képet eredményeznek, a profil beállításaitól függően.
(pdfXXX csak PDF-to-DjVu átalakításhoz használható (külön program), a vpdXXX pedig akkor használható ha dokmentumokat hozunk létre a DjVu Virtuális Nyomtatóval.)
A profilok nevében lévő számok a DPI felbontást jelentik. A megfelelő minőségű DjVu tömörítéshez feltétlenül ismernünk kell a szkennelt dokumentum DPI felbontását! (Lásd: DPI számító program.) Figyelem: JPG képekben ez a beállítás gyakran a létrehozáskor használt monitor 72 DPI-s felbontását tárolja! Ez közel sem jelenti azt, hogy ennyire rossz lenne a dokumentum, mindenképp méréssel kell ellenőrizni és korrigálni!
Némelyik profil nevében "up" szerepel a DPI érték után, mint például scan150up. Ez azt jelenti, hogy a kimeneti kép fel-skálázásra kerül a bemeneti képből a következő szabály alapján:
- xxx100up: 300 DPI-s képet készít háromszoros szorzóval
- xxx150up: 300 DPI-s képet készít kétszeres szorzóval
- xxx200up: 400 DPI-s képet készít kétszeres szorzóval
Például, a fentebbi mintaképen az alapértelmezett scan300 27kb-os fájlméretet eredményezett, de rettenetes minőségromlással. Mivel a bemeneti kép csak 130 DPI, ehhez közel eső, scan150 esetén már jobb a minőség, de a fájl is 99kb-ra nő. A superfine150 pedig 152kb. Végül, mivel az oldal nagy része fotó, a photo150-nel 89kb, nagyon jó eredményt adott. Ez egy olyan DjVu oldalt hoz létre, amiben csak a háttér réteg szerepel.

Document Express konvertálási profilok szerkesztése
A profil szerkesztő pontos ismeretéhez javasolt a súgó tanulmányozása! Első látásra ijesztőnek tűnhet a sok opció, de hamar átlátható. Igaz, néha a kívánt eredmény elérése nehézkes.
Ha változtatunk az oldalsó paramétereken, akkor a program a megváltoztatott értékeket kis piros ponttal jelöli. Ilyenkor lehetőség van a profil mentésére. Az alapértelmezett profilokat érdemes változatlan formában megtartani és a módosításainkat új néven elmenteni. (A profilok a számítógéphez kapcsolódnak, azaz minden felhasználó ugyanazokat látja. Más számítógépre pedig export/import funkciók segítségével átvihető. Az alapértelmezett profilok "Csak olvasható" módra vannak állítva, így felülírásuk előtt a program rákérdez.)
A profilba való elmentés nélkül, az egyedileg módosított paramétereinket nem tudjuk felhasználni a DjVu készítéséhez. Tehát ha a kívánt eredmény eléréshez egyedi profilbeállításokat készítettünk, mentsük el, majd a Profil Szerkesztő bezárása után a főablakban válasszuk ki az új profilt az adott oldalakhoz.

- 3 Layers: Három rétegű fájlt készít (Háttér, Maszk, Előtér).
- 2 Layers (Palette): Maximum 256 színű előtérrel, kétrétegű (Háttér, Előtér) fájlt készít. A színek korlátozásával kisebb fájlt eredményezhet.
- Picture: Csak háttér réteg készül, fotókhoz használatos.
- Bitonal: Csak maszk réteg készül, fekete és fehér oldalakhoz.
Bitonal Enc.: Az maszk tömörítési módja. (Ha készül ilyen réteg.)
- JB2 (alapértelmezett DjVu formátum),
- MMR (G4): TIFF-G4-et tartalmaz a háttér réteg.
- BIG2: Csak High Compression PDF készítésekor használható.
Picture Enc.: Az előtér és a háttér tömörítési módja (ha készül ilyen réteg).
- IW44: Alap DjVu formátum, IW44 Wavelet.
- JPEG: JPEG adatok kerülnek a rétegre.
- JPEG 2000 (JPX): Csak High Compression PDF készítésekor használható.
Detect Bitonal Inputs: A kódolót a kétszínű bemeneti kép automatikus detektálására utasítja, és ez esetben Bitonal módra áll.

Black Compensation: Fekete betűket tartalmazó, de zajosan vagy világosabbra szkennelt betűket lehet vele sötétíteni.
Resample: Felfelé skálázható a kép a feldolgozás előtt (ezt használják az "up" jelölésű profilok). Péládul 2/1 megadása kétszeresére méretezi fel a bemeneti képet. Lásd még: Felfelé skálázás

Color Enhancement: Előtérben a betűk és vonalak színét emeli ki, 3-5 értékek letisztult betűket eredményezhetnek. Háttér esetén a kép tónusát javítja.
Intent: Konvertálási cél:
- IW44: általános tömörítés.
- FG44: előtér réteg tömörítése.
- BG44: háttér réteg tömörítése.
- PM44: színes Color-IW44 fájlt készít.
- BM44: szürkeskálás Grayscale-IW44 fájl.
- TH44: előnézeti kép (thumbnail).
CbCr-Mode: (CbCr = Chrominance: színkülönbségi jel, Y = Luminance: világosságjel)
- None: Chrominance eldobása, szürkeskálás kép (Luminance).
- Half: A chrominance információt csak a kép felbontásának felével dolgozza fel. Kisebb fájl, de nagyon színes képeken minőségvesztéssel jár.
- Normal: Chrominance feldogozása teljes felbontáson. (Alapértelmezett.)
CbCr-Delay: Ez is a Chrominance feldolgozásának csökkentését szabályozza.
Subsample: Mintavételezési osztó. Lényeges paraméter a tömörítési vs. minőség szempontjából. Nagy tömörítési hatékonyságot lehet elérni, jelentős minőségi veszteséggel.

A betűalakok és más formák egyeztetését és újrahasznosítását paraméterezi.
Pages/Dict: Hány oldal osztozzon ugyanazon a minta-könyvtáron. (Kikapcsolásával minden oldalnak saját minta-könyvtára lesz.)
Match threshold: A JB2 minták egyetetési küszöbértéke - azaz mennyire kell megegyezni az egyes formáknak (pl betűk), hogy azokat ugyanazzal a formával helyettesítse. Befolyásolva ezáltal a tömörítés mértékét. A 0 érték veszteségmentes alakegyeztetést jelent, nagyobb értékek esetén már akár a 8-as is cserélődhet 0-ra, vagy az "l" betű "1"-esre, így a óvatosan kell bánni az érték növelésével!
Refine threshold: [60] Ez már a minőséget nem, csak a tömörítés mértékét befolyásolja. Például olyan optimalizációkat tesz lehetővé, hogy egy "e" betű egy "c"-ből és egy "-"-ból épülhessen fel, a teljes alak külön tárolása helyett. Az érték azt határozza meg, hogy a végleges alak mennyire térhet el a forrástól mielőtt a tömörítő inkább külön mintát hozna létre neki.
Center Diff. Threshold: [1] A tömörítés sebességét befolyásolja annyiban, hogy az alak közepétől elindulva észlelt különbségek esetén haladjon-e még kifelé az egyezési lehetőség felderítésére. 0 esetén már a közepénél azonosnak kell lennie az alaknak, nagyobb értékeknél a közép különbözősége esetén is tovább keres az algoritmus.
Max Num. of Palettes: Paletták száma 2 Layers módnál (Color-JB2).
Sort Shapes: Sorba rendezi a JB2 mintákat, a tömörítés tovább tarthat.
Erode Mask for Foreground: Javíthatja az előtér elemek - mint például betűk, vonalak - színét.
Dilate Mask for Background: Javíthatja a háttér színét a maszk éleinek közelében.
Divide Large Shapes: A túl nagy JB2 mintákat feldarabolja. Tovább tarthat a tömörítés.

A szegmentálás paramétereit határozza meg.
Block size: [16] feldolgozási blokkméret pixelekben. Nagyobb kell legyen mint 4.
Max Noise Obj. Size: [8] Ennél a pixelben megadott értéknél nagyobb objektumok nem érzékelhetők zajnak. 0 esetén semelyik elem sem zaj.
Mask Upsample: Belső feldolgozás közben felskálázza a maszkot a jobb szegmentálás érdekében, bár ez lassabb tömörítést eredményezhet.
Blur Radius: Gaussian filter erőssége, amellyel a bemeneti képet finomítja. Eltávolítja a kisebb zajokat, ezzel a szegmentálás és a tömörítés eredményesebb lehet. Általában 300 DPI-s képnél 1-2-es érték a megfelelő.
Detect Edges: Sikeresebben szétválaszthatja a különálló objektumokat, például ha az olvasást nehezítené meg valamilyen a betűket érintő objektum, mivel megváltoztathatja az elem színét a JB2 feldolgozáskor.
Thicken Shapes: Az olvashatóságot növelheti Color-JB2 képeknél az elemek vastagságának növelésével.
Use Foreground if no Shapes: Azt határozza meg, hogy bitonális kép esetén a maszk vagy az előtér réteg tartalmazza-e a képet.

Virtual Printer és PDF beállításokkal most nem foglalkozunk.

Gamma: Gamma érték a megjelenítéshez.
Segm. for Bitonal Thresholding: Csak Bitonal módban aktív. Arra utasítja a konvertálót, hogy az alapértelmezett kétszín feldolgozó helyett a szegmentálóval készítse el a bintonális képet. (Bizonyos esetekben jobb eredményt adhat.)
Embed App-Info to DjVu file: A kimeneti fájlba bekerül a DjVu fájl verzió és a DjVu konvertáló típusa.
A képernyő aljánál bekapcsolható az automatikus előnézet (Auto preview), így a módosításokat azonnal nyomon követhetjük.