Egyéb feljegyzések DjVu fájlok készítésével kapcsolatban

Itt egyéb, máshova nem illő, információkat gyűjtünk össze, általában csak jegyzetek, mérési eredmények, pontosításra váró részletek.

DjVu RLE fájl formátum konverterek

RLE fájlokra lehet szükség bizonyos DjVu tömörítők használatához. A NETPBM csomagban található konverter, de Ubuntu Linuxon a netpbm csomag ezeket a nem tartalmazza!

Szerencsére a két program magában is lefordítható a NetPbm forrásból. (Szükséges lehet pár -dev csomag és flex).

./configure    a static kérdésre “static”, a többi alapértelmezetten 
cd converter/other
make pamtodjvurle
(majd a binárist lemásolni) 
cd ../pbm
make pbmtodjvurle
(majd a binárist lemásolni)  

DjVu feldolgozást segítő parancsfájlok

Egyelőre csak a jegyzeteim másolatai.

Sok oldal konvertálása vagy befűzése:

for i in *.tif; do convert $i `echo $i | sed s/tif/ppm/`; done
for i in *.ppm; do c44 -dpi 360 $i `echo $i | sed s/ppm/djvu/`; done

Az alábbi szkript oldalszám szerint beszúr sok színes oldalt. Akkor van rá szükség, ha egy könyvben belül is több színes oldal van. Előszőr létrehozhatjuk a fekete-fehér oldalakból a DjVu fájlt, majd a színes oldalak DjVu fájljait be tudja szúrni, ha a fájl neve a cél oldalszám.

for i in szines/360dpi/???.djvu; do djvm -i konyv-2.djvu $i `echo $i |
sed 's/szines\/360dpi\/\(.*\)\.djvu/\1/'`; done

Nyomtatási fejléc, lábléc

A Document Express 7.0 lehetőséget biztosít fejléc és lábléc megadására. Font, igazítás és szöveg. Shared-ant-ban tárolja, de nem sok program támogatja.

djvused -u -e ‘select-shared-ant; print-ant’ basic_docexpress.djvu

Kimenete próba adatokkal:

(mode color)
(metadata (Author "Major ... sok más meta ...))
(print head center "Fejléc nyomtatáshoz"  (font "Arial Black" 11))
(print foot right "Lábléc nyomtatáshoz"  (font "Arial Black" 11))

Nem nyomtatja: Document Express 7.0 maga (érdekes), DjVuLibre DjView sem.

Nyomtatja: Caminova Browser Plugin nevű asztali alkalmazás.

Jegyzetek létrehozása (annotations)

A szekciónak külön oldalt nyitottunk: Jegyzetek

JPG és RAW képek tömörítési hatékonysága

Egyelőre egy könyv borítójával teszteltem.

A könyvön nagyítóval nyomtatási pöttyök láthatók, ez sem DNG sem JPG formában nem kivehető. A RAW összemosottabb, a JPG éles mintázatot mutat, habár ez lehet, hogy éppen a RAW adatainak JPG-re tömörítésének eredménye. A JPG ettől egyébként kontrasztosabbnak hat.

DJVU-ra tömörítés esetén, egyetlen teszt képpel a RAW 17-35% méret nyereséget jelentett ugyanazon kép esetén:

41990417   IMG_4201_jpg.ppm
41990456   IMG_4201_raw.ppm
 1457503   jpg.72+11+10+10.djvu
 1282642   jpg.72+11+8+8.djvu
  875256   jpg.74+10+4+9.djvu
 1282423   jpg.default.djvu
 1245014   raw.72+11+10+10.djvu
  951773   raw.72+11+8+8.djvu
  778752   raw.74+10+4+9.djvu
  951761   raw.default.djvu

(Persze további tesztek szükségesek, de az eredmény megnyerő, főleg ha figyelembe vesszük, hogy a 160 oldalas teszt könyvemnél a végleges fájlméret kb 40%-át a előlap és hátlap jelentette, aminek a tömörítése így javítható.)

Szegmentálás DjVu rétegekhez

Egy DjVu Solo gyors teszt eredménye látható a képen. A folyamatba ebben a programban szerintem nem lehet beavatkozni, így javításra sincs lehetőség, pedig több betűt, sőt a címet sem hozta át maszk rétegre:

<img src="/content/img/djvu/djvu-solo-szegmentalas.jpg" class="photoframe" />

Nagyítva:

<img src="/content/img/djvu/djvu-solo-szegmentalas2.png" class="photoframe" />

ScanTailor kimenete ennél szebb, és a címsor is megmarad. Összehasonlítva például az "ezete" részt, itt sokkal jobb az eredmény:

<img src="/content/img/djvu/gozgep-scantailor.png" class="photoframe" />

A fekete-fehér kép feljavításához a grafikai résznél van egy leírás, amelynek eredménye itt látható, habár a lentebbi DjVu-ba a feljavítás nélküli kép került.

<img src="/content/img/djvu/gozgep-scantailor-jav.png" class="photoframe" />

Ha meg akarom tartani a megsárgult papírt, akkor a fekete-fehér képeket lementve, majd a ScanTailort színes kimenettel is lefuttatva megegyező pozicionálású háttér hozható létre. Az igaz, hogy ebben benne vannak a betűk is, de a DjVu a maszk alatti információkat eldobja a dokumentum rétegek összerakásakor, tehát nem zavaró.

Eredmény (gozgep04.djvu):

<img src="/content/img/djvu/gozgep-djvu.png" class="photoframe" />

Persze ez nem valósághű, hanem rikítóan "feljavított". A fekete szín helyett a Solo képén "#474734" szerepel (illetve betűnként néha változik), ezzel valószínűleg finomabb eredmény érhető el (gozgep04.djvu):

<img src="/content/img/djvu/gozgep-djvu-gray.png" class="photoframe" />

Negyed méretre skáláztam le a hátteret:

FORM:DJVU [93056] 
    INFO [10]         DjVu 2324x3160, v24, 600 dpi, gamma=2,2
    Sjbz [26135]      JB2 bilevel data
    FGbz [16]         JB2 colors data, v0, 1 colors
    BG44 [4200]       IW4 data #1, 72 slices, v1.2 (color), 581x790
    BG44 [11481]      IW4 data #2, 11 slices
    BG44 [19718]      IW4 data #3, 10 slices
    BG44 [31434]      IW4 data #4, 10 slices
A cikk legutóbb frissítve: 2015/11/20