Képek grafikus feldolgozása

Aki ért a képfeldolgozáshoz, gyakorlottan használ grafikus programokat, az ezt a részt nyugodtan ugorja át. Néhány képfeldogozással kapcsolatos lehetőséget írunk össze ezen az oldalon, amelynek ismerete esetleg hasznos lehet a szkennelt könyvek feldolgozásakor.

A fényképezéssel kapcsolatos grafikai tudnivalókat a szkennelés alatt gyűjtjük. Itt inkább a fényképezőgépektől vagy a képek forrásától független lehetőségeket.

Görbék és szintek (Curves, Levels)

Hasznos lehet a kép kontrasztjának növelésére, fekete-fehérre vágás előtt, legalábbis nagyon rossz alapanyag esetén. A BookScanWizard is rendelkezik "Szintek" lehetőséggel.

Eredeti kép Görbék használata után
Eredeti kép Szintek használata után

A képek az alábbi beállításokkal készültek:

Görbék - GIMP

Sajnos csak angol súgót találok a GIMP-hez. Ebben a Curves leírásából lehet megérteni az eszköz működését. Mint írja is, ha a csak vonal két végpontján lévő fogópontot csak vízszintesen mozgatjuk (közbenső fogópont hozzáadása nélkül), azzal a Szintek eszközt szimuláljuk.

Szintek - GIMP

A Levels leírásából lehet megérteni az eszköz működését. (Innen egyébként az aktuális beállítások megtartásával át lehet ugrani a Görbék eszközbe.)

Felbontás növelése - felfelé skálázás

Ha egy képet az eredeti méreténél nagyobb pixeles kiterjedésre növelünk, a számítógép az egyes pontok közé a körülvevő pontokból kiszámít 1-1 újabbat. Ez az interpoláció általában minőségromlással jár, mivel fizikailag meg nem lévő információt próbálunk előállítani (digitális zoom)*.

Könyvek szkennelésekor ezzel ellentétben lehet minőségi javulást elérni ezzel a módszerrel, és a szkennelési munka befejezése utáni anyagon ez már nem végezhető el.

A ScanTailor és a Book Scan Wizard is támogatja a feldolgozás közbeni DPI növelést - habár minőségi ellenérzést én csak a ScanTailorban végeztem. A jó minőségű végeredményt valószínűleg úgy éri el a program, hogy még az eredeti képen végzi a nagyítást, ahol sok színárnyalat áll rendelkezésre az interpolációhoz. Ha a nagyítást a fekete-fehér képen próbálnánk meg, csak egyenetlen pixel duplázódásokat kapnánk.

A scantips.com oldalon azt olvastam, hogy karakterfelismerési (OCR) célokra általában a 300 DPI a legjobb és a 600 DPI már semmit sem javít a felismerésen, mivel ezeket a programokat inkább a 300 körüli értékekre optimalizálják.

Mivel nem tudhatjuk, mit hoz a technológia jövője, a könyvek szkennelése pedig igen hosszútávú célokat szolgál, véleményem szerint lefelé semmiképpen sem érdemes skálázni. Ha DjVu formátumot használunk, akkor a végeredményben nem jelent számottevően nagyobb fájlméretet a nagyobb felbontás - legalábbis a betűket tartalmazó oldalaknál. Ha egy könyv közel áll valamilyen általános DPI értékhez, akkor esetleg megérheti felfelé skálázni.

14 megapixeles kamerával egyébként az én szkenneremben A4 lapoknál ~330DPI, 16x23-as lapoknál kb 440 DPI érhető el - mindössze!

* A digitális zoomhoz még annyit fűznék hozzá, hogy sokak azt gondolják, hogy ezt nincs értelme használni, mivel ha nagyítani akarunk, akkor ezen a módon utólag is lehet a számítógépen. Pedig valójában akkor már a JPG tömörített maszatokat nagyítjuk, míg a fényképezőgép digitális zoomja a nyers képet. Így ha valóban szükségelteti a téma ezt a módszert (pl. makró fotó, ahol tele nagyítást nem igazán tudunk használni), akkor inkább a fényképező zoomjával).

Vektorizálás

Az Adobe ClearScan technológiája a szkennelt bitmap információt képes vektorokká alakítani, így a tároláshoz szükséges hely akár a tizedére is csökkenhet.

Az alábbi programok ugyan nem komplett könyvek betűinek a vektorizálására valók, de egyes ábrákhoz vagy hasonló esetekben hasznos lehet az ismeretük:

Alább egy próba kép látható különböző formátumokba konvertálva:

<img src="/content/img/gfx/sajdik88_small.png" style="max-width: 100%" title="Sajdik Ferenc egyik nagyszerű illusztrációja" />

Sajnos a DjVu formátum nem tud vektoros képet tárolni, de PDF vagy HTML célokra nagyszerű megoldás lehet.

Fekete réteg különválasztása (DjVu maszk)

Mivel a DjVu-ban külön nagy-felbontású réteg hozható létre a képek között és háttér felett, alább egy kísérletet a fekete rész letisztítására. (Például címlap vastag betűihez MASZK réteg létrehozásakor.)

Ennél egyébként összetettebb szétválasztásra képes mind a DjVu Solo mind pedig a Document Express - a maszk réteget szín információval látják el és a feladatot teljesen automatikusan elvégzik - néha épp ez a gond.

  1. Új rétegre másolás, hogy a színes megmaradjon

  2. Küszöbszinttel fekete részek megkeresése - itt azért nincs kész, mert még egyenletesebbé tesszük a fekete részeket

  3. Feleslegesen megmaradt részek törlése

  4. Invertálás (betű legyen fehér, lap fekete, nincs átlátszó)

  5. Konvolúciós mátrix

    1 1 1
    1 0 1
    1 1 1
    osztó:1
    körbe

  6. Invertálás

  7. Konvolúciós mátrix

    2 2 2
    2 0 2
    2 2 2
    osztó: 5
    körbe

  8. Küszöbszint (threshold)

Egy példa a DjVu készítési feljegyzéseknél látható.

A cikk legutóbb frissítve:2014/03/07