Képek grafikus feldolgozása
Aki ért a képfeldolgozáshoz, gyakorlottan használ grafikus programokat, az ezt a részt nyugodtan ugorja át. Néhány képfeldogozással kapcsolatos lehetőséget írunk össze ezen az oldalon, amelynek ismerete esetleg hasznos lehet a szkennelt könyvek feldolgozásakor.
A fényképezéssel kapcsolatos grafikai tudnivalókat a szkennelés alatt gyűjtjük. Itt inkább a fényképezőgépektől vagy a képek forrásától független lehetőségeket.
- Görbék és szintek
- Felbontás növelése - felfelé skálázás
- Vektorizálás
- Fekete réteg különválasztása (DjVu maszk)
Görbék és szintek (Curves, Levels)
Hasznos lehet a kép kontrasztjának növelésére, fekete-fehérre vágás előtt, legalábbis nagyon rossz alapanyag esetén. A BookScanWizard is rendelkezik "Szintek" lehetőséggel.
Eredeti kép | Görbék használata után |
---|---|
![]() |
![]() |
Eredeti kép | Szintek használata után |
![]() |
![]() |
A képek az alábbi beállításokkal készültek:
Görbék - GIMP

Sajnos csak angol súgót találok a GIMP-hez. Ebben a Curves leírásából lehet megérteni az eszköz működését. Mint írja is, ha a csak vonal két végpontján lévő fogópontot csak vízszintesen mozgatjuk (közbenső fogópont hozzáadása nélkül), azzal a Szintek eszközt szimuláljuk.
Szintek - GIMP

A Levels leírásából lehet megérteni az eszköz működését. (Innen egyébként az aktuális beállítások megtartásával át lehet ugrani a Görbék eszközbe.)
Felbontás növelése - felfelé skálázás
Ha egy képet az eredeti méreténél nagyobb pixeles kiterjedésre növelünk, a számítógép az egyes pontok közé a körülvevő pontokból kiszámít 1-1 újabbat. Ez az interpoláció általában minőségromlással jár, mivel fizikailag meg nem lévő információt próbálunk előállítani (digitális zoom)*.

Könyvek szkennelésekor ezzel ellentétben lehet minőségi javulást elérni ezzel a módszerrel, és a szkennelési munka befejezése utáni anyagon ez már nem végezhető el.
A ScanTailor és a Book Scan Wizard is támogatja a feldolgozás közbeni DPI növelést - habár minőségi ellenérzést én csak a ScanTailorban végeztem. A jó minőségű végeredményt valószínűleg úgy éri el a program, hogy még az eredeti képen végzi a nagyítást, ahol sok színárnyalat áll rendelkezésre az interpolációhoz. Ha a nagyítást a fekete-fehér képen próbálnánk meg, csak egyenetlen pixel duplázódásokat kapnánk.
A scantips.com oldalon azt olvastam, hogy karakterfelismerési (OCR) célokra általában a 300 DPI a legjobb és a 600 DPI már semmit sem javít a felismerésen, mivel ezeket a programokat inkább a 300 körüli értékekre optimalizálják.
Mivel nem tudhatjuk, mit hoz a technológia jövője, a könyvek szkennelése pedig igen hosszútávú célokat szolgál, véleményem szerint lefelé semmiképpen sem érdemes skálázni. Ha DjVu formátumot használunk, akkor a végeredményben nem jelent számottevően nagyobb fájlméretet a nagyobb felbontás - legalábbis a betűket tartalmazó oldalaknál. Ha egy könyv közel áll valamilyen általános DPI értékhez, akkor esetleg megérheti felfelé skálázni.
14 megapixeles kamerával egyébként az én szkenneremben A4 lapoknál ~330DPI, 16x23-as lapoknál kb 440 DPI érhető el - mindössze!
* A digitális zoomhoz még annyit fűznék hozzá, hogy sokak azt gondolják, hogy ezt nincs értelme használni, mivel ha nagyítani akarunk, akkor ezen a módon utólag is lehet a számítógépen. Pedig valójában akkor már a JPG tömörített maszatokat nagyítjuk, míg a fényképezőgép digitális zoomja a nyers képet. Így ha valóban szükségelteti a téma ezt a módszert (pl. makró fotó, ahol tele nagyítást nem igazán tudunk használni), akkor inkább a fényképező zoomjával).
Vektorizálás
Az Adobe ClearScan technológiája a szkennelt bitmap információt képes vektorokká alakítani, így a tároláshoz szükséges hely akár a tizedére is csökkenhet.
Az alábbi programok ugyan nem komplett könyvek betűinek a vektorizálására valók, de egyes ábrákhoz vagy hasonló esetekben hasznos lehet az ismeretük:
Alább egy próba kép látható különböző formátumokba konvertálva:
<img src="/content/img/gfx/sajdik88_small.png" style="max-width: 100%" title="Sajdik Ferenc egyik nagyszerű illusztrációja" />
- 440 DPI bitkép - 48kb - az eredeti scan felbontása
- 600 DPI bitkép - 73kb - felskálázva feldolgozás közben (lásd korábbi fejezet)
- Vektorizált PDF - 37kb
- Vektorizált SVG - 60kb
- 600 DPI bitkép DjVu-ban - 20kb(!) - csak érdekességnek
Sajnos a DjVu formátum nem tud vektoros képet tárolni, de PDF vagy HTML célokra nagyszerű megoldás lehet.
Fekete réteg különválasztása (DjVu maszk)
Mivel a DjVu-ban külön nagy-felbontású réteg hozható létre a képek között és háttér felett, alább egy kísérletet a fekete rész letisztítására. (Például címlap vastag betűihez MASZK réteg létrehozásakor.)
Ennél egyébként összetettebb szétválasztásra képes mind a DjVu Solo mind pedig a Document Express - a maszk réteget szín információval látják el és a feladatot teljesen automatikusan elvégzik - néha épp ez a gond.
-
Új rétegre másolás, hogy a színes megmaradjon
-
Küszöbszinttel fekete részek megkeresése - itt azért nincs kész, mert még egyenletesebbé tesszük a fekete részeket
-
Feleslegesen megmaradt részek törlése
-
Invertálás (betű legyen fehér, lap fekete, nincs átlátszó)
-
Konvolúciós mátrix
1 1 1
1 0 1
1 1 1
osztó:1
körbe -
Invertálás
-
Konvolúciós mátrix
2 2 2
2 0 2
2 2 2
osztó: 5
körbe -
Küszöbszint (threshold)
Egy példa a DjVu készítési feljegyzéseknél látható.