Könyv digitalizálás, szkennelés lépései
A könyvek szkennelésének általános lépéseit írom le röviden. Bizonyos lépések teljesen általánosak, míg mások csak egy csináld-magad könyvszkennerhez hasonló megoldás használata esetén érvényesek.
- A szkennelés előtt alaposan takarítsuk le a szkennert.
- Szkenneléshez állítsuk be a fényképezőt.
- A nyers szkennelés után válogassuk át a képeket, a hibás oldalakat
szkenneljük újra.
- Ellenőrizzük, hogy minden oldal meglegyen,
- minden oldalon jó legyen a fókusz,
- sehol se lógjon ki tartalmi rész (pl gerinc közelében megesik),
- sehol se legyen egy eltolódott, halvány másolata a betűknek: a készülék bemozdulásakor megesik, néha alig észrevehető a fotón, de a végeredményt tönkreteszi.
- A pótlásra szorult oldalak javított változatát tegyük a hibás fájl helyére, azaz nevezzük át az új képfájlt, hogy beleilleszkedjen a sorba.
- Az üres oldalakat is mindenképpen szkenneljük be, ennél nem érdekes, ha nem jó a fókusz.
- Nevezzük át a fájlokat, hogy végül a külön páros és páratlan szekvenciából egy növekvő decimális számsorozatot kapjunk. Legjobb, ha a fájl neve a valódi oldalszám.
- A nyers képeken sokféle feldolgozást lehet elvégezni, ezek
némelyike fontosabb, mások opcionálisak. Több segédprogram is
elérhető a legtöbb feladat automatizálásra, de a lehetőségeik különböznek.
Az én feldolgozási folyamatomban jelenleg szereplő lépések:
- Hordótorzítás javítása
- 90, -90 fokos elforgatás (ScanTailor, lentebb)
- Sorok pontosan vízszintesre forgatása (ScanTailor)
- A könyv körüli területek levágása (ScanTailor)
- Fekete-fehérre vágás - ahol szükséges (ScanTailor)
- Egy fájlba csomagolás, ami lehet DjVu vagy akinek arra van igénye, hát PDF. Elvileg készíthető pl CBZ vagy más egyéb formátum, de tudtommal csak a DjVu és a PDF rendelkezik a teljes dokumentum kezelési igények minden funkciójával, lásd köv. lépések.
- Szövegfelismerés (OCR) (A DjVu készítés leírásában részleteztem.)
- Szövegfelismerés javtása
- Tartalomjegyzék és egyéb meta adatok hozzáadása
Hordótorzítás javítása

Ha fényképezőgéppel szkennelünk, akkor első lépésként a lencse hordótorzítását kell javítanunk. A kerek lencsék miatt a képnek "hasa van".
Ennek megszüntetésére én a néhány ezer forintos PTLens nevű programot találtam. Ez nagyon sok kisebb fényképezőgépet ismer. Akinek profi fényképezője van, esetleg már maga a gép elvégezheti ezt, illetve pár profi gépet a Photoshop is ismer, habár ez jóval drágább program.
Elvileg a hordótorzítás javításához csak a képlethez szükséges együtthatókat kellene ismernünk (különböző zoom szintekre külön-külön), és akkor akár az ImageMagick programmal is javíthatjuk (vagy ha valahol felleljük a gépünkhöz tartozó 3 db számot).

Eredeti Mozgassa fölé az egeret

Javított Vigye le az egeret
A PTlens mindent automatikusan detektál. A könyvtár kiválasztása után jelöljük ki az összes fájlt majd "Apply" és amikor kész, már zárhatjuk is be a programot. Minden fájlt lemásol "_pt"-vel kiegészítve, dátum szerint rendezve már törölhetjük is az eredetit. (Érdemes az eredetiről egy mentést készíteni, habár a munka befejeztével én csak a PTLenssel javított eredetiket tartom meg, mert a javítást mindenképpen le kell futtatni, és a torzítás csak gondot okozna másoknak is, ha elővennék újra fenoldogozásra.)
Fontos: a PTLens első használata előtt a beállításoknál vigyük feljebb a JPG minőséget, 98-asra vagy hasonlóan magas értékre! Az újratömörítés eleve nem előnyös a JPG képek minőségének, de nincs mit tenni. A RAW-ban készült képeinken TIF-re konvertálva végezhetjük el ugyanezt a javítást.
Fájlok átnevezése

- 001.jpg
- 002.jpg
- 003.jpg
- ...
Linuxon például a KRename programot használhatjuk (a képen), Windowshoz pedig egyelőre gyűjtök egy listát tesztelés nélkül:
A KRename (Linux) programban a fájlok bedobása után csak az utolsó fülön kell megadni a cél neveket. Fotózás esetén általában külön állnak rendelkezésre a páros és a páratlan oldalak, de az alábbi példákkal a kezdő és utolsó oldalakat megkeresve könnyen átszámozhatjuk:
###{1,2}
- 3 jegyre kiegészítve, 001-től kettesével##{2,2}
- 2 jegyre kiegészítve, 02-től kettesével##{25,2}
- 2 jegyre kiegészítve, 25-től kettesével
A KRename ablakában folyamatosan frissíti a leendő fájlneveket, így könnyen ellenőrizhető elfogadás előtt.
Oldalak feldolgozása
A beszkennelt oldalak feldolgozásában a ScanTailor nevű programot nagyon sokat tud segíteni. Hasonló a BookScan Wizard - ezt még nem próbáltam.
Bővebb leírás: A ScanTailor használata könyvek szkennelésekor
A fényképező beállításai
A cikk innentől lefelé nagyrészt csak azoknak hasznos, akiknek van saját készítésű könyv-szkenner.
Géptől függően lehet, hogy másnak mások a legjobb beállítások. Ezekkel nagyon sokat lehet kísérletezni, különböző beállítások léptetésével teszt sorozatokat készíteni (bracketing). Nem értek a fényképezéshez, így csak néhány amatőr tipp következik, bármilyen visszajelzést vagy javaslatot szívesen fogadok. Canon SX150IS-sem van.
Fényképezési mód
- Av mód (aperture priority): A gépet Av módra állítva a blende nyílásának mértékét állíthatjuk majd be, a záridőt a gép hozzászámolja. Ezzel a móddal megeshet, hogy a sötétebb lapokon a fénymérő hosszabb időre nyitja a blendét. Az igaz, hogy a kép részletei jobban meglesznek, de a fehér papír ezeken a lapokon fehérebb lesz, mint az olyan lapokon ahol sok a fehér, ezért az automatika rövidebb záridőt választ majd.
- M mód (manual): Ha Av módban megmérjük, hogy a gép milyen záridőt választana, akkor "M" módban ettől függően beállíthatunk egy fix értéket, ezzel biztosítható, hogy a lapok fényessége állandó legyen. Érdemes azzal is kísérletezni, hogy a mértnél egy kicsit többet állítunk be, vagy nagyobb blendenyílással mérünk és azt az időt vesszük, azaz picit "túlexponálunk". Pl ha a gép 1/15-ot javasolna, 1/13, 1/10 esetleg 1/8 értékekkel is fényképezhetünk (az én gépem ebben a módban a félig lenyomáskor jelzi
Alap beállítások
Amiket CHDK firmware nélkül is használhatunk:
- Kapcsoljuk ki az energiatakarékos módot (a kikapcsolás elállítja a nagyítást és esetleg egyéb értékeket!)
- Válasszuk a lehető legnagyobb felbontást
- Válasszunk ISO100 vagy jobb (kisebb) ISO értéket
- Válasszuk majdnem a legnagyobb blendenyílást, inkább egyel kisebbet (Pl. ha 3.4 a legnagyobb, akkor 4.0-t. Kísérleteztem és a széleknél rosszabb képminőséget kaptam kisebb blendenyílásokkal, 8.0 körül különösen.)
- Nagyítsunk majd a könyvre amennyire csak belefér. Ezzel maximalizálhatjuk a szkennelés DPI értékét. Az én 14 megapixeles gépemmel A4-et 300 körül, 16x23-as könyvet 440 DPI körül tudok szkennelni, kisebbet 500 körül.
- Kapcsoljuk ki az arcfelismerős fókuszt, válasszunk olyan fókuszálási zóna lehetőséget amivel legjobban lefedhetjük a könyv lapjait (amennyiben van ilyen lehetőség. Az én gépemen az arcfelismerésen kívül csak középen lehet fókuszálni. Ennél előnyösebb lehet egy pl közép, onnan a lap teteje felé, és a lap alja felé. Így az alábbi képen látható szöveget is meg tudta volna fogni a gép.

Mivel a gépem csak középre (kb. a téglalap) tud tárgytávolságot mérni, nem sikerült fókuszálnia a lap alján látható mondatra.
Ilyen esetben két dolgot tehetünk. Egyik, hogy belógatunk valamit a képbe, amit majd rajzprogrammal kitakarítunk, de ez nagyon időigényes. A másikra a CHDK ad lehetőséget, lásd lentebb a "Subject distance override" részt.
CHDK beállítások
- Engedélyezzük az USB remote távirányítást (ezt kapcsoljuk majd ki ha a gépet a PC-re USB-vel kötjük)
- Tekerjük fel a JPG minőséget a maximumra (SuperFine, ez nekem 95-ös minőségű képet ment)
- Bizonyos esetekben aktiváljuk a RAW módot - fekete-fehér oldalakhoz szerintem nem szükséges. Színes oldalak esetén a DjVu tömörítésben nyerhetünk 15-30 százalékot, ha a kép nem megy át közben egy JPG tömörítésen!
- Tárgytávolság felülbírálása: A CHDK "Subject distance override" funkciójával könnyen megoldhatjuk az előbbi képen látható problémát, amikor a gép nem talál fókuszpontot ezért az egész oldal teljesen homályos lenne. Ha figyelünk az oldalakra, ezt már a hibás kép készítése előtt észrevehetjük. Ilyenkor az előző oldalon mérjünk egy távolságot (ja igen, ehhez a CHDK-ban a Dept Of Field calculatort ki szoktam rakni a képernyőre, az kiírja a mért távolságot pontosan milliméterben!). Ezt a mért távolságot írjuk be a "Subject Distance override" menüben. Ahhoz hogy ez az érték valóban életbe lépjen, a gépet "Manuális fókusz" módba kell kapcsolni. Ilyenkor a CHDK a gomb lenyomásakor a beállított értékre áll be. (Egy könyv esetében ez általában ugyanannyi, így a későbbiekben elég ki-be kapcsolni a manuális fókuszt.)
Amikor a lapon a fényképező automatikus fókuszálásakor érzékelt területen nincs kép, akkor az maradék szöveg homályos lehet.
RAW fényképezés
Tapasztalataim szerint RAW képeket fekete-fehér oldalakhoz nem éri meg készíteni, mert a végeredményben nem jelent javulást, legalábbis jól olvasható könyv esetén. Színes oldalaknál amiatt lehet megfontolható, mert a JPG->DjVu tömörítés rosszabb hatásfokú mint a RAW->DjVu.
A CHDK-ban a RAW DNG verziót 1.1-re kell állítani, mert 1.3 esetén a hibás pixelek javítását (interpolációt) nem végzi el csak beleépíti a kimeneti képbe a szükséges információkat. Ahhoz pedig letöltés után kellene valami program ami fel tudja dolgozni!
A RAW kép nagyobb! A 14 megapixeles Canon SX150IS gépnél 4368x3250. Levágása:
convert -crop 4320x3240+24+7 IMG_4199_pt.tif 169.tif
RAW-t kezelő programok:
- rawstudio
- UFRaw
Zoomoló program CHDK-hoz
Fontos, hogy mindig zoomoljunk addig, hogy minél nagyobb területet töltsön ki a könyv, így érhető el a legnagyobb felbontás (DPI)!
Ezt az alábbi zoomoló program nélkül is be lehet állítani, de igen időigényes oda-vissza nagyítani-kicsinyíteni amíg a kívánt értéket PONTOSAN elérjük.
DPI kiszámítása
Írjuk fel a könyv méreteit és számítsuk ki az eredmény DPI-t. (Sajnos a fényképezők érvénytelen DPI értéket írnak a képbe, ha épp ír egyáltalán bele ilyet.) Esetleg érdemes lehet az EXIF meta-adatokban tárolni a kiszámított az értéket - ezzel eddig nem foglalkoztam.
A DPI-t úgy számítjuk ki, hogy a cm-ben mért könyv oldalhosszakat átváltjuk inch-be 2.54.gyel való osztással. Majd megnézzük, hogy a fényképen belül a könyv szélei hányszor-hány pixeles területre esnek, majd ezt elosztjuk az inchben mért hosszúsággal.
Segít a DPI számító programom.
Érdekességként megemlítem, hogy a Book Scan Wizard-ban lehetőség van a DPI automatikus kiszámítására, éspedig előre elkészített fix méretű, QR kódokat is tartalmazó kártyák segítségével.
Jegyzeteljünk
Fel lehet írni a használt fényképező beállításokat is, arra az esetre ha néhány oldalt pótolni kellene. De ezek a képből is kiolvashatók az EXIF adatokból.