Könyv digitalizálás, szkennelés lépései

A könyvek szkennelésének általános lépéseit írom le röviden. Bizonyos lépések teljesen általánosak, míg mások csak egy csináld-magad könyvszkennerhez hasonló megoldás használata esetén érvényesek.

  1. A szkennelés előtt alaposan takarítsuk le a szkennert.
  2. Szkenneléshez állítsuk be a fényképezőt.
  3. A nyers szkennelés után válogassuk át a képeket, a hibás oldalakat szkenneljük újra.
    1. Ellenőrizzük, hogy minden oldal meglegyen,
    2. minden oldalon jó legyen a fókusz,
    3. sehol se lógjon ki tartalmi rész (pl gerinc közelében megesik),
    4. sehol se legyen egy eltolódott, halvány másolata a betűknek: a készülék bemozdulásakor megesik, néha alig észrevehető a fotón, de a végeredményt tönkreteszi.
    5. A pótlásra szorult oldalak javított változatát tegyük a hibás fájl helyére, azaz nevezzük át az új képfájlt, hogy beleilleszkedjen a sorba.
    6. Az üres oldalakat is mindenképpen szkenneljük be, ennél nem érdekes, ha nem jó a fókusz.
  4. Nevezzük át a fájlokat, hogy végül a külön páros és páratlan szekvenciából egy növekvő decimális számsorozatot kapjunk. Legjobb, ha a fájl neve a valódi oldalszám.
  5. A nyers képeken sokféle feldolgozást lehet elvégezni, ezek némelyike fontosabb, mások opcionálisak. Több segédprogram is elérhető a legtöbb feladat automatizálásra, de a lehetőségeik különböznek. Az én feldolgozási folyamatomban jelenleg szereplő lépések:
    1. Hordótorzítás javítása
    2. 90, -90 fokos elforgatás (ScanTailor, lentebb)
    3. Sorok pontosan vízszintesre forgatása (ScanTailor)
    4. A könyv körüli területek levágása (ScanTailor)
    5. Fekete-fehérre vágás - ahol szükséges (ScanTailor)
  6. Egy fájlba csomagolás, ami lehet DjVu vagy akinek arra van igénye, hát PDF. Elvileg készíthető pl CBZ vagy más egyéb formátum, de tudtommal csak a DjVu és a PDF rendelkezik a teljes dokumentum kezelési igények minden funkciójával, lásd köv. lépések.
  7. Szövegfelismerés (OCR) (A DjVu készítés leírásában részleteztem.)
  8. Szövegfelismerés javtása
  9. Tartalomjegyzék és egyéb meta adatok hozzáadása

Hordótorzítás javítása

Ha fényképezőgéppel szkennelünk, akkor első lépésként a lencse hordótorzítását kell javítanunk. A kerek lencsék miatt a képnek "hasa van".

Ennek megszüntetésére én a néhány ezer forintos PTLens nevű programot találtam. Ez nagyon sok kisebb fényképezőgépet ismer. Akinek profi fényképezője van, esetleg már maga a gép elvégezheti ezt, illetve pár profi gépet a Photoshop is ismer, habár ez jóval drágább program.

Elvileg a hordótorzítás javításához csak a képlethez szükséges együtthatókat kellene ismernünk (különböző zoom szintekre külön-külön), és akkor akár az ImageMagick programmal is javíthatjuk (vagy ha valahol felleljük a gépünkhöz tartozó 3 db számot).

Eredeti Mozgassa fölé az egeret

Javított Vigye le az egeret

A PTlens mindent automatikusan detektál. A könyvtár kiválasztása után jelöljük ki az összes fájlt majd "Apply" és amikor kész, már zárhatjuk is be a programot. Minden fájlt lemásol "_pt"-vel kiegészítve, dátum szerint rendezve már törölhetjük is az eredetit. (Érdemes az eredetiről egy mentést készíteni, habár a munka befejeztével én csak a PTLenssel javított eredetiket tartom meg, mert a javítást mindenképpen le kell futtatni, és a torzítás csak gondot okozna másoknak is, ha elővennék újra fenoldogozásra.)

Fontos: a PTLens első használata előtt a beállításoknál vigyük feljebb a JPG minőséget, 98-asra vagy hasonlóan magas értékre! Az újratömörítés eleve nem előnyös a JPG képek minőségének, de nincs mit tenni. A RAW-ban készült képeinken TIF-re konvertálva végezhetjük el ugyanezt a javítást.

Fájlok átnevezése

Linuxon például a KRename programot használhatjuk (a képen), Windowshoz pedig egyelőre gyűjtök egy listát tesztelés nélkül:

A KRename (Linux) programban a fájlok bedobása után csak az utolsó fülön kell megadni a cél neveket. Fotózás esetén általában külön állnak rendelkezésre a páros és a páratlan oldalak, de az alábbi példákkal a kezdő és utolsó oldalakat megkeresve könnyen átszámozhatjuk:

A KRename ablakában folyamatosan frissíti a leendő fájlneveket, így könnyen ellenőrizhető elfogadás előtt.

Oldalak feldolgozása

A beszkennelt oldalak feldolgozásában a ScanTailor nevű programot nagyon sokat tud segíteni. Hasonló a BookScan Wizard - ezt még nem próbáltam.

Bővebb leírás: A ScanTailor használata könyvek szkennelésekor

A fényképező beállításai

A cikk innentől lefelé nagyrészt csak azoknak hasznos, akiknek van saját készítésű könyv-szkenner.

Géptől függően lehet, hogy másnak mások a legjobb beállítások. Ezekkel nagyon sokat lehet kísérletezni, különböző beállítások léptetésével teszt sorozatokat készíteni (bracketing). Nem értek a fényképezéshez, így csak néhány amatőr tipp következik, bármilyen visszajelzést vagy javaslatot szívesen fogadok. Canon SX150IS-sem van.

Fényképezési mód

Alap beállítások

Amiket CHDK firmware nélkül is használhatunk:

Mivel a gépem csak középre (kb. a téglalap) tud tárgytávolságot mérni, nem sikerült fókuszálnia a lap alján látható mondatra.

Ilyen esetben két dolgot tehetünk. Egyik, hogy belógatunk valamit a képbe, amit majd rajzprogrammal kitakarítunk, de ez nagyon időigényes. A másikra a CHDK ad lehetőséget, lásd lentebb a "Subject distance override" részt.

CHDK beállítások

Amikor a lapon a fényképező automatikus fókuszálásakor érzékelt területen nincs kép, akkor az maradék szöveg homályos lehet.

RAW fényképezés

Tapasztalataim szerint RAW képeket fekete-fehér oldalakhoz nem éri meg készíteni, mert a végeredményben nem jelent javulást, legalábbis jól olvasható könyv esetén. Színes oldalaknál amiatt lehet megfontolható, mert a JPG->DjVu tömörítés rosszabb hatásfokú mint a RAW->DjVu.

A CHDK-ban a RAW DNG verziót 1.1-re kell állítani, mert 1.3 esetén a hibás pixelek javítását (interpolációt) nem végzi el csak beleépíti a kimeneti képbe a szükséges információkat. Ahhoz pedig letöltés után kellene valami program ami fel tudja dolgozni!

A RAW kép nagyobb! A 14 megapixeles Canon SX150IS gépnél 4368x3250. Levágása:

convert -crop 4320x3240+24+7 IMG_4199_pt.tif 169.tif

RAW-t kezelő programok:

Zoomoló program CHDK-hoz

Fontos, hogy mindig zoomoljunk addig, hogy minél nagyobb területet töltsön ki a könyv, így érhető el a legnagyobb felbontás (DPI)!

Ezt az alábbi zoomoló program nélkül is be lehet állítani, de igen időigényes oda-vissza nagyítani-kicsinyíteni amíg a kívánt értéket PONTOSAN elérjük.

Zoom program CHDK-hoz

DPI kiszámítása

DPI számító

Írjuk fel a könyv méreteit és számítsuk ki az eredmény DPI-t. (Sajnos a fényképezők érvénytelen DPI értéket írnak a képbe, ha épp ír egyáltalán bele ilyet.) Esetleg érdemes lehet az EXIF meta-adatokban tárolni a kiszámított az értéket - ezzel eddig nem foglalkoztam.

A DPI-t úgy számítjuk ki, hogy a cm-ben mért könyv oldalhosszakat átváltjuk inch-be 2.54.gyel való osztással. Majd megnézzük, hogy a fényképen belül a könyv szélei hányszor-hány pixeles területre esnek, majd ezt elosztjuk az inchben mért hosszúsággal.

Segít a DPI számító programom.

Érdekességként megemlítem, hogy a Book Scan Wizard-ban lehetőség van a DPI automatikus kiszámítására, éspedig előre elkészített fix méretű, QR kódokat is tartalmazó kártyák segítségével.

Jegyzeteljünk

Fel lehet írni a használt fényképező beállításokat is, arra az esetre ha néhány oldalt pótolni kellene. De ezek a képből is kiolvashatók az EXIF adatokból.