PDF fájlok a könyv szkennelésben
Mivel a PDF elterjedtebb formátum mint a DjVu, alább összegyűjtöm a kapcsolódó linkeket, amelyekbe a kutatások során belefutok.
PDF létrehozó programok
- Adobe Acrobat nevű programja könnyedén összefűz kép fájlokat és igen jó hatásfokú karakterfelismerést (OCR) futtat le rajta. Sajnos elég drága.
- XChange PDF Viewer és hozzá OCR bővítmény - ingyenes. (Linuxon állítólag Wine-ban futtatható.)
- Homer Windows, Mac. Egyszerűen telepíthető, képfájlok átnevezése, beforgatása (90 fok, -90 fok), karakterfelismerés (Tesseract), PDF létrehozás.
- pdfbeads - Elvileg képes a DjVu-hoz hasonló kép + szöveg réteg automatikus szétválasztásra, képekből PDF létrehozására. A Tesseract OCR kimeneteként létrejövő hOCR fájlokból szöveges réteget tud rakni a kimeneti PDF fájlba.
- tiff2pdf a libtiff csomagból
- pdfedit (2010-2012?)
- gscan2pdf
- gImageReader - OCR (Tesseract)