Um Bücher rational einzuscannen, gibt es unterschiedliche Varianten, welche sich in den Kosten unterscheiden.
1.) Billig: Flachbettscanner für 50 EUR und das Buch in 300dpi einscannen. Beim Umblättern muss man mühsam den Deckel hochheben, was zeitraubend ist. Man braucht auf diese Weise 3 Stunden pro Buch.
2.) Extrem teuer: Scan Robot 2.0 auf http://www.scanrobot.de/buchscanner_scanrobot.html
Dieser Apparat blättert die Seiten automatisch um und kostet im Einzelhandel ca. 70000 EUR.
3.) Billig aber effizient, Videoscanner
Die letzte Variante möchte ich näher erläutern. Klassische Scanner basieren auf Fotografie, d.h.,. Es wird ein Einzelbild in sehr hoher Auflösung aufgenommen, bei 300 dpi sind das 3500 Pixel mal 2500 Pixel für ein DIN-A4 Blatt. Der Nachteil ist, dass der Scankopf manuell über das Blatt gefahren wird, um diese hohe Auflösung zu erreichen. Besser ist es, man fixiert den Kopf und nimmt stattdessen Video-Bilder auf.
Aus eigenen Versuchen konnte ich erforschen, dass dabei die Auflösung der kritische Faktor ist. Selbst die HD-Auflösung eines Camcorder ist zu niedrig. Man kann bei 1920×1020 jedoch bereits einen Teil der Seite in ausreichender Qualität aufnehmen, z.B. die rechte obere Ecke im Makromodus. Das ist ausreichend scharf und vor allem ist es Video!. wenn man also einen HD-Camcorder auf ein Stativ montiert und das Buch langsam per Hand durchblättert, entsteht auf diese Weise eine .mp4 Datei. Aus dieser extrahiert man mittels ffmpeg die einzelnen Bilder und erhält so:
seite1.jpg, seite2.jpg, seite3.jpg usw.
Um ein aufgeschlagenes Buch vollständig einzuscannen, benötigt man eine Video Camera mit höherer Auflösung als FullHD. Diese ist derzeit nicht käuflich verfügbar. Daher kann man behelfsmäßig auf einen 2. HD-Camcorder zurückgreifen: Camcorder A scannt die linke Seite, Camcorder B die rechte Buchseite. Damit erzielt man eine Gesamtauflösung von rund 4000×2000 Pixeln was für OCR ausreichend ist.
Der große Vorteil dieser Lösung besteht darin, dass sie sehr preiswert ist. Zwei HD-Camcorder inkl. Stativ gibt es bereits für 800-1000 EUR zu kaufen. Und diese kann man auch noch für andere Dinge verwenden, als nur Bücher zu scannen. (Zum Vergleich, der Scan-Robot kostet 70000 EUR!).
Montiert man jetzt die beiden Camcorder oberhalb eines aufgeschlagenes Buches, kann man halbautomatisch durch die Seiten blättern. Weil die Kameras mit 25 Bilder / Sekunde aufnehmen kann man relativ zügig die Seiten per Hand umblättern und macht wohl das, was als Speed Reading in die Literatur eingegangen ist.
Anschließend müssen die Dateien links.mp4 und rechts.mp4 lediglich zusammenmontiert werden und daraus Standbilder extrahiert werden. Mit denen füttert man dann eine Office-OCR-Anwendung wie beispielsweise ABBYY Finereader.
Um den Prozess des Umblätterns einheitlich zu gestalten, empfiehlt sich der Einsatz eines Metronoms. Alle 3 Sekunden ertönt ein Signalton, was den Bediener der Anlage dazu veranlasst die Seite umzublättern. Später kann anhand dieses konstanten Intervalls sehr leicht der Zeitindex für die Standbild-Generierung bestimmt werden. Man braucht ffmpeg also nur zu sagen: Zeitindex 00:00 = Bild1, 00:03 = Bild2, 00:06 = Bild3, 00:09 Bild4 usw.
Ein Standard-Buch mit 400 Seiten braucht man somit nur 200-mal umzublättern, was bei 3 Sekunden Dauer insgesamt 10 Minuten an Arbeitsaufwand bedeutet. Somit siedelt sich der Zeitbedarf zwischen einem Flachbettscanner und einem Scan-Robot an.
Ob es auf dem Markt preiswerte automatische Umblättervorrichtungen zu kaufen gibt, die nichts weiter tun als die Seiten zu wechseln, konnte ich in Erfahrung bringen. Beispielsweise sei der QiCare Lesebuttler für 2000 EUR genannt, der als REHA-Hilfsmittel mitunter von den Krankenkassen finanziert wird. Oder aber das “Turny Blattwendegerät” für 4000 EUR, http://www.rehavista.de/?at=Produkte&p=32110-ti
Aus der Produktbeschreibung: “Der elektronische Blattwender TURNY ermöglicht auch schwerstbehinderten Menschen das selbstständige Lesen von Büchern, Magazinen, Zeitschriften und Taschenbüchern.”
Etwas preiswerter sind die Angebote der Mindstorms Community. Den “Lego Page Turning Robot” gibt es im Spielzeugladens deines Vertrauens, der zudem noch in einen Plotter umgewandelt werden kann.
(überprüft mit Duden Korrektor 2.0, 7 Fehler wurden gefunden und entfernt)