Phoibos Geschrieben Dezember 3, 2010 Geschrieben Dezember 3, 2010 moin, ich gehe mit dem gedanken schwanger, ein buch einzuscannen und durch eine texterkennung zu jagen, damit ich mir die abtipperei sparen kann. das buch ist in fraktur, polytonischen griechisch und antiqua gesetzt (hebräisch ist nicht ausgeschlossen). habt ihr erfahrung mit derlei problemen? welche programme (macos oder windows) könnt ihr empfehlen? was verwendet google für seine büchersammlung (das von mir gewünschte ist leider nicht dabei)? soweit ich mich erinnere, gab es von abby mal eine spezielle frakturlösung, habe die jedoch nicht auf deren website gefunden. ciao phoibos
Þorsten Geschrieben Dezember 3, 2010 Geschrieben Dezember 3, 2010 Keine eigene Erfahrung damit, aber wie wär’s mit http://code.google.com/p/ocropus/? OCRopus is a state-of-the-art document analysis and OCR system, featuring pluggable layout analysis, pluggable character recognition, statistical natural language modeling, and multi-lingual capabilities. Da solltest du die Fraktur-Erkennung »reinpluggen« (dieses Denglisch immer! ) können.
Frakturfreak Geschrieben Dezember 3, 2010 Geschrieben Dezember 3, 2010 Für tesseract gibt es auch ein Fraktur-Plugin. Nur sollten die Bilder schon sehr scharf sein, sonst kommt da viel Unsinn raus.
Cajon Geschrieben Dezember 4, 2010 Geschrieben Dezember 4, 2010 Da solltest du die Fraktur-Erkennung »reinpluggen« (dieses Denglisch immer! ) können. „einklinken“?
Empfohlene Beiträge
Erstelle ein Benutzerkonto oder melde dich an, um zu kommentieren
Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können
Benutzerkonto erstellen
Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!
Neues Benutzerkonto erstellenEinloggen
Du hast bereits ein Benutzerkonto? Melde dich hier an.
Jetzt anmelden