Clanintern Clanintern Clanintern

Forum

Öffentliche Foren
FORUM: Spiele & Computer THEMA: texterkennungsprogramm
AUTOR BEITRAG
Torian *Thermodynamik bestanden*

RANG Ober0wn3r

#1 - 30.12 11:36

Hi

Ich habe hier ein eingescanntes Werkstatthandbuch, das aus ein paar 100 jpg Dateien besteht und 80mb groß ist. Ich würde das gerne eine eine kleine und saubere pdf datei umwandeln. Dazu brauch ich ja ein Programm, das den Text erkennt und ihn vom Bild in ein Dokument überträgt. Dadurch wird der Speicherverbrauch ja massiv reduziert und va kann ich dann das dokument durchsuchen.
Kann mir jemand dafür was empfehlen?

Und noch ne Frage: Da sind ja viele (Explosions-)Zeichnungen abgebildet. Ich habe schon einige Handbücher gesehen, wo diese nicht als Bilddateien, sondern als Vektorgrafik (?) enthalten sind. Also man kann beliebig ranzoomen und es wird (wie bei der schrift auch) nicht unscharf.
Kann ein solches Texterkennungsprogramm auch solche Zeichnungen in Vektorgrafiken (wenn es welche sind) umwandeln, oder braucht man dazu noch ein extraprogramm?


als beispiel mal eine seite hier:
http://img246.imageshack.us/img246/5605/018cj8.jpg
cibo

RANG Lord of Clanintern

#2 - 30.12 13:11

Erkennen: Acrobat z.B., soll auch recht gut sein.

Aber die Bilder in Vektorgraphiken zu erhalten, dass wird extrem umständlich. Wenn es überhaupt geht.
.iŞħάώŋ

RANG Prophet of Clanintern

#3 - 30.12 13:12

denke auch nicht das das geht. wo keine information ist, kann auch nix umgewandelt / vergrössert werden.
huma

RANG Hardcore Sucker

#4 - 30.12 13:18

Mit dem Adobe Illustrator könnte man das machen. Der hat auch schon ne Funktion dafür eingebaut.
Wenn man die Bilder davor noch etwas bearbeitet könnte es evtl. was werden.

Bsp. mal eben auf die Schnelle (ohne vorherige Bearbeitung, Standardeinstellungen)
http://rapidshare.com/files/80065242/vektor01.pdf
Perseus

RANG Godlike

#5 - 31.12 11:05

Weder Illustrator noch Acrobat haben OCR-Fähigkeiten!


als Freeware gibts zum Beispiel GOCR bzw JOCR - hab ich aber noch nie ausprobiert...
cibo

RANG Lord of Clanintern

#6 - 31.12 11:18

Natürlich hat der Acrobat OCR. Nicht der Reader, sondern der Acrobat (Professional).

Unter Docoment -> OCR Text Recognition.


Das läuft dann auf eine PDF raus, die das gescannte Bild als Hintergrund hat, und wenn man etwas markiert und kopiert, erhält man den erkannten Text. Danach kann man dann natürlich auch suchen.
Perseus

RANG Godlike

#7 - 31.12 12:13

ähm...*hust*...interessante Sache, sorry, hab ich echt nich gewusst. Hab ich auch nirgends von gelesen.

Ich nehme alles zurück und behaupte das Gegenteil.
cibo

RANG Lord of Clanintern

#8 - 31.12 13:07

Mei, dafür schreibt man ja