Forum: PC Hard- und Software Qualität von Scans verbessern


You were forwarded to this site from EmbDev.net. Back to EmbDev.net
von Horscht (Gast)


Lesenswert?

Hallo,
ich scanne gerade diverse Textdokumente (A4) ein. Das mache ich in 600 
DPI und Schwarz/Weiß, was einen ganz guten Kompromiss zwischen Qualität 
und Dateigröße ergibt.

Allerdings würde ich die Scans gerne noch etwas aufhübschen. Folgendes 
stört mich:
 - Manche Seiten werden leicht schief eingezogen, und sind daher dann 
geringfügig schief
 - Die Textqualität ist an den Kanten etwas unsauber (vermutlich durch 
den SW-Scan)
 - Zum Teil sind Artefakte an den Seiten (dunkle Ränder), wenn das Blatt 
schief eingezogen wurde

Daher überlege ich nun, ob man was dagegen tun kann. Z.B. könnte ich in 
Graustufen scannen, um mehr Bildinformationen zu retten. Anschließend 
wäre eine (automatisierte) Software-Nachbearbeitung sicherlich in der 
Lage, schönere Schwarz/Weiß Bilder zu erzeugen, als es der Scanner 
direkt kann.

Kennt jemand Tools mit denen sowas möglich ist?

PS: "unpaper" habe ich ausprobiert. Das funktioniert gar nicht (entweder 
stürzt es ab oder erzeugt kauptte Dokumente).

von Wendels B. (wendelsberg)


Lesenswert?

Horscht schrieb:
> - Manche Seiten werden leicht schief eingezogen, und sind daher dann
> geringfügig schief

Einzug reparieren.

von fragjanur (Gast)


Lesenswert?

sehr interessante Frage.
mich würde noch interessieren, ob es eine Software gibt, aus der man 
über die verschiedenen Graustufen wieder die Originalfarben 
rekonstruieren kann.

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Was ist das Ziel der Scan-Aktion?

Normal wäre, dass gescannter Text per OCR eben wieder in 
(durchsuchbaren) Text umgewandelt wird und lediglich Bilder und Grafiken 
im Original verbleiben.

Wir verwenden in der Firma z.B. "Readiris 17 Pro", das kann u.a. auch 
Seiten geradestellen und der per OCR erkannte Text ist logischerweise 
danach absolut sauber und scharf. Zudem sinkt die Dateigröße in 
beachtlicher Weise.

Für OCR sind 600 dpi deutlich übertrieben, üblich sind eher 300 dpi 
(ergibt 1/4 der Dateigröße). Auch für Bilder und Grafiken aus gedruckten 
Büchern ergibt das wegen der Rasterung nicht wirklich Sinn.

Dann wäre da noch das Dateiformat. Für Bilder mit harten Kanten 
(Buchstaben!) ist JPEG (wegen der DCT) eher weniger geeignet, produziert 
Artefakte und Geisterpixel. Hier passen TIFF oder PNG deutlich besser.

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

fragjanur schrieb:
> sehr interessante Frage.
> mich würde noch interessieren, ob es eine Software gibt, aus der man
> über die verschiedenen Graustufen wieder die Originalfarben
> rekonstruieren kann.

Bestenfalls Falschfarben wie Thermobilder :-)

Informationen, die nicht aufgenommen werden, sind schlicht nicht 
vorhanden. Mit Regeln oder gar KI-Algorithmen könnte man evtl. die 
Textstruktur erfassen und z.B. alle Überschriften blau und den 
Mengentext schwarz einfärben ...

von MiWi (Gast)


Lesenswert?

fragjanur schrieb:
> sehr interessante Frage.
> mich würde noch interessieren, ob es eine Software gibt, aus der man
> über die verschiedenen Graustufen wieder die Originalfarben
> rekonstruieren kann.

Nein.

Und wenn Du nur ein bischenbischen nachdenken würdest würdest Du auch 
selber darauf kommen das dem so ist das es nciht geht. Selbst die 
Evolution hat das nicht hinbekommen, für dieses "Problem" aber 
bemerkenswerte Anpassungen hervorgebracht (scheinbares Farbsehen im 
Mondlicht)

von fragjanur (Gast)


Lesenswert?

MiWi schrieb:
> Nein.
>
> Und wenn Du nur ein bischenbischen nachdenken würdest würdest Du auch
> selber darauf kommen das dem so ist das es nciht geht.

nicht jedem ist es gegeben, Ironie zu erkennen ;-)

von udok (Gast)


Lesenswert?

Horscht schrieb:
> Kennt jemand Tools mit denen sowas möglich ist?

Der Acrobat Professional macht das alles recht gut.

von Frank K. (fchk)


Lesenswert?

Horscht schrieb:

> Daher überlege ich nun, ob man was dagegen tun kann. Z.B. könnte ich in
> Graustufen scannen, um mehr Bildinformationen zu retten. Anschließend
> wäre eine (automatisierte) Software-Nachbearbeitung sicherlich in der
> Lage, schönere Schwarz/Weiß Bilder zu erzeugen, als es der Scanner
> direkt kann.

Es gibt spezielle Dokumentenscanner. Die machen genau das, was Du 
willst.

Die haben Sensoren, um zu erkennen, wenn mehrere Blätter auf einmal 
eingezogen werden.
Die richten Textseiten automatisch aus, so dass der Text nicht nur 
gerade, sondern auch lesbar (richtigrum) ist.
Die erkennen Ränder und können die Artefakte entfernen.
Die haben einstellbare Blindfarben (rot oder grün), die beim Lesen nicht 
erkannt werden.
Die können andersfarbige Trennblätter automatisch erkennen und Jobs 
entsprechend separieren.

usw. usw.

Anbieter sind vor allem Fujitsu und Kodak (jetzt Alaris).

fchk

von oszi40 (Gast)


Lesenswert?

Frank K. schrieb:
> Es gibt spezielle Dokumentenscanner.

Die sind so schnell wie manche Geldzählmaschine und kosten mehr als 
3,50€.
Nachcolorieren ist eine andere Geschichte. Jedenfalls kann man aus einem 
schlecheten Scan kein super Foto machen.

von Mitleser (Gast)


Lesenswert?

Bezüglich Farben aus Graustufen,
was bereits heute möglich ist:

https://imagecolorizer.com/de/colorize.html
oder
https://deepai.org/machine-learning-model/colorizer

MfG

von Egon D. (Gast)


Angehängte Dateien:

Lesenswert?

Horscht schrieb:

> Kennt jemand Tools mit denen sowas möglich ist?

Wenn Bastelleidenschaft vorhanden ist, kann ich die
netpbm-Suite empfehlen. Das ist eine Kramkiste mit
allen möglichen Kommandozeilen-Werkzeugen, die sich
gut scripten lassen.


"Schwarze Ränder entfernen" geht angeblich mit pnmcrop;
habe ich aber selbst noch nicht ausprobiert.

Zum "Kanten glätten" habe ich einen relativ einfachen
Algorithmus entwickelt; Arbeitsprobe im Anhang, Details
bei Bedarf.

"Seite automatisch ausrichten" ist noch ungelöst; das
ist aus verschiedenen Gründen eine recht komplexe Sache.

von Dieter J. (fossi)


Lesenswert?


von René H. (mumpel)


Lesenswert?

oszi40 schrieb:
> Frank K. schrieb:
>> Es gibt spezielle Dokumentenscanner.
>
> Die sind so schnell wie manche Geldzählmaschine und kosten mehr als
> 3,50€.
>

Wo ist da das Problem? Dafür bekommt man auch einen 2-Seiten-Scanner mit 
10-Blatt-Einzug. Und so langsam sind die auch wieder nicht. Ich habe den 
Canon imageFormula, der ist schneller als manch ein Flachbettscanner.

von Walter T. (nicolas)


Lesenswert?

Egon D. schrieb:
> "Seite automatisch ausrichten" ist noch ungelöst; das
> ist aus verschiedenen Gründen eine recht komplexe Sache.

Wenn Du in Python oder Matlab skriptest, geht das über eine 
Singulärwertzerlegung.

Jedes Pixel wird über Helligkeit (oder Schwellwert) und x-y-Koordinate 
gewichtet. Mit einer Singulärwertzerlegung findet man die Hauptachsen. 
(2 Gleichunge, 2 Unbekannte). Wenn die Pixel irgendwie gehäuft in 
horizontalen Linien angeordnet sind (Zeilen), funktioniert das prima.

(Ich hatte das mal in Matlab gescriptet, aber mein aktueller Scanner hat 
es schon eingebaut.)

: Bearbeitet durch User
von Klaus P. (kpi6288)


Lesenswert?

Horscht schrieb:
> Allerdings würde ich die Scans gerne noch etwas aufhübschen.

Imagemagick wird oft empfohlen, z.B. hier: 
https://superuser.com/questions/204230/which-free-software-can-i-use-to-deskew-scanned-images

Als Suchwort kannst Du z.B. "deskew" benutzen

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.