Wie kann ich Fotos von Papierdokumenten in ein gescanntes Dokument verwandeln?

44

Mein Scanner ist kaputt! Ich habe zwar eine gute Kamera, deshalb habe ich ein paar Fotos von den Dokumenten gemacht, die ich scannen möchte ... Sie sehen jedoch aus wie Fotos aus Papier, nicht wie gescannte Dokumente:

  • Bilder sind nicht flach
  • Die Beleuchtung ist nicht gleichmäßig (Schatten, wenn sich die Seite verzieht usw.)
  • Text wird offensichtlich nicht in kopierfähigen PDF-Text verarbeitet.

Sie sind einfach nicht für den professionellen Einsatz geeignet, aber sie sind nah.

Ich bin auf der Suche nach einer Funktion (oder Methode), die all diese Funktionen ausführen kann, damit ich von einer Reihe von JPG-Dateien zu einer einzelnen [optional] mit Anmerkungen versehenen PDF-Datei des gesamten Objekts wechseln kann, die im richtigen Format (A4) vorliegt typisch).

Irgendwelche Vorschläge (außer einen neuen Scanner zu kaufen)?

Oli
quelle
1
Unter Android kann Googles Drive-App ein wenig verarbeiten und aus einer Reihe von Bildern eine PDF-Datei im A4-Format erstellen (einen neuen "Scan" erstellen). Wenden Sie dabei Schwarzweiß und ein bisschen Begradigung an (beide in der App) Erstellen) darauf und es sieht meistens nach einem (minderwertigen) Scan aus. OCR ist ein schwierigeres Problem.
muru
Ich kenne keine Ubuntu-Software, habe aber meinen Scanner verworfen, nachdem ich festgestellt hatte, dass auf einem Mobiltelefon Apps vorhanden sind, die meistens dasselbe tun. Vielleicht möchten Sie sich die Genius Scan-App (für Android) oder Scannable (für iPhone) ansehen. Dann bewerben pdfjoin, um sie zusammen zu nähen. Keine Texterkennung.
Jos
Der Grund, warum ich dies über Fotos und nicht über eine mobile App machen möchte, ist, dass meine DSLR-Kamera [buchstäblich] tausendmal besser ist als die Kamera meines Telefons. Und wenn es nichts gibt, was dies auf einen Schlag bewirkt, kann ich die OCR tatsächlich selbst handhaben. Es gibt viele Open-Source-Projekte, die gute Arbeit leisten.
Oli
Ich habe meinen Scanner vielleicht gerade mit Klebeband, Toast und Marmelade wiederbelebt, damit die Dringlichkeit nachlässt, aber ich denke, das ist immer noch ein interessantes Problem.
Oli
Oli , ich habe einige Beispiele auf Stackexchange gegoogelt, wie dieses tex.stackexchange.com/questions/94523/simulate-a-scanned-paper und dieses stackoverflow.com/questions/8955425/… nur nicht sicher, ob ich deine Frage richtig gestellt habe;)
JoKeR

Antworten:

45

Dafür gibt es verschiedene Möglichkeiten. Obwohl alle meine vorgeschlagenen Wege ein Problem haben, werden sie Ihr Bild nicht wirklich platt machen. Ein mehr oder weniger gutes Bild wäre noch erforderlich.

Eine einfache Möglichkeit ist, dass Sie die Software ScanTailor ausprobieren

sudo apt-get install scantailor 

In 6 Schritten optimieren Sie Ihre Fotos. Im letzten Schritt können Sie die Option "Beleuchtung ausgleichen" auswählen, um einen schönen, sauberen Look zu erhalten!


Persönlich benutze ich normalerweise nur GIMP . Sie benötigen jedoch einige grundlegende Fähigkeiten, um Ihr Ziel zu erreichen.

sudo apt-get install gimp 
  1. beschneide das Bild in der gewünschten Weise
  2. Verwenden Sie die Option Colors-> Curves, um die Farbausgabe so zu bearbeiten, wie Sie es möchten ...

Passen Sie die Farbkurven an, um eine schöne, saubere Ausgabe zu erhalten.


Ein weiteres nettes kleines Programm ist gscan2pdf , mit dem Sie auch Fotos laden und als PDF exportieren können. Es gibt sogar einen Link zu GIMP, so dass Sie das Foto mit den oben beschriebenen Schritten verbessern können .

sudo apt-get install gscan2pdf 
wittich
quelle
1
Ich habe ScanTailor noch nie gesehen. Es scheint fast perfekt zu sein, außer dass ich nicht herausfinden kann, wie ich es als etwas speichern möchte, das ich behalten möchte (z. B. PDF). Irgendwelche Ideen?
Oli
PS: Willkommen bei Ask Ubuntu und Stack Exchange!
Oli
1
@Oli Die Ausgabe wird in dem Ordner gespeichert, den Sie zu Beginn ausgewählt haben. Wie ich jetzt sehe, speichert es es als tiff. Sie möchten also eine convert file.tiff file.pdfin der Konsole ausführen .
wittich
2
Oh ja, mein schlechtes. Ich benutze mehrere Seiten, also konvertiere ich sie in PNG mit find -maxdepth 1 -name '*.tif' -exec convert {} {}.png \;und verbinde sie dann mit pdfjoin --outfile output.pdf --a4paper --rotateoversize false *.png. Ich denke nur laut nach, wenn ich vergesse, wie das alles funktioniert :) Nochmals vielen Dank.
Oli
2
ScanTailor war eine Entdeckung !!! Normalerweise mache ich all diese Dinge in Gimp oder einer proprietären App wie Gimp, aber Scan Tailor bietet nur die Funktionen, die ich brauche, um meine Bilder in gescannte Bilder umzuwandeln und das Rauschen zu beseitigen bewege dich in Gimp. Vielen Dank !!!
Kostyantyn
20

Um eine druckfähige Kopie oder eine PDF-Datei aus einem Kamerabild eines Dokuments zu erstellen, müssen wir eine ganze Menge von Hand konvertieren, um ein Bild zu erzielen, das dem Ergebnis eines Scanners ähnelt. Die meisten dieser Konvertierungen können mit Gimp durchgeführt werden.

  1. Versuchen Sie, das Originalbild so gut wie möglich zu machen :

    • Wählen Sie ein helles Licht, um Pixelrauschen zu reduzieren. Um jedoch Reflexionen, Ausbluten oder ungleichmäßige Lichtstreuung zu vermeiden, verwenden Sie keinen Blitz, es sei denn, Sie verfügen über ein Studioblitzgerät.
    • Wenn möglich, sollte die Quelle von mindestens zwei Seiten beleuchtet werden (oben-unten oder rechts-links).
    • Nehmen Sie das Foto aus größerer Entfernung mit einem Teleobjektiv und nicht mit einem Weitwinkelobjektiv auf.
    • Verwenden Sie ein Stativ, um ein Verwackeln der Artefakte zu vermeiden.
    • Richten Sie die Kamera orthogonal zur Oberfläche der Quelle aus.
    • Fügen Sie etwas Platz ein, der an die ursprüngliche Quelle angrenzt.
  2. Betrachten Sie die Entsättigung in Graustufen, um den Kontrast zu verbessern und farbige Pixelartefakte zu entfernen.

    Bildbeschreibung hier eingeben

  3. Stellen Sie Helligkeit und Kontrast so ein , dass der vermutlich graue Hintergrund weiß und die schwarzen Buchstaben schwarz sind.

    • Mit dem Werkzeug Gimp Colors> Levels können Sie schnell den Schwarzpunkt (links) und den Weißpunkt (rechts) ziehen oder die Schwarz / Weiß-Punkte mit dem Farbwähler auswählen.

    Bildbeschreibung hier eingeben

    • Schatten auf gebogenen Ecken dürfen nicht entfernt werden, ohne auch Teile des Textes zu entfernen (siehe 6.)
  4. Kissenverzerrung entfernen?

    Abhängig von unserer Fotoobjektivqualität und der verwendeten Zoomstufe können Kissenartefakte auftreten, die dazu führen, dass die äußeren Ränder des Dokuments verbogen werden. Es gibt Plugins, mit denen diese Artefakte ebenfalls entfernt werden können. Wir können jedoch feststellen, dass es schneller ist, eine Zoomstufe für unsere Kamera auszuwählen, bei der sie nur minimal ist. Nach dem Zuschneiden (5.) werden wir sie möglicherweise nicht mehr bemerken. Das Entfernen von Kissenartefakten ist daher möglicherweise nur dann erforderlich, wenn unser Quellbild viele gerade Linien in den äußeren Bereichen aufweist.

  5. Drehen und zuschneiden oder perspektivisch transformieren Sie das Bild bei Bedarf.

    Im Gegensatz zu einem Scanner kann es sein, dass unsere Kamera die Quelle nicht parallel zu den Bildrändern empfängt. Das Gimp- Werkzeug " Drehen" oder " Perspektive " gibt uns ein visuelles Feedback, damit wir die Perspektive eines Bildes drehen oder anpassen können, bis die Textzeilen parallel zur Seite verlaufen.

    Bildbeschreibung hier eingeben
    Perspective Tool auf der rechten Seite

Jetzt können wir die Dokumentquelle mit dem Rechteckauswahlwerkzeug auswählen, um das Bild innerhalb des Dokuments zuzuschneiden.

  1. Entfernen Sie unerwünschte Schatten von Biegungen, Falten oder Vignettierungsartefakten vom Kameraobjektiv.

    • Diese Schatten sind schwer zu entfernen und es gibt kein Plugin oder automatischen Filter, der uns hilft.
    • Theoretisch könnten wir diesen Bereichen eine Gradientenfüllung überlagern, aber dies führt möglicherweise nicht zu den erwarteten Ergebnissen und ist daher möglicherweise nicht die Zeit wert, die wir benötigen würden.
    • Die schnellste Methode ist daher, einfach das Radiergummi-Werkzeug zu verwenden, um all die hässlichen Schatten außerhalb des Texts zu entfernen (die wir schonen sollten).

      Bildbeschreibung hier eingeben gelöscht -> Bildbeschreibung hier eingeben

  2. Bild skalieren?

    Abhängig von der Kameraauflösung wird durch Skalieren des Bilds auf eine Scannerbildgröße nur die Dateigröße erhöht, die Bildqualität wird jedoch nicht beeinträchtigt. Durch Verkleinern werden Details entfernt. Aus diesem Grund sollten wir das Bild nicht skalieren, sondern die Druckgröße über den Druckerdialog (oder unter 8.) anpassen.

  3. PDF generieren

    Wir können unser nun schön manuell restauriertes Image in LibreOffice ( Insert> Media ) importieren

    • Definieren Sie seine Dimensionen
    • Als PDF exportieren
    • Drucken (für mich führt das Drucken aus LibreOffice viel häufiger als alles andere zu einem gewünschten Ergebnis).
Takkat
quelle
Vielen Dank für die detaillierten Schritte. Sie haben mir geholfen, ein langjähriges Problem beim Konvertieren von Fotos in gescannte Dokumente zu lösen. Ich bin total beeindruckt von der Kraft der Perspektiventransformation.
Chethan S.
Geniale Antwort! Das Perspektiventool war für mich zunächst ziemlich verwirrend, daher hier eine großartige Anleitung. Ich habe 4 Hilfslinien hinzugefügt und dann die Ecken des Bildes mit dem Perspektivwerkzeug so lange gezogen, bis das Bild mit allen 4 Hilfslinien im Quadrat war.
Gabriel Staples
(24 Stunden später). Hoppla! Ich habe den Link vergessen. Hier ist der Leitfaden, über den ich gesprochen habe: lifewire.com/… .
Gabriel Staples
1

Wenn Sie das Bild des Dokuments bereits haben, laden Sie einfach die CamScanner-App auf Ihr Telefon / Tablet herunter. Hiermit können Sie das Bild importieren, dann einen Vorschlag für den Zuschnitt erstellen und die Abflachung sowie die Anpassung von Farben / Kontrast usw. vornehmen. Dies dauert nur eine Minute.

Dan
quelle