Scannen Sie viele Seiten direkt in ein PDF

36

Gibt es ein einfach zu bedienendes Programm in Ubuntu, das viele Seiten direkt in eine PDF-Datei scannen kann?

pupeno
quelle
Ich frage mich nur, ob für Scanner / Drucker, die ich in Ubuntu verwenden möchte, spezielle Qualifikationen erforderlich sind.
JFW
@JFW, hier ist eine Liste der unterstützten Geräte für XSane, das von den meisten Ubuntu-Scannern verwendete Back-End. HP Drucker / Scanner / Kopierer scheinen für Sie eine gute und zuverlässige Wahl zu sein.
Poolie

Antworten:

38

Die Idee, ein einfaches Scan-Dienstprogramm zu haben, stand hinter der Entwicklung von Simple Scan - dem Scan-Tool, das ab 10.04 standardmäßig installiert ist (Anwendungen ‣ Grafiken ‣ Simple Scan). Alt-Text

Scannen Sie einfach so viele Seiten, wie Sie möchten, und wählen Sie beim Speichern PDF als Dateiformat aus.

Ein weiteres etwas weniger einfaches Programm, das zusätzliche Funktionen wie die Texterkennung bietet , ist gscan2pdf , ebenfalls in den Repositories. Alt-Text

Marcel Stimberg
quelle
3
+1 für Simple Scan - es ist so einfach und einfach, aber auch sehr leistungsfähig - es ist besonders für den von Ihnen genannten Job geeignet.
8128,
6

"Einfach zu bedienen" liegt im Auge des Anwenders, xsanebietet aber diese Funktionalität. Wählen Sie eine mehrseitige Anzeige mit der Aufschrift "Viewer" (oder drücken Sie STRG-M), und es sollte nicht allzu schwierig sein, dies herauszufinden.

Karl Bielefeldt
quelle
1
Persönlich sehe ich Xsane als weit entfernt von einfach zu bedienen ...
8128
Ich benutze xsane die ganze Zeit. Mir ist nie in den Sinn gekommen, dass es ein besseres Werkzeug geben könnte.
Amanda
3

Ich habe verwendet, xsanebis ich diese Frage gesehen habe und die Benutzeroberfläche, gelinde gesagt, als eigenwillig, aber effektiv angesehen habe.

Als ich diese Frage sah, suchte ich nach gscan2pdf und fand es in den Ubuntu Lucid / Maverick-Repositories. Es verwendet dieselbe Scan-Engine (libsane), aber die Benutzeroberfläche ist weitaus gnomischer. Versuchen Sie für eine gute Zeit:

sudo apt-get install gscan2pdf
msw
quelle
3

Ändern Sie den Dateinamen von myfile.jpg in myfile.pdf im Speicherdialog von Simple Scan.

Getestet unter Ubuntu 14.04, Simple Scan 3.12.1.

Dies funktioniert, obwohl in der Dropdown-Liste für den Dateityp nicht "PDF", sondern nur "Bilder" angezeigt wird. Ich halte das für einen UI-Bug.

Diese Funktion ist dokumentiert auf Help > Contents:

Wählen Sie im Dialogfeld "Speichern unter" einen der unterstützten Dateitypen aus oder ändern Sie einfach die Erweiterung im Feld "Name".

Es heißt, dass die folgenden Formate unterstützt werden:

  • PDF
  • JPEG
  • PNG
  • TIFF

Interessante Tatsache: Wenn Sie den Scan-Typ (Dropdown neben "Scan") in "Text" ändern, wird der Standard-Dateityp PDF.

Ciro Santilli ist ein Schauspieler
quelle
1

Scannen Sie Seiten vom USB-Scanner. Verwenden Sie tesseract, um eine PDF-Datei mit OCR zu versehen. Führen Sie mehrere Seiten zu einer PDF zusammen. Verwendung: scan2PDF outputfilename number_of_pages

#!/bin/bash
#scan2PDF
#Requires:      tesseract 3.03 for OCR to PDF
#               scanimage for scanning, I use  1.0.24
#               pdfunite to merge multiple PDF into one, I use 0.26.5
#
#       Use scanimage -L to get a list of devices.
#       e.g. device `genesys:libusb:006:003' is a Canon LiDE 210 flatbed scanner
#       then copy/paste genesys:libusb:006:003 into SCANNER below.
#       play with CONTRAST to get good images
DPI=300
TESS_LANG=nor  #Language that Tesseract uses for OCR
SCANNER=genesys:libusb:006:003  #My USB scanner
CONTRAST=35   #Contrast to remove paper look

FILENAME=$1 #Agrument 1,filename
PAGES=$2    #Argument 2, number of pages

re='^[0-9]+$'  #Check if second argument is a number
if ! [[ ${PAGES} =~ $re ]] ; then
   echo "error: Usage: $0 filename number_of_pages" >&2; exit 1
fi

SCRIPT_NAME=`basename "$0" .sh` #Directory to store temporary files
TMP_DIR=${SCRIPT_NAME}-tmp

if [ -d ${TMP_DIR} ]  #Check if it exists a directory already
then
        echo Error: The directory ${TMP_DIR} exists.
        exit 2
fi
mkdir ${TMP_DIR}  #Make and go to temp dir
cd ${TMP_DIR}

echo Starts Scanimage...
scanimage -d ${SCANNER} --format=tiff --mode Color --resolution ${DPI} -p --contrast ${CONTRAST} --batch-start=1 --batch-count=${PAGES}  --batch-prompt


echo Starts Tesseract OCR

for file in  *.tif  #Goes through every tif file in temp dir
do
        tesseract $file  ${file%.tif} -l ${TESS_LANG} pdf

done

if [ "$PAGES" = "1" ] #How many pages
then
    cp out1.pdf ../${FILENAME}.pdf  #Only one page, just copy the PDF back
else
        for file in *.pdf  #More pages, merge the pages into one PDF and copy back
    do
            pdfuniteargs+=${file} 
            pdfuniteargs+=" "
    done
    pdfunite $pdfuniteargs ../${FILENAME}.pdf
fi
    echo ${FILENAME}.pdf done

rm *                    #Done, clean up
cd ..
rmdir ${TMP_DIR}
morten
quelle
es ist eine sehr Linuxoidal Methode
rth
1

Für diejenigen unter Ihnen, die XSANE verwenden möchten. Es ist sehr leistungsfähig und intuitiv, sobald Sie das Setup-Handbuch gelesen haben, das im Programm unter Hilfe> XSane Doc verlinkt ist - um zu erfahren, wie viel Sie damit tun können. Es lohnt sich auch zu überprüfen, ob Ihr SANE-Backend ordnungsgemäß funktioniert (nicht zu archspezifisch): https://wiki.archlinux.org/index.php/SANE

Wenn Sie Dokumente automatisch über einen Einzug scannen möchten und sich fragen möchten, wann XSane anhalten soll (und nicht zu früh anhalten soll), geben Sie oben links einfach eine Zahl ein (Symbol für die Anzahl der Scans), die größer ist als die Anzahl der passenden Seiten in Ihrem Feeder. Wenn Ihr Einzug 10 Seiten aufnehmen kann, geben Sie 15 ein (um Dickenschwankungen zu berücksichtigen). Wenn Sie einen Duplex-Scanner haben, verdoppeln Sie diese Zahl.

Wenn der Feeder leer ist, wird ein Dialogfeld mit einem grünen Warndreieck mit der Aufschrift "Gescannte Seiten: 0" angezeigt. Dies bedeutet nur, dass der Feeder leer ist und Sie den Dialog schließen können. Wenn Sie "Viewer" oder "Speichern" ausgewählt haben "Oben rechts in XSane befinden sich dann alle Dateien. Denken Sie daran, sie im Viewer zu speichern. Jetzt können Sie erneut auf" Scannen "drücken, um an der Stelle fortzufahren, an der Sie aufgehört haben. Die Nummern werden ab demselben Punkt erhöht, oder Sie können beginnen Ein neues Projekt Es werden keine leeren Seiten hinzugefügt. Wenn Sie "Mehrseitig" ausgewählt haben, sollte der Projektdialog alle abgeschlossenen Scans anzeigen und Sie können darauf klicken, um sie als mehrseitiges PDF, TIFF oder PostScript zu speichern.

HTH,

DC

user901387
quelle