Σε αντίθεση με ένα αρχείο κειμένου, δεν μπορείτε να επεξεργαστείτε απευθείας ένα PDF. Υπάρχουν πολλοί τρόποι δημιουργίας αρχείων PDF χρησιμοποιώντας κείμενο. Τι γίνεται όμως αν θέλετε να κάνετε το αντίστροφο και να μετατρέψετε PDF σε αρχεία κειμένου;
Ευτυχώς, το Linux σας επιτρέπει να τροποποιήσετε εύκολα αυτά τα αρχεία από το τερματικό. Αυτό το άρθρο θα δείξει πώς να μετατρέψετε ένα αρχείο PDF σε έγγραφο κειμένου στο Linux
Μετατροπή PDF σε κείμενο από το τερματικό
Το Poppler είναι μια βιβλιοθήκη λογισμικού που χρησιμοποιείται για την απόδοση και την τροποποίηση αρχείων PDF. Περιέχει ένα βοηθητικό πρόγραμμα, γνωστό ως pdftotext, που επιτρέπει στους χρήστες να δημιουργούν αρχεία κειμένου από PDF. Από poppler-utils δεν αποτελεί μέρος των τυπικών πακέτων Linux, θα πρέπει να το εγκαταστήσετε μη αυτόματα χρησιμοποιώντας έναν διαχειριστή πακέτων.
Στο Ubuntu και το Debian:
sudo apt εγκατάσταση poppler-utils
Για να εγκαταστήσετε το Poppler στο Arch Linux:
sudo pacman -S poppler
Εγκατάσταση του
poppler-utils Το πακέτο σε CentOS, Fedora και άλλες διανομές που βασίζονται σε RHEL είναι εύκολο.sudo dnf εγκαταστήστε poppler-utils
sudo yum εγκαταστήστε poppler-utils
Μετατροπή ολόκληρου PDF σε κείμενο
Η βασική σύνταξη της εντολής pdftotext είναι:
pdftotext [επιλογές] pdfile textfile
...όπου pdffile είναι η απόλυτη ή σχετική διαδρομή προς το αρχείο PDF, και αρχείο κειμένου είναι το όνομα του αρχείου εξόδου.
Για παράδειγμα, για μετατροπή lorem-ipsum.pdf σε αρχείο κειμένου:
pdftotext lorem-ipsum.pdf text.txt
Εάν το αρχείο που μετατρέπετε έχει υδατογραφήματα ή μη ευθυγραμμισμένο κείμενο, μπορείτε να τα απορρίψετε στην έξοδο χρησιμοποιώντας το -νόντιγκ σημαία.
pdftotext -nodiag lorem-ipsum.pdf random.text
Επεξεργασία σελίδων εντός συγκεκριμένου εύρους
Χρησιμοποιήστε το -φά και -μεγάλο επισημάνετε εάν θέλετε να μετατρέψετε σελίδες που εμπίπτουν σε ένα συγκεκριμένο εύρος. Για παράδειγμα, για να μετατρέψετε τις σελίδες από ένα έως πέντε σε lorem-ipsum.pdf σε κείμενο:
pdftotext -f 1 -l 5 lorem-ipsum.pdf έξοδος.txt
Για να μετατρέψετε μόνο την πρώτη σελίδα του αρχείου PDF:
pdftotext -f 1 -l 1 lorem-ipsum.pdf έξοδος.txt
Μετατροπή αρχείων PDF με προστασία κωδικού πρόσβασης σε κείμενο
Το Pdftotext μπορεί ακόμη και να μετατρέψει PDF που προστατεύονται με κωδικό πρόσβασης σε αρχεία κειμένου. ο -πάνω και -ποπ σημαίες, που αντιπροσωπεύουν Κωδικός Χρήστη και κωδικός πρόσβασης κατόχου αντίστοιχα, φροντίστε τη διαδικασία ελέγχου ταυτότητας κατά τη μετατροπή των αρχείων PDF.
pdftotext -upw κωδικός πρόσβασης lorem-ipsum.pdf output.txt
pdftotext -opw κωδικός πρόσβασης lorem-ipsum.pdf output.txt
Βεβαιωθείτε ότι έχετε αντικαταστήσει Κωδικός πρόσβασης με τον κωδικό πρόσβασης του αρχείου PDF.
Μπορείτε επίσης να συνδυάσετε πολλές σημαίες για να λάβετε την επιθυμητή έξοδο. Για παράδειγμα, για να μετατρέψετε τις σελίδες ένα σε τρία ενός PDF που προστατεύεται με κωδικό πρόσβασης σε κείμενο:
pdftotext -f 1 -l 3 -upw κωδικός πρόσβασης lorem-ipsum.pdf output.txt
Σχετιζομαι με: Πώς να μετατρέψετε ένα αρχείο PDF σε εικόνες στο Linux
Γραφική μετατροπή PDF σε αρχείο κειμένου
Εάν η εργασία με τη γραμμή εντολών δεν είναι το φλιτζάνι του τσαγιού σας, μπορείτε να μετατρέψετε PDF σε αρχεία κειμένου χρησιμοποιώντας λογισμικό γραφικών όπως το Caliber. Είναι μια εφαρμογή διαχείρισης ebook που μπορείτε να χρησιμοποιήσετε για προβολή, οργάνωση και τροποποίηση αρχείων PDF στο σύστημά σας.
Το Caliber είναι διαθέσιμο στα επίσημα αποθετήρια διανομής Linux και οποιοσδήποτε μπορεί να το κατεβάσει χρησιμοποιώντας έναν διαχειριστή πακέτων.
Για να εγκαταστήσετε το Caliber σε Ubuntu και Debian:
sudo apt install caliber
Στο Arch Linux:
sudo pacman -S διαμέτρημα
Σε διανομές που βασίζονται σε RHEL όπως το CentOS και το Fedora, μπορείτε να κατεβάσετε το Caliber χρησιμοποιώντας είτε DNF είτε Yum.
sudo dnf εγκατάσταση διαμετρήματος
sudo yum εγκατάσταση διαμετρήματος
Τρόπος χρήσης του Caliber για τη μετατροπή αρχείων PDF
Μόλις εγκατασταθεί, εκκινήστε το Caliber στο σύστημά σας χρησιμοποιώντας το Μενού εφαρμογών. Εναλλακτικά, μπορείτε να ξεκινήσετε το Caliber από το τερματικό πληκτρολογώντας:
διαμέτρημα
Για να δημιουργήσετε αρχεία κειμένου χρησιμοποιώντας PDF με Caliber:
- Κάνε κλικ στο Προσθήκη βιβλίων επιλογή από το μενού.
- Εντοπίστε και επιλέξτε το αρχείο PDF που θέλετε να μετατρέψετε.
- Επισημάνετε το αρχείο PDF από τον κεντρικό πίνακα και επιλέξτε Μετατροπή βιβλίων από το μενού.
- Από το Μορφή εξόδου αναπτυσσόμενο μενού, επιλέξτε κείμενο.
- Τέλος, κάντε κλικ στο Εντάξει να συνεχίσει.
Το Caliber θα αρχίσει τώρα να μετατρέπει το καθορισμένο αρχείο PDF σε έγγραφο κειμένου. Μπορείτε να ελέγξετε την κατάσταση της διαδικασίας κάνοντας κλικ στο Θέσεις εργασίας επιλογή, που βρίσκεται κάτω δεξιά στο παράθυρο.
Εργασία με αρχεία PDF στο Linux
Όταν θέλετε να μοιραστείτε ένα έγγραφο με κάποιον, η μετατροπή του σε PDF πριν από την κοινή χρήση είναι ο πιο αποτελεσματικός τρόπος. Πριν, οι χρήστες έπρεπε να εγκαταστήσουν ένα ειδικό πρόγραμμα προβολής PDF στο σύστημά τους για την εμφάνιση αρχείων PDF, αλλά τώρα, σχεδόν κάθε πρόγραμμα περιήγησης διαθέτει ενσωματωμένο πρόγραμμα προβολής PDF.
Μπορείτε να βρείτε πολλές εφαρμογές που επιτρέπουν στον χρήστη να βλέπει και να επεξεργάζεται αρχεία PDF εύκολα. Πολλές εγκαταστάσεις Linux αποστέλλονται με το LibreOffice, μια σουίτα λογισμικού γραφείου, που μπορεί να χρησιμοποιηθεί ως πρόγραμμα επεξεργασίας PDF.
Θέλετε να επεξεργαστείτε ένα αρχείο PDF στο Linux; Αυτοί οι επεξεργαστές PDF Linux είναι δωρεάν για εγκατάσταση και εύχρηστοι.
Διαβάστε Επόμενο
- Linux
- Πρόγραμμα επεξεργασίας PDF
- Linux
Ο Deepesh είναι ο Junior Editor για Linux στο MUO. Γράφει ενημερωτικό περιεχόμενο στο Διαδίκτυο για πάνω από 3 χρόνια. Στον ελεύθερο χρόνο του, του αρέσει να γράφει, να ακούει μουσική και να παίζει κιθάρα.
Εγγραφείτε στο Newsletter μας
Εγγραφείτε στο ενημερωτικό δελτίο μας για τεχνικές συμβουλές, κριτικές, δωρεάν ebook και αποκλειστικές προσφορές!
Ένα ακόμη βήμα…!
Επιβεβαιώστε τη διεύθυνση email σας στο email που μόλις σας στείλαμε.