Θέλετε να μάθετε πώς μπορείτε να καταγράψετε μια ιστοσελίδα και να την αποθηκεύσετε ως έγγραφο PDF ή εικόνα χρησιμοποιώντας το τερματικό; Ευτυχώς, το Linux διαθέτει πληθώρα βοηθητικών προγραμμάτων που μπορείτε να χρησιμοποιήσετε για να αυτοματοποιήσετε την εργασία μετατροπής εγγράφων HTML σε αρχεία PDF και εικόνες.
Αυτό το άρθρο θα σας παρουσιάσει το wkhtmltopdf και το wkhtmltoimage, βοηθητικά προγράμματα που χρειάζεστε για να διευκολύνετε την εργασία σας.
Πώς να μετατρέψετε HTML σε PDF
Εάν θέλετε να καταγράψετε ιστοσελίδες και να τις μετατρέψετε σε αρχείο PDF, το βοηθητικό πρόγραμμα wkhtmltopdf θα σας βοηθήσει. Το Wkhtmltopdf είναι ένα εργαλείο γραμμής εντολών ανοιχτού κώδικα που χρησιμοποιείται για την απόδοση ιστοσελίδων σε έγγραφα PDF.
Δεδομένου ότι το εργαλείο λειτουργεί ακέφαλα μέσα στο τερματικό Linux, δεν θα χρειαστείτε κανένα πρόγραμμα οδήγησης ιστού ή ένα πλαίσιο αυτοματισμού προγράμματος περιήγησης όπως το Selenium.
Εγκαταστήστε το wkhtmltopdf σε Linux
Το Wkhtmltopdf δεν είναι ένα από τα τυπικά πακέτα που είναι προεγκατεστημένα στο Linux. Θα πρέπει να το εγκαταστήσετε χειροκίνητα χρησιμοποιώντας τον διαχειριστή πακέτων του συστήματός σας.
Για να εγκαταστήσετε το wkhtmltopdf σε διανομές που βασίζονται στο Ubuntu και στο Debian:
sudo apt εγκατάσταση wkhtmltopdf
Σε διανομές με βάση το Arch όπως το Manjaro Linux:
sudo pacman -S wkhtmltopdf
Η εγκατάσταση του wkhtmltopdf σε διανομές που βασίζονται σε RHEL όπως το Fedora και το CentOS είναι επίσης εύκολη.
sudo dnf εγκατάσταση wkhtmltopdf
Βασική σύνταξη
Η βασική σύνταξη της εντολής είναι:
wkhtmltopdf όνομα αρχείου ιστοσελίδας
...όπου ιστοσελίδα είναι το URL της ιστοσελίδας που θέλετε να μετατρέψετε και όνομα αρχείου είναι το όνομα του αρχείου PDF εξόδου.
Για να μετατρέψετε την αρχική σελίδα Google σε έγγραφο PDF:
wkhtmltopdf https://google.com google.pdf
Παραγωγή:
Κατά το άνοιγμα του αρχείου PDF, θα παρατηρήσετε ότι το wkhtmltopdf έχει αποδώσει με ακρίβεια την ιστοσελίδα σε ένα έγγραφο.
Εκτύπωση πολλαπλών αντιγράφων της ιστοσελίδας
ο - αντίγραφα Η σημαία είναι ένας σωσίβιος αν θέλετε το αρχείο εξόδου σας να έχει πολλά αντίγραφα της ιστοσελίδας. Σημειώστε ότι κατά την εκτύπωση πολλών αντιγράφων, το wkhtmltopdf δεν θα δημιουργήσει πολλά αρχεία PDF, αλλά θα προσθέσει επιπλέον σελίδες σε ένα μόνο έγγραφο.
Για να δημιουργήσετε τρία αντίγραφα της αρχικής σελίδας Google:
wkhtmltopdf - αντίγραφα 3 https://google.com google.pdf
Το αρχείο PDF εξόδου θα περιέχει τρεις σελίδες όπως ορίζεται στην προαναφερθείσα εντολή.
Προσθέστε ένα φίλτρο κλίμακας του γκρι στην έξοδο
Για να προσθέσετε ένα φίλτρο κλίμακας του γκρι στο αρχείο PDF, χρησιμοποιήστε το -σολ ή - κλίμακα του γκρι σημαία με την εντολή:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - κλίμακα του γκρι https://google.com google.pdf
Αρχείο εξόδου:
Αλλάξτε τον προσανατολισμό του PDF
Από προεπιλογή, το wkhtmltopdf δημιουργεί το αρχείο PDF σε κατακόρυφη διάταξη, δηλαδή κατακόρυφο. Για να αλλάξετε αυτήν την προεπιλεγμένη συμπεριφορά και να καταγράψετε ιστοσελίδες στο τοπίο, χρησιμοποιήστε το --προσανατολισμός σημαία με την εντολή:
wkhtmltopdf - τοπίο προσανατολισμού https://google.com google.pdf
Παραγωγή:
Λάβετε υπόψη ότι η οριζόντια έκδοση του εγγράφου έχει μεγαλύτερη περιοχή κενού σε σύγκριση με την κατακόρυφη.
Μην συμπεριλάβετε εικόνες κατά τη μετατροπή
Κατά τη δημιουργία της εξόδου, εάν δεν θέλετε το wkhtmltopdf να αποδίδει εικόνες σε μια ιστοσελίδα, χρησιμοποιήστε το - καμία εικόνα σημαία:
wkhtmltopdf - καμία εικόνα https://google.com google.pdf
Παραγωγή:
Σχετιζομαι με: Τα καλύτερα εργαλεία για την επεξεργασία ενός αρχείου PDF οπουδήποτε
Πώς να μετατρέψετε μια ιστοσελίδα σε εικόνες
Το βοηθητικό πρόγραμμα wkhtmltoimage είναι μέρος του πακέτου wkhtmltopdf. Εάν εργάζεστε σε μια αναφορά και θέλετε να συμπεριλάβετε εικόνες ενός ιστότοπου, τότε αυτό το εργαλείο θα λειτουργήσει υπέρ σας. Το τερματικό Linux όχι μόνο σας διευκολύνει να τραβήξετε τις εικόνες, αλλά σας δίνει επίσης μια σειρά από επιλογές που σας επιτρέπουν να προσαρμόσετε την έξοδο σας.
Βασική σύνταξη
Το Wkhtmltoimage έχει μια σύνταξη παρόμοια με το wkhtmltopdf:
wkhtmlόνομα αρχείου ιστοσελίδας εικόνας
...όπου ιστοσελίδα είναι η διεύθυνση URL ενός ιστότοπου και όνομα αρχείου είναι το όνομα της εικόνας εξόδου.
Μετατροπή ιστοσελίδας σε εικόνα
Συνεχίζοντας με το παραπάνω παράδειγμα, ας μετατρέψουμε την αρχική σελίδα Google σε εικόνες.
wkhtmltoimage https://google.com google.png
Παραγωγή:
Μπορείτε επίσης να καθορίσετε μια προσαρμοσμένη μορφή αρχείου που θέλετε να έχει η εικόνα εξόδου. Το Wkhtmltoimage υποστηρίζει τις ακόλουθες επεκτάσεις αρχείων:
- JPEG / JPG
- PNG
- SVG
Για παράδειγμα, εάν θέλετε να δημιουργήσετε μια εικόνα JPG, απλώς αντικαταστήστε την επέκταση αρχείου με JPG στην εντολή:
wkhtmltoimage https://google.com google.jpg
Σχετιζομαι με: JPG εναντίον JPEG: Ποια είναι η διαφορά μεταξύ αυτών των μορφών αρχείων εικόνας;
Λήψη ιστοσελίδων με χρήση του τερματικού Linux
Πρέπει να έχετε εγκατεστημένο ένα πρόγραμμα προβολής PDF στο σύστημα Linux εάν θέλετε να προβάλετε τα αρχεία PDF που δημιουργούνται από το wkhtmltopdf. Ενώ οι περισσότερες από τις διανομές Linux συνοδεύονται από προεγκατεστημένο πρόγραμμα επεξεργασίας PDF, μπορείτε να επιλέξετε και να εγκαταστήσετε χειροκίνητα έναν επεξεργαστή PDF που ταιριάζει στις ανάγκες σας.
Θέλετε να επεξεργαστείτε ένα αρχείο PDF στο Linux; Αυτοί οι επεξεργαστές PDF Linux είναι δωρεάν για εγκατάσταση και εύχρηστοι.
Διαβάστε Επόμενο
- Linux
- Linux
Ο Deepesh είναι ο Junior Editor για Linux στο MUO. Γράφει ενημερωτικό περιεχόμενο στο Διαδίκτυο για πάνω από 3 χρόνια. Στον ελεύθερο χρόνο του, του αρέσει να γράφει, να ακούει μουσική και να παίζει κιθάρα.
Εγγραφείτε στο Newsletter μας
Εγγραφείτε στο ενημερωτικό δελτίο μας για τεχνικές συμβουλές, κριτικές, δωρεάν ebook και αποκλειστικές προσφορές!
Ένα ακόμη βήμα…!
Επιβεβαιώστε τη διεύθυνση email σας στο email που μόλις σας στείλαμε.