Τα ηχητικά βιβλία κερδίζουν ολοένα και μεγαλύτερη δημοτικότητα σε σχέση με τα παραδοσιακά eBook. Είναι πιο βολικά καθώς μπορείτε να τα ακούσετε οποτεδήποτε και οπουδήποτε.
Μπορείτε να μετατρέψετε ένα eBook PDF σε ηχητικό βιβλίο με ένα απλό σενάριο Python. Χρησιμοποιώντας μερικές απλές βιβλιοθήκες, μπορείτε να αναπτύξετε ένα έργο που θα διαβάζει ένα PDF και θα αποθηκεύει το ηχητικό βιβλίο ως νέο αρχείο.
Εγκατάσταση απαιτούμενων πακέτων
Πρέπει να εγκαταστήσετε το PyPDF3, pyttsx3, και pdf υδραυλικός πακέτα για να ξεκινήσετε. Μπορείτε να εγκαταστήσετε αυτά τα πακέτα χρησιμοποιώντας τη διαχείριση πακέτων pip. Βεβαιωθείτε ότι έχετε ήδη εγκατεστημένο pip στο σύστημά σας. Εκτελέστε την ακόλουθη εντολή στη γραμμή εντολών για να εγκαταστήσετε τα πακέτα:
κουκούτσι εγκαθιστώ PyPDF3 pyttsx3 pdf υδραυλικός
- Μπορείτε να χρησιμοποιήσετε το PyPDF3 βιβλιοθήκη για ανάγνωση και επεξεργασία αρχείων PDF στην Python.
- ο pyttsx3 Η βιβλιοθήκη παρέχει μετατροπή κειμένου σε ομιλία.
- pdf υδραυλικός είναι μια βιβλιοθήκη που σας επιτρέπει να εξάγετε κείμενο και πίνακες από αρχεία PDF.
Ο κώδικας που χρησιμοποιείται σε αυτό το έργο είναι διαθέσιμος στο α Αποθετήριο GitHub και είναι δωρεάν για χρήση βάσει της άδειας MIT.
Μετατροπή PDF σε ηχητικό βιβλίο με χρήση Python
Αφού εγκαταστήσετε τα παραπάνω πακέτα, είστε έτοιμοι να τα εισαγάγετε στο αρχείο python σας:
εισαγωγή PyPDF3
εισαγωγή pyttsx3
εισαγωγή pdf υδραυλικός
Πρέπει να δώσετε το όνομα και τη θέση του αρχείου PDF που θέλετε να μετατρέψετε. Για λόγους απλότητας, μπορείτε να χρησιμοποιήσετε οποιοδήποτε δείγμα αρχείου PDF. Αντιγράψτε το στον ίδιο κατάλογο με το σενάριό σας και αποθηκεύστε το όνομά του σε μια μεταβλητή. αν λέγεται Lorem.pdf, για παράδειγμα:
αρχείο = 'Lorem.pdf'
Στη συνέχεια, δημιουργήστε ένα αντικείμενο αρχείου για το αρχείο PDF και ένα αντικείμενο ανάγνωσης PDF:
βιβλίο = ανοιχτό (αρχείο, 'rb')
pdfReader = PyPDF3.PdfFileReader (βιβλίο)
Αργότερα, θα περιηγηθείτε σε όλες τις σελίδες του αρχείου PDF. Για να βρείτε τον συνολικό αριθμό σελίδων, χρησιμοποιήστε το numPages ιδιοκτησία:
σελίδες = pdfReader.numPages
Τώρα, είστε έτοιμοι να εξαγάγετε το κείμενο από το αρχείο PDF:
τελικό κείμενο = ""
με pdfplumber.open(αρχείο) όπως και pdf:
για i στην περιοχή (0, σελίδες):
σελίδα = pdf.σελίδες[i]
text = page.exttract_text()
finalText += κείμενο
Χρησιμοποιήστε έναν βρόχο for για να επαναλάβετε όλες τις σελίδες και να εξαγάγετε το κείμενο από το PDF. Μπορείτε να χρησιμοποιήσετε το πακέτο pdfplumber για να ανοίξετε το αρχείο pdf και το απόσπασμα_κειμένου μέθοδος ανάκτησης κειμένου από μια σελίδα.
Με το πλήρες κείμενο αποθηκευμένο σε μια μεταβλητή, μπορείτε να το επεξεργαστείτε περαιτέρω, ανάλογα με τις απαιτήσεις σας. Εάν θέλετε να μετατρέψετε το κείμενο σε ήχο και να το αποθηκεύσετε σε νέο αρχείο, χρησιμοποιήστε τον ακόλουθο κώδικα:
engine = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
κινητήρας.runAndWait()
Οταν εσύ εκτελέστε αυτόν τον κώδικα Python, θα δημιουργήσει ένα αρχείο ήχου βιβλίου στον κατάλογό του.
Εάν δεν θέλετε να αποθηκεύσετε το ηχητικό βιβλίο και, για παράδειγμα, θέλετε να απαγγείλετε το αρχείο PDF, μπορείτε να χρησιμοποιήσετε τον ακόλουθο κώδικα αντ' αυτού:
engine = pyttsx3.init()
κινητήρας.λένε(τελικό κείμενο)
κινητήρας.runAndWait()
Όταν εκτελείτε αυτό το σενάριο, θα απαγγείλει το αρχείο PDF.
Αναπτύξτε έργα χρησιμοποιώντας Python
Η Python είναι γνωστή για την ευελιξία της. Μπορείτε εύκολα να δημιουργήσετε έργα με πρακτικές εφαρμογές χρησιμοποιώντας Python.
Αν θέλετε να λερώσετε τα χέρια σας με τον κώδικα Python, μπορείτε να ξεκινήσετε με την ανάπτυξη mini-project. Μερικές καλές ιδέες εκκίνησης είναι μια εφαρμογή κουίζ, chatbot, παιχνίδι φιδιών, συντόμευση διευθύνσεων URL, ξύστρα ιστού ή μετατροπέας μονάδων.