Φανταστείτε ένα νωρίς το πρωί όπου πίνετε ένα ζεστό φλιτζάνι φρέσκο ​​καφέ και ο υπολογιστής σας διαβάζει τους πιο πρόσφατους τίτλους σε εσάς—όλα από μόνος του. Δεν ακούγεται καταπληκτικό;

Λοιπόν, με την Python, μπορείτε να δημιουργήσετε το δικό σας, εξατομικευμένο πρόγραμμα ανάγνωσης ειδήσεων, το οποίο θα διαβάζει όλους τους κορυφαίους τίτλους για εσάς, μαζί με τα αποσπάσματα κάθε τίτλου. Ναι, σωστά. Χρησιμοποιώντας τις κατάλληλες βιβλιοθήκες, μπορείτε να κάνετε την Python να κάνει όλες τις πρωινές σας ρουτίνες, χωρίς να χρειάζεται να διαβάζετε κάθε λέξη μόνος σας.

Δείτε πώς μπορείτε να γράψετε αυτόν τον κώδικα και να τον τροποποιήσετε στον αγαπημένο σας ιστότοπο ειδήσεων.

Προαπαιτούμενα για την εκτέλεση του Κώδικα

Προτού μπείτε και αρχίσετε να γράφετε τον κώδικα, πρέπει να εκπληρώσετε μερικές προϋποθέσεις. Αυτές είναι μερικές πολύ βασικές απαιτήσεις, οι οποίες μπορούν να κάνουν τη χρήση της Python πιο εύκολη και αποτελεσματική.

  1. Πύθων: Η εγκατάσταση της πιο πρόσφατης έκδοσης της Python θα ήταν μια καλή απόφαση. Μπορείτε να εγκαταστήσετε οποιοδήποτε Python IDE για καλύτερα αποτελέσματα.
    instagram viewer
  2. Ιστοσελίδα ειδήσεων/πρόσβαση στο Διαδίκτυο: Δεδομένου ότι ο κώδικας Python διαβάζει τους κορυφαίους τίτλους από τον αγαπημένο σας ιστότοπο, πρέπει να βεβαιωθείτε ότι μπορείτε να έχετε πρόσβαση στον ιστότοπο ενώ εκτελείτε αυτόν τον κώδικα.

Ολόκληρος ο κώδικας είναι γραμμένος στο Jupyter Notebook, ένα δημοφιλές Python IDE για αυτόν τον οδηγό. Επιπλέον, ο ιστότοπος ειδήσεων του India Today κωδικοποιείται εντός του δείγματος κώδικα.

Για να κατεβάσετε το Jupyter Notebook, μπορείτε είτε να το χρησιμοποιήσετε ως μέρος του πακέτου anaconda είτε να κάνετε λήψη μιας αυτόνομης έκδοσης στο σύστημά σας.

Κατεβάστε:Ανακόνδας | Σημειωματάριο Jupyter

Χωρίς περαιτέρω καθυστέρηση, ας εμβαθύνουμε στον κώδικα.

Γράψιμο του κώδικα σε Python

Για να ξεκινήσετε, πρέπει να εισαγάγετε μερικές βιβλιοθήκες Python, καθεμία από τις οποίες εξυπηρετεί διαφορετικούς σκοπούς.

Εισαγάγετε το win32com.client ως wincl
από το urllib.αίτημα εισαγωγής urlopen ως ureq
από το bs4 εισαγωγή BeautifulSoup ως σούπα
sp = wincl. Dispatch ("SAPI.spVoice")

Οπου:

  • win32com.client: Αυτή η βιβλιοθήκη αλληλεπιδρά με συσκευές Windows και εκτελεί προγράμματα Python απρόσκοπτα.
  • urllib.request: Αυτή η βιβλιοθήκη χειρίζεται τιμές URL από τη μονάδα αιτήματος.
  • bs4: Η βιβλιοθήκη BS4 περιέχει τη συνάρτηση Beautiful Soup, η οποία αφαιρεί δεδομένα από ιστότοπους που χρησιμοποιούν Python.
  • sp = wincl. Dispatch("SAPI.spVoice"): Ενεργοποιήστε τις φωνητικές εντολές στα Windows.

Αυτός ο κωδικός θα λειτουργεί μόνο στα Windows, καθώς θα καλείτε τη βιβλιοθήκη win32.com.client.

Στη συνέχεια, πρέπει να ορίσετε τη διεύθυνση URL (σύνδεσμος) του ιστότοπου εντός του url μεταβλητή, η οποία αποθηκεύεται στη μνήμη της Python.

url = https://www.indiatoday.in/top-stories

Δημιουργήστε μια νέα μεταβλητή πελάτη για να αποθηκεύσετε την εντολή ανοίγματος διεύθυνσης URL.

πελάτης = ureq (url)
εκτύπωση (πελάτης)

όπου:

  • πελάτης: Νέα μεταβλητή.
  • ureq: Η συνάρτηση Python εισήχθη από το urllib.request, το οποίο ανοίγει το αποθηκευμένο url.

Εφόσον έχετε ανοίξει τη διεύθυνση URL στη μνήμη, είναι καιρός να ελέγξετε εάν ο εν λόγω ιστότοπος επιτρέπει μη ασφαλείς συνδέσεις μέσω Python. Μπορείτε να εκτυπώσετε τη μεταβλητή πελάτη και να ελέγξετε την έξοδο.

Υπάρχουν δύο δυνατότητες με την εντολή εκτύπωσης:

  • Σφάλμα HTTPE: Όταν ένας ιστότοπος είναι ασφαλής, δεν μπορείτε να ξύσετε το περιεχόμενο χρησιμοποιώντας Python.
  • Απόσπασμα κώδικα: Εάν επιστραφεί ένα απόσπασμα κώδικα μετά την εκτέλεση του ιστότοπου, υποθέστε ότι μπορείτε εύκολα να τραβήξετε τους τίτλους.

Αφού ορίσετε τη διεύθυνση URL του ιστότοπου ειδήσεων στην εντολή URL, ήρθε η ώρα να εισαγάγετε τον κώδικα HTML σε μια μεταβλητή.

page_html = client.read()
εκτύπωση (page_html)

Πρέπει να εκτυπώσετε τον κώδικα HTML του ιστότοπου που έχει εισαχθεί στην Python ως προληπτικό βήμα. Μπορείτε ακόμη και να αντιστοιχίσετε αυτόν τον κωδικό με τον κωδικό ιστότοπου που είναι διαθέσιμος κάτω από το Επιθεωρώ επιλογή.

Πριν μετατρέψετε τον κώδικα, πρέπει να κλείσετε τον ιστότοπο από τη μνήμη της Python χρησιμοποιώντας την εντολή κλείσιμο.

client.close()

Εφόσον έχετε εισαγάγει τον κώδικα HTML σε μια μεταβλητή Python, πρέπει να τον μετατρέψετε σε μια αναγνώσιμη μορφή Python για να εφαρμόσετε το εύρημα και βρείτε όλα εντολές για αναζήτηση λέξεων-κλειδιών.

Μπορείτε να περάσετε την ακόλουθη εντολή για να μετατρέψετε τον κώδικα HTML:

page_soup = σούπα (page_html, "html.parser")

Οπου:

  • page_soup: Νέα μεταβλητή.
  • σούπα: Ψευδώνυμο για το Όμορφη ενότητα Σούπας.
  • page_html: Μεταβλητή που περιέχει τον κώδικα HTML από τον ιστότοπο.
  • html_parser: Προεπιλεγμένη σύνταξη για τη μετατροπή του κώδικα HTML.

Μόλις ο κώδικας είναι έτοιμος για χρήση, είναι καιρός να εξετάσετε τον κώδικα HTML του ιστότοπου για να ξεκινήσετε την αναζήτηση λέξεων-κλειδιών επικεφαλίδας.

Για να το κάνετε αυτό, κάντε δεξί κλικ οπουδήποτε στον ιστότοπο και κάντε κλικ στο Επιθεώρηση. Αυτό θα ανοίξει τον κώδικα HTML για τον εν λόγω ιστότοπο.

Στο παράθυρο κώδικα του ιστότοπου, κάντε κύλιση, μέχρι να εντοπίσετε τις ετικέτες κοντέινερ που αποθηκεύουν τις επικεφαλίδες.

Αυτά περιέχονται στο προβολή-περιεχόμενο ετικέτες στον ιστότοπο India Today. Τα κοντέινερ κάθε ιστότοπου ειδήσεων ποικίλλουν, αλλά θα πρέπει να μπορείτε να πλοηγηθείτε στον κώδικα με σχετική ευκολία.

articles = page_soup.find("div", { "class": "view-content" })

Τέλος, πρέπει να καταγράψετε τις δευτερεύουσες ετικέτες, οι οποίες περιέχουν τους κύριους τίτλους που θα σας διαβάσει η Python.

articles = articles.findAll("div", {"class": "catagory-listing"})

Το κοντέινερ προβολής περιεχομένου θα περιέχει πολλές επικεφαλίδες, το εξωτερικό περίβλημα για τις επικεφαλίδες σας.

Για να καταγράψετε τις ετικέτες H2 και τα αποσπάσματα που αναφέρονται σε κάθε επικεφαλίδα, πρέπει να εκτελέσετε έναν βρόχο.

i = 1
για x σε άρθρα:
τίτλος = x.find("h2").κείμενο
para = x.find("p").κείμενο
εκτύπωση (i, τίτλος, "
", "
", παρά,"
", "
")
sp. Μίλα (τίτλος)
sp. Μιλήστε (παράγραφος)
i=i+1

Οπου:

  • Εγώ: Νέα μεταβλητή μετρητή, η οποία θα αυξηθεί αυτόματα.
  • τίτλος: Νέα μεταβλητή για αποθήκευση της επικεφαλίδας (h2).
  • παρ.: Νέα μεταβλητή για τη διατήρηση των παραγράφων που σχετίζονται με κάθε H2.
  • Τυπώνω: Ο τίτλος της επικεφαλίδας και η παράγραφος θα εκτυπωθούν στη διεπαφή Python.
  • sp. Speak (Τίτλος): Η Python θα διαβάζει κάθε αποθηκευμένο τίτλο.
  • sp. Μιλήστε (παράγραφος): Η Python θα διαβάζει κάθε αποθηκευμένο απόσπασμα παραγράφου.
  • i = i+1: Αυτή η εντολή αυξάνει αυτόματα τον σειριακό αριθμό που σχετίζεται με κάθε επικεφαλίδα που εμφανίζεται στη διεπαφή της Python.

Χρησιμοποιώντας την ενότητα Beautiful Soup της Python για να διαβάσετε τα καθημερινά σας νέα

Κάθε φορά που εκτελείτε τον κώδικα, θα γίνεται λήψη νέων επικεφαλίδων από τον ιστότοπο ειδήσεων πριν διαβαστούν δυνατά. Η Python εκτελεί τον κώδικα κάθε φορά που εκτελείτε το σύνολο των κωδικών, κρατώντας σας έτσι ενήμερους για τις αλλαγές στον ιστότοπο.

Οι παλαιότερες επικεφαλίδες θα συνεχίσουν να εμφανίζονται και να διαβάζονται από την Python μέχρι να ανανεώσετε και να εκτελέσετε ξανά τον κώδικα.

Η χρήση της Python για την ανάγνωση των καθημερινών επικεφαλίδων σας είναι εύκολη

Η Python, ως γλώσσα ανοιχτού κώδικα, προσφέρει μια σειρά εργαλείων όπως Beautiful Soup, Selenium και άλλα πλαίσια—σε αρχάριους και προχωρημένους χρήστες.

Εάν θέλετε να λαμβάνετε τα καθημερινά σας νέα φωνητικά, η Python το κάνει εύκολο. Η εκμάθηση αυτής της συγκεκριμένης γλώσσας μπορεί επίσης να σας βοηθήσει να γίνετε καλύτερος προγραμματιστής σε όλους τους τομείς.

10 Χρήσιμα Εργαλεία για προγραμματιστές Python

Είτε χρειάζεστε εργαλεία Python για επιστήμη δεδομένων, μηχανική εκμάθηση, ανάπτυξη ιστού ή οτιδήποτε άλλο, αυτή η λίστα σας καλύπτει.

Διαβάστε Επόμενο

ΜερίδιοΤιτίβισμαΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Σχετικά θέματα
  • Προγραμματισμός
  • Πύθων
  • Νέα
  • Συμβουλές υπολογιστή
  • Προγραμματισμός
Σχετικά με τον Συγγραφέα
Gaurav Siyal (Δημοσιεύτηκαν 56 άρθρα)

Ο Gaurav Siyal έχει δύο χρόνια συγγραφικής εμπειρίας, γράφοντας για μια σειρά από εταιρείες ψηφιακού μάρκετινγκ και έγγραφα κύκλου ζωής λογισμικού.

Περισσότερα από τον Gaurav Siyal

Εγγραφείτε στο ενημερωτικό μας δελτίο

Εγγραφείτε στο ενημερωτικό μας δελτίο για συμβουλές τεχνολογίας, κριτικές, δωρεάν ebook και αποκλειστικές προσφορές!

Κάντε κλικ εδώ για να εγγραφείτε