Θυμάστε τις μέρες που χρησιμοποιούσατε μια φυσική σφαίρα ή σαρώνατε ένα μεγάλο βαρύ βιβλίο για να βρείτε το όνομα διαφορετικών περιοχών και χωρών; Με την πρόοδο της τεχνολογίας, ειδικά του Διαδικτύου, όλες αυτές οι πληροφορίες είναι πλέον διαθέσιμες με το πάτημα ενός κουμπιού.
Τι θα γινόταν όμως αν θέλετε να το κάνετε ένα βήμα παραπέρα και να βρείτε βασικά δεδομένα για μια χώρα όπως η πρωτεύουσα, οι γεωγραφικές συντεταγμένες ή το νόμισμά της; Μην κοιτάξετε πέρα από την εκπληκτική ενότητα πληροφοριών χώρας της Python, η οποία μπορεί να κάνει τη δουλειά μέσα σε λίγα δευτερόλεπτα.
Τι είναι το CountryInfo Module;
Ο Porimol Chandro ανέπτυξε το Πληροφορίες χώρας μονάδα μέτρησης. Έχει λειτουργίες για να φέρει την πρωτεύουσα μιας χώρας, τις γεωγραφικές συντεταγμένες, τη ζώνη ώρας, την περιοχή, τον πληθυσμό και πολλά άλλα.
Για να εγκαταστήσετε αυτήν την ενότητα, ανοίξτε το τερματικό σας και εκτελέστε:
κουκούτσι εγκαθιστώ πληροφορίες χώρας
Μπορείτε επίσης να ανακτήστε τα ζωντανά δεδομένα καιρού οποιασδήποτε χώρας ή περιοχής
και χρησιμοποιήστε το μαζί με τις πληροφορίες και βελτιώστε το σύνολο δεδομένων σας.Πώς να χρησιμοποιήσετε τις λειτουργίες της ενότητας
Μπορείτε να ανακτήσετε πληροφορίες χρησιμοποιώντας τις διάφορες λειτουργίες του Πληροφορίες χώρας ενότητα ως εξής.
1. Λήψη των εναλλακτικών ονομάτων ή ορθογραφίας μιας χώρας
Μπορείτε να λάβετε τα εναλλακτικά ονόματα ή την ορθογραφία μιας χώρας όπως αυτή:
από πληροφορίες χώρας εισαγωγή Πληροφορίες χώρας
όνομα = 'Ινδία'
χώρα = Πληροφορίες χώρας (όνομα)
data1 = country.alt_spellings()
Τυπώνω(δεδομένα 1)
Ξεκινήστε με την εισαγωγή του Πληροφορίες χώρας τάξη από το πληροφορίες χώρας μονάδα μέτρησης. Στη συνέχεια, μπορείτε να δημιουργήσετε μια παρουσία του CountryInfo περνώντας της μια συμβολοσειρά που περιέχει το όνομα μιας χώρας.
Μπορείτε να καλέσετε διάφορες μεθόδους API στο αντικείμενο CountryInfo που έχετε δημιουργήσει. Για παράδειγμα, alt_spellings() επιστρέφει μια λίστα με εναλλακτικά ονόματα της χώρας.
Το απόσπασμα Python για τη λήψη των εναλλακτικών ονομάτων μιας χώρας παράγει την ακόλουθη έξοδο:
2. Λήψη της πρωτεύουσας και των γεωγραφικών της συντεταγμένων
Μπορείς να χρησιμοποιήσεις κεφάλαιο() να πάρει την πρωτεύουσα οποιασδήποτε χώρας. Επιστρέφει μια συμβολοσειρά που αντιπροσωπεύει το όνομα του κεφαλαίου:
data2 = country.capital()
Τυπώνω(δεδομένα 2)
Αυτό το απόσπασμα Python παράγει την ακόλουθη έξοδο:
Χρησιμοποιήστε τη μέθοδο API captial_latlng() να φέρει τις γεωγραφικές συντεταγμένες της πρωτεύουσας μιας χώρας. Αυτή η μέθοδος επιστρέφει μια λίστα που περιέχει δύο στοιχεία, το καθένα έναν αριθμό κινητής υποδιαστολής:
data3 = country.capital_latlng()
Τυπώνω(δεδομένα 3)
Το απόσπασμα Python για τη λήψη του γεωγραφικού πλάτους και του γεωγραφικού πλάτους μιας χώρας παράγει την ακόλουθη έξοδο:
3. Λήψη της περιοχής μιας χώρας, των επαρχιών της και των γύρω παραμεθόριων χωρών
Μπορείτε να χρησιμοποιήσετε τη μέθοδο API, περιοχή() για να πάρετε την έκταση οποιασδήποτε χώρας σε τετραγωνικά χιλιόμετρα. Εφαρμόστε τον κώδικα ως:
data4 = country.area()
Τυπώνω(δεδομένα 4)
Το απόσπασμα Python για τη λήψη της περιοχής μιας χώρας παράγει την ακόλουθη έξοδο:
Μπορείτε να λάβετε μια λίστα με τις επαρχίες μιας χώρας χρησιμοποιώντας επαρχίες (). Κάθε στοιχείο στη λίστα είναι μια συμβολοσειρά που αντιπροσωπεύει μια επαρχία. Εφαρμόστε τον κώδικα ως:
data5 = country.provinces()
Τυπώνω(δεδομένα 5)
Το απόσπασμα Python για τη λήψη των επαρχιών μιας χώρας παράγει την ακόλουθη έξοδο:
Μπορείτε να ανακτήσετε τα ονόματα των γειτονικών χωρών χρησιμοποιώντας τη μέθοδο API, σύνορα (). Κάθε στοιχείο στη λίστα είναι ένας κωδικός χώρας σε μορφή ISO-3, μια κεφαλαία συμβολοσειρά τριών χαρακτήρων. Εφαρμόστε τον κώδικα ως:
data6 = country.borders()
Τυπώνω(δεδομένα 6)
Το απόσπασμα Python για τη λήψη του ονόματος των συνοριακών χωρών παράγει το ακόλουθο αποτέλεσμα:
4. Λήψη των κωδικών κλήσης μιας χώρας
Μπορείτε να λάβετε τους διεθνείς κωδικούς κλήσης μιας χώρας χρησιμοποιώντας calling_codes(). Αυτό επιστρέφει μια λίστα συμβολοσειρών, καθεμία από τις οποίες περιέχει το αριθμητικό τηλεφωνικό πρόθεμα που χρειάζεστε για να καλέσετε τη χώρα από μια άλλη:
data7 = country.calling_codes()
Τυπώνω(δεδομένα 7)
Το απόσπασμα Python για τη λήψη των κωδικών κλήσης μιας χώρας παράγει την ακόλουθη έξοδο:
5. Λήψη νομίσματος, πληθυσμού και ζωνών ώρας
Λάβετε την επίσημη μορφή νομίσματος μιας χώρας χρησιμοποιώντας τη μέθοδο API, νομίσματα(). Αυτή η μέθοδος επιστρέφει μια άλλη λίστα συμβολοσειρών:
data8 = country.currency()
Τυπώνω(δεδομένα 8)
Το απόσπασμα Python για τη λήψη του νομίσματος μιας χώρας παράγει την ακόλουθη έξοδο:
Λάβετε τον κατά προσέγγιση αριθμό των ατόμων που ζουν σε μια χώρα που χρησιμοποιούν πληθυσμός(). Αυτή η μέθοδος επιστρέφει ένα int. Χρησιμοποιήστε το ως εξής:
data9 = country.population()
Τυπώνω(δεδομένα 9)
Το απόσπασμα Python για τη λήψη του πληθυσμού μιας χώρας παράγει το ακόλουθο αποτέλεσμα:
Μια χώρα μπορεί να έχει μία ή περισσότερες από μία ζώνες ώρας, ανάλογα με το μέγεθός της. Μπορείτε να ανακτήσετε τις διαφορετικές ζώνες ώρας μιας χώρας χρησιμοποιώντας το ζώνες ώρας() Μέθοδος API ως:
data10 = country.timezones()
Τυπώνω(δεδομένα 10)
Το απόσπασμα Python για τη λήψη των διαφορετικών ζωνών ώρας μιας χώρας παράγει την ακόλουθη έξοδο:
6. Αποκτώντας την Περιφέρεια και την Υποπεριοχή μιας Χώρας
Φέρτε τη γενική περιοχή ή ήπειρο στην οποία ανήκει μια χώρα χρησιμοποιώντας το περιοχή() Μέθοδος API. Εφαρμόστε τον κώδικα ως:
data11 = country.region()
Τυπώνω(δεδομένα 11)
Το απόσπασμα Python για τη λήψη της περιοχής μιας χώρας παράγει την ακόλουθη έξοδο:
Ομοίως, μπορείτε να χρησιμοποιήσετε μια πιο συγκεκριμένη περιοχή στην οποία ανήκει η χώρα υποπεριοχή () όπως και:
data12 = country.subregion()
Τυπώνω(δεδομένα 12)
Το απόσπασμα Python για τη λήψη της υποπεριοχής μιας χώρας παράγει την ακόλουθη έξοδο:
7. Λήψη της διεύθυνσης URL της Wikipedia μιας χώρας
Η Wikipedia είναι μια από τις καλύτερες πηγές πληροφοριών για οτιδήποτε στο διαδίκτυο. Μπορείτε να ανακτήσετε τη σελίδα Wikipedia μιας χώρας χρησιμοποιώντας τη μέθοδο API, wiki(). Εφαρμόστε τον κώδικα ως:
data13 = country.wiki()
Τυπώνω(δεδομένα 13)
Το απόσπασμα Python για τη λήψη της σελίδας Wikipedia μιας χώρας παράγει την ακόλουθη έξοδο:
8. Λήψη του τομέα ανώτατου επιπέδου για μια χώρα
Το ccTLD είναι ένας κωδικός χώρας όνομα τομέα ανώτατου επιπέδου που υποδεικνύει μια χώρα ή μια γεωγραφική περιοχή του ιστότοπου. Είναι συνήθως δύο γράμματα όπως π.χ .σε για την Ινδία και .περίπου για τον Καναδά. Μπορείτε να ανακτήσετε τον τομέα ανώτατου επιπέδου για μια χώρα που χρησιμοποιεί tld() όπως και:
data14 = country.tld()
Τυπώνω(δεδομένα 14)
Το απόσπασμα Python για τη λήψη του τομέα ανώτατου επιπέδου μιας χώρας παράγει την ακόλουθη έξοδο:
9. Λήψη όλων των διαθέσιμων πληροφοριών για μια χώρα
Μπορείτε να ανακτήσετε όλες τις διαθέσιμες πληροφορίες μιας χώρας χρησιμοποιώντας τη μέθοδο API, πληροφορίες (). Επιστρέφει ένα λεξικό τιμών κλειδιού/όνομα, το οποίο μπορείτε να επαναλάβετε χρησιμοποιώντας έναν βρόχο for:
data15 = country.info()
Γιακλειδί, αξίασεδεδομένα15.αντικείμενα():
εκτύπωση (κλειδί, ":", αξία)
Το απόσπασμα Python για τη λήψη όλων των διαθέσιμων πληροφοριών σχετικά με μια χώρα παράγει την ακόλουθη έξοδο:
10. Λήψη πληροφοριών όλων των χωρών και δημιουργία συνόλου δεδομένων
Η ενότητα CountryInfo παρέχει μια μέθοδο API που ονομάζεται όλα() που επιστρέφει ένα λεξικό που περιέχει όλες τις πληροφορίες για όλες τις χώρες του κόσμου:
από πληροφορίες χώρας εισαγωγή Πληροφορίες χώρας
εισαγωγή τα πάντα όπως και πδ
χώρα = Πληροφορίες χώρας()
data = country.all()
Μπορείτε να χρησιμοποιήσετε τη μονάδα pandas για να χειριστείτε αυτά τα δεδομένα. ο Η μονάδα pandas παρέχει πολλές εντολές για εργασία με DataFrames, συμπεριλαμβανομένου ενός για αποθήκευση δεδομένων σε μορφή CSV:
df = πδ. DataFrame (δεδομένα)
df.to_csv("Country_Data_Fetcher.csv")
Λήψη δεδομένων από ιστότοπους
Ενώ αυτή η εύχρηστη ενότητα Python παρέχει όλες τις βασικές πληροφορίες οποιασδήποτε χώρας, η ανάκτηση καθαρών δεδομένων δεν είναι εύκολη υπόθεση. Η γνώση του web scraping θα σας βοηθήσει να λάβετε δεδομένα από οποιονδήποτε ιστότοπο στο διαδίκτυο. Στη συνέχεια, μπορείτε να αναλύσετε και να χρησιμοποιήσετε αυτά τα δεδομένα στις εφαρμογές σας.
Η Python διαθέτει μια ισχυρή ενότητα που ονομάζεται BeautifulSoup την οποία μπορείτε να εγκαταστήσετε για να εκτελέσετε απόξεση ιστού και να εξοικονομήσετε ώρες εργασίας.