Η διαδικτυακή βάση δεδομένων ταινιών (IMDb) είναι η μεγαλύτερη διαδικτυακή βάση δεδομένων που περιέχει πληροφορίες σχετικά με ταινίες, τηλεοπτικές σειρές, οικιακά βίντεο, βιντεοπαιχνίδια και περιεχόμενο ροής. Η ηλεκτρονική βάση δεδομένων περιέχει εκατομμύρια ακριβείς εγγραφές που μπορείτε να χρησιμοποιήσετε για να εκτελέσετε ανάλυση δεδομένων.
Το Cinemagoer (παλαιότερα γνωστό ως IMDbPY) είναι μια βιβλιοθήκη Python για τη διαχείριση και την ανάκτηση των δεδομένων της βάσης δεδομένων ταινιών IMDb. Μπορείτε να αποκτήσετε πρόσβαση σε δεδομένα σχετικά με ταινίες, άτομα και εταιρείες, τα οποία μπορούν να χρησιμοποιηθούν περαιτέρω για ανάλυση.
Εγκατάσταση Απαιτούμενων Βιβλιοθηκών
Πρέπει να εγκαταστήσετε το κινηματογραφιστής Βιβλιοθήκη Python για πρόσβαση στο IMDb βάση δεδομένων. Εκτελέστε την ακόλουθη εντολή στη γραμμή εντολών για να εγκαταστήσετε τη βιβλιοθήκη:
κουκούτσι εγκαθιστώ κινηματογραφιστής
Θα πρέπει να έχετε pip εγκατεστημένο στο σύστημά σας για να εγκαταστήσετε εξωτερικές βιβλιοθήκες Python.
Ο κώδικας που χρησιμοποιείται σε αυτό το έργο είναι διαθέσιμος στο α Αποθετήριο GitHub και είναι δωρεάν για χρήση βάσει της άδειας MIT.
Εξαγωγή δεδομένων IMDb με χρήση Python
Πρέπει να εισαγάγετε τη βιβλιοθήκη του cinemagoer πριν τη χρησιμοποιήσετε στον κώδικά σας.
από imdb εισαγωγή Κινηματογράφος
ia = Κινηματογράφος()
Ο παραπάνω κώδικας εισάγει τη βιβλιοθήκη του cinemagoer και δημιουργεί μια παρουσία της κατηγορίας cinemagoer.
Αναζήτηση ταινιών
Μπορείτε να αναζητήσετε ταινίες με δεδομένο (ή παρόμοιο) τίτλο χρησιμοποιώντας το search_movie() μέθοδος. Για παράδειγμα, εάν θέλετε να αναζητήσετε ταινίες με τον τίτλο "rock", πρέπει να εκτελέσετε τον ακόλουθο κώδικα:
από imdb εισαγωγή Κινηματογράφος
# Δημιουργία ενός στιγμιότυπου της κατηγορίας Cinemagoer
ia = Κινηματογράφος()
# Αναζήτηση ταινιών που έχουν ροκ στο όνομά τους
ταινίες = ia.search_movie('βράχος')
Τυπώνω(κινηματογράφος[0])
Αυτό θα πρέπει να εκτυπώσει την πρώτη ταινία που θα βρει, για παράδειγμα:
Μπορείτε να αποκτήσετε μια ταινία με το αναγνωριστικό της στο IMDb. Στη συνέχεια, μπορείτε να εξαγάγετε περαιτέρω πληροφορίες, όπως ονόματα σκηνοθετών και είδη. Πρέπει να περιηγηθείτε στη λίστα για να λάβετε ατομικές πληροφορίες.
από imdb εισαγωγή Κινηματογράφος
# Δημιουργία ενός στιγμιότυπου της κατηγορίας Cinemagoer
ia = Κινηματογράφος()# Λήψη ταινίας με αναγνωριστικό IMDb
ταινία = ia.get_movie('0468569')
Τυπώνω(ταινία)# Εκτύπωση των ονομάτων των σκηνοθετών της ταινίας
Τυπώνω('Διευθυντές:')για σκηνοθέτη στην ταινία['διευθυντές']:
εκτύπωση (σκηνοθέτης['όνομα'])# εκτύπωση των ειδών της ταινίας
Τυπώνω('Είδη:')
για το είδος στην ταινία['είδη']:
Τυπώνω(είδος)
Στην έξοδο, θα πρέπει να δείτε το όνομα της συγκεκριμένης ταινίας, τους σκηνοθέτες της και το είδος της:
Αναζήτηση Ατόμου
Μπορείτε να αναζητήσετε άτομα χρησιμοποιώντας το search_person() μέθοδος. Για παράδειγμα, εάν θέλετε να κάνετε αναζήτηση για "Heath", πρέπει να εκτελέσετε τον ακόλουθο κώδικα:
από imdb εισαγωγή Κινηματογράφος
# Δημιουργία ενός στιγμιότυπου της κατηγορίας Cinemagoer
ia = Κινηματογράφος()
# Αναζήτηση για άτομα που έχουν το Heath στα ονόματά τους
άτομα = ia.search_person('Ρείκι')
Τυπώνω(άτομα[0])
Θα δείτε το όνομα του πρώτου ατόμου που αντιστοιχεί στην αναζήτηση:
Εταιρείες αναζήτησης
Μπορείτε να αναζητήσετε εταιρείες χρησιμοποιώντας το search_company() μέθοδος. Για παράδειγμα, εάν θέλετε να αναζητήσετε "Universal", πρέπει να εκτελέσετε τον ακόλουθο κώδικα:
από imdb εισαγωγή Κινηματογράφος
# Δημιουργία ενός στιγμιότυπου της κατηγορίας Cinemagoer
ia = Κινηματογράφος()
# Αναζήτηση εταιρειών που έχουν τη Universal στα ονόματά τους
εταιρείες = ia.search_company('Παγκόσμιος')
Τυπώνω(εταιρείες)
Θα λάβετε τη λίστα με όλες τις εταιρείες που έχουν τη Universal στο όνομά τους.
Μπορείτε επίσης να ανακτήσετε δεδομένα ατόμου και εταιρείας χρησιμοποιώντας το αναγνωριστικό του.
από imdb εισαγωγή Κινηματογράφος
# Δημιουργία ενός στιγμιότυπου της κατηγορίας Cinemagoer
ia = Κινηματογράφος()# Λήψη δεδομένων ατόμου με ταυτότητα
άτομο = ia.get_person('0005132')
εκτύπωση (άτομο['όνομα'])
εκτύπωση (άτομο['ημερομηνία γέννησης'])
# Λήψη εταιρικών δεδομένων με ταυτότητα
εταιρεία = ia.get_company('0005073')
εκτύπωση (εταιρεία['όνομα'])
Η έξοδος θα εμφανίσει λεπτομέρειες του ατόμου και το όνομα μιας εταιρείας:
Εύρεση ταινιών στην κορυφή και στο κάτω μέρος
Μπορείτε να ανακτήσετε τα δεδομένα για τις κορυφαίες 250 και τις 100 τελευταίες ταινίες χρησιμοποιώντας το get_top250_movies() και get_bottom100_movies() μεθόδους, αντίστοιχα:
από imdb εισαγωγή Κινηματογράφος
# Δημιουργία ενός στιγμιότυπου της κατηγορίας Cinemagoer
ia = Κινηματογράφος()# Εύρεση των κορυφαίων 250 ταινιών
top = ia.get_top250_movies()
Τυπώνω(μπλουζα[0])
# Βρίσκοντας τις 100 τελευταίες ταινίες
κάτω = ia.get_bottom100_movies()
Τυπώνω(κάτω μέρος[0])
Σε απάντηση, θα δείτε το όνομα της καλύτερης ταινίας και το όνομα της χειρότερης:
Η βιβλιοθήκη cinemagoer παρέχει επίσης κάποιες άλλες μεθόδους όπως get_top250_tv(), get_popular100_movies(), και get_top250_indian_movies().
Η ανάλυση δεδομένων είναι η αξιολόγηση δεδομένων χρησιμοποιώντας αναλυτικά ή στατιστικά εργαλεία για την εξαγωγή πληροφοριών. Η δημοτικότητα της ανάλυσης δεδομένων αυξάνεται καθημερινά. Τώρα χρησιμοποιείται από επιχειρήσεις, εταιρείες μάρκετινγκ και αθλητικές ομάδες. Η πλήρης διαδικασία της ανάλυσης δεδομένων περιλαμβάνει τον καθορισμό στόχων, την υποβολή ερωτήσεων, τη συλλογή δεδομένων, τον καθαρισμό δεδομένων, την ανάλυση δεδομένων και τη σύναψη συμπερασμάτων.
Μπορείτε να λάβετε σύνολα δεδομένων για τα έργα σας χρησιμοποιώντας βιβλιοθήκες Python όπως το Cinemagoer ή μέσω διαδικτυακών πλατφορμών όπως το Kaggle. Μαζί με πλήρεις γλώσσες όπως η Python και η R, μπορείτε να χρησιμοποιήσετε άλλα εργαλεία όπως το Microsoft Excel, το Tableau και το Stata για να εκτελέσετε ανάλυση δεδομένων.