Το Instagram είναι ένα από τα πιο δημοφιλή social media με δισεκατομμύρια χρήστες. Όλοι, από φοιτητές έως διασημότητες έχουν λογαριασμούς στο Instagram. Τα δημόσια δεδομένα από το Instagram μπορεί να έχουν τεράστια αξία για επιχειρήσεις, επαγγελματίες του μάρκετινγκ και ιδιώτες. Οποιοσδήποτε μπορεί να χρησιμοποιήσει αυτά τα δεδομένα για την εκτέλεση ανάλυσης δεδομένων, τη στόχευση μάρκετινγκ και τη δημιουργία πληροφοριών.
Μπορείτε να χρησιμοποιήσετε την Python για να δημιουργήσετε ένα αυτοματοποιημένο εργαλείο που εξάγει δεδομένα Instagram.
Εγκατάσταση Απαιτούμενων Βιβλιοθηκών
Πρόγραμμα εγκατάστασης είναι μια βιβλιοθήκη Python που μπορείτε να χρησιμοποιήσετε για να εξαγάγετε δημόσια διαθέσιμα δεδομένα από το Instagram. Μπορείτε να αποκτήσετε πρόσβαση σε δεδομένα όπως εικόνες, βίντεο, όνομα χρήστη, όχι. αναρτήσεων, αριθμός ακολούθων, αριθμός ακολούθων, βιογραφικό κ.λπ. χρησιμοποιώντας το Instaloader. Σημειώστε ότι το Instaloader δεν συνδέεται, δεν εξουσιοδοτείται, δεν συντηρείται ή δεν υποστηρίζεται από το Instagram με οποιονδήποτε τρόπο.
Για να εγκαταστήσετε το installoader μέσω pip, εκτελέστε την ακόλουθη εντολή:
κουκούτσι εγκαθιστώ installoader
Θα πρέπει να έχετε pip εγκατεστημένο στο σύστημά σας για να εγκαταστήσετε εξωτερικές βιβλιοθήκες Python.
Στη συνέχεια, πρέπει να εγκαταστήσετε τη βιβλιοθήκη Pandas Python. Το Pandas είναι μια βιβλιοθήκη Python που χρησιμοποιείται κυρίως για την εκτέλεση χειρισμού δεδομένων και ανάλυση δεδομένων. Εκτελέστε την ακόλουθη εντολή για να το εγκαταστήσετε:
κουκούτσι εγκαθιστώ τα πάντα
Τώρα, είστε έτοιμοι να ξεκινήσετε τη ρύθμιση του κώδικα και τη λήψη των δεδομένων από το Instagram.
Ρύθμιση του κωδικού σας
Για να ρυθμίσετε το εργαλείο ανάκτησης δεδομένων Instagram, πρέπει να εισαγάγετε τη βιβλιοθήκη Instaloader Python και να δημιουργήσετε μια παρουσία της κλάσης Instaloader. Μετά από αυτό, πρέπει να παρέχετε τη λαβή Instagram του προφίλ από το οποίο θέλετε να εξαγάγετε τα δεδομένα.
Ο κώδικας Python του Instagram Extractor είναι διαθέσιμος σε α Αποθετήριο GitHub και είναι δωρεάν για χρήση βάσει της άδειας MIT.
εισαγωγή installoader
# Δημιουργία μιας παρουσίας της κλάσης Instaloader
bot = installoader. Instaloader()
# Φόρτωση του προφίλ από μια λαβή Instagram
προφίλ = πρόγραμμα εγκατάστασης. Profile.from_username (bot.context, 'ο κριστιάνο')
Τυπώνω(Προφίλ)
Αυτό είναι ένα καλό πρώτο βήμα για να ελέγξετε τη βασική εργασία. Θα πρέπει να δείτε μερικά σημαντικά δεδομένα χωρίς σφάλματα:
Εξαγωγή δεδομένων από το προφίλ
Μπορείτε να εξαγάγετε πολύτιμα δημόσια διαθέσιμα δεδομένα όπως όνομα χρήστη, όχι. αναρτήσεων, πλήθος ακολούθων, πλήθος ακολούθων, βιογραφικό, αναγνωριστικό χρήστη και εξωτερική διεύθυνση URL χρησιμοποιώντας το Instaloader με λίγες μόνο γραμμές κώδικα. Χρειάζεται μόνο να παρέχετε τη λαβή Instagram του προφίλ.
εισαγωγή installoader
εισαγωγή τα πάντα όπως και πδ# Δημιουργία μιας παρουσίας της κλάσης Instaloader
bot = installoader. Instaloader()
# Φόρτωση προφίλ από λαβή Instagram
προφίλ = πρόγραμμα εγκατάστασης. Profile.from_username (bot.context, 'λεομέσι')
Τυπώνω("Όνομα χρήστη: ", profile.username)
Τυπώνω("Ταυτότητα χρήστη: ", profile.userid)
Τυπώνω("Αριθμός αναρτήσεων: ", profile.mediacount)
Τυπώνω("Αριθμός ακολούθων: ", profile.followers)
Τυπώνω("Ακολουθεί καταμέτρηση: ", profile.followees)
Τυπώνω("Βιογραφικό: ", προφίλ.βιογραφία)
Τυπώνω("Εξωτερική διεύθυνση URL: ", profile.external_url)
Θα πρέπει να δείτε πολλές πληροφορίες προφίλ από τη λαβή που καθορίζετε:
Εξαγωγή email από το Bio
Μπορείτε να εξαγάγετε διευθύνσεις email από το Insta bio οποιουδήποτε προφίλ χρησιμοποιώντας κανονικές εκφράσεις. Πρέπει να εισαγάγετε την Python's σχετικά με βιβλιοθήκη και περάστε την τυπική έκφραση για την επικύρωση του email ως παράμετρο στο re.findall() μέθοδος:
εισαγωγή installoader
εισαγωγή σχετικά με
# Δημιουργία παρουσίας κλάσης Instaloader
bot = installoader. Instaloader()
προφίλ = πρόγραμμα εγκατάστασης. Profile.from_username (bot.context, "πλούτος")
Τυπώνω("Όνομα χρήστη: ", profile.username)
Τυπώνω("Βιογραφικό: ", προφίλ.βιογραφία)
emails = re.findall (ρ"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", προφίλ.βιογραφία)
print("Emails extract από το βιογραφικό:")
Τυπώνω(email)
Το σενάριο θα εκτυπώσει οτιδήποτε αναγνωρίζει ως διεύθυνση email στο βιογραφικό:
Εξαγωγή δεδομένων κορυφαίων αποτελεσμάτων αναζήτησης
Όταν αναζητάτε οτιδήποτε στο Instagram, λαμβάνετε πολλά αποτελέσματα, συμπεριλαμβανομένων ονομάτων χρήστη και hashtag. Μπορείτε να εξαγάγετε τα κορυφαία αποτελέσματα αναζήτησης χρησιμοποιώντας το get_profiles() και get_hashtags() μεθόδους. Χρειάζεται μόνο να δώσετε το ερώτημα αναζήτησης στο installoader. Κορυφαία Αποτελέσματα Αναζήτησης() μέθοδος. Επιπλέον, μπορείτε να επαναλάβετε και να εκτυπώσετε/αποθηκεύσετε τα μεμονωμένα αποτελέσματα.
εισαγωγή installoader
# Δημιουργία μιας παρουσίας της κλάσης Instaloader
bot = installoader. Instaloader()# Δώστε το ερώτημα αναζήτησης εδώ
search_results = installoader. Κορυφαία Αποτελέσματα Αναζήτησης (bot.context, 'ΜΟΥΣΙΚΗ')# Επανάληψη πάνω από τα εξαχθέντα ονόματα χρήστη
Γιαόνομα χρήστησεΑποτελέσματα αναζήτησης.get_profiles():
Τυπώνω(όνομα χρήστη)
# Επανάληψη πάνω από τα εξαγόμενα hashtag
ΓιαhashtagσεΑποτελέσματα αναζήτησης.get_hashtags():
Τυπώνω(hashtag)
Η έξοδος θα περιλαμβάνει τυχόν ονόματα χρήστη και hashtags που ταιριάζουν:
Εξαγωγή ακολούθων και ακολούθων ενός λογαριασμού
Μπορείτε να εξαγάγετε τους ακόλουθους ενός λογαριασμού και αυτούς που ακολουθεί ο ίδιος, χρησιμοποιώντας το Instaloader. Θα χρειαστεί να δώσετε ένα όνομα χρήστη και κωδικό πρόσβασης στο Instagram για να ανακτήσετε αυτά τα δεδομένα.
Ποτέ μην χρησιμοποιείτε τους προσωπικούς σας λογαριασμούς για να εξαγάγετε δεδομένα από το Instagram, καθώς μπορεί να αποκλειστεί προσωρινά ή μόνιμα ο λογαριασμός σας.
Αφού δημιουργήσετε μια παρουσία της κλάσης Instaloader, πρέπει να δώσετε το όνομα χρήστη και τον κωδικό πρόσβασής σας. Αυτό γίνεται έτσι ώστε το bot να μπορεί να συνδεθεί στο Instagram χρησιμοποιώντας τον λογαριασμό σας και να ανακτήσει τους ακόλουθους και τα δεδομένα των ακολούθων.
Στη συνέχεια, πρέπει να παρέχετε τη λαβή Instagram του προφίλ προορισμού. ο get_followers() και get_followees() μέθοδοι εξάγουν τους ακόλουθους και τους ακόλουθους. Μπορείτε να λάβετε τα ονόματα χρήστη των ακολούθων και των ακολούθων χρησιμοποιώντας το ακόλουθος.όνομα χρήστη και followee.όνομα χρήστη ιδιότητες αντίστοιχα.
Εάν θέλετε να αποθηκεύσετε τα αποτελέσματα σε ένα αρχείο CSV, πρέπει πρώτα να μετατρέψετε τα δεδομένα σε ένα αντικείμενο Pandas DataFrame. Χρησιμοποιήστε το πδ. Πλαίσιο δεδομένων() μέθοδος για τη μετατροπή ενός αντικειμένου λίστας σε DataFrame.
Τέλος, μπορείτε να εξαγάγετε το αντικείμενο DataFrame σε ένα αρχείο CSV χρησιμοποιώντας το to_csv() μέθοδος. Πρέπει να περάσετε το όνομα αρχείου.csv ως παράμετρος αυτής της μεθόδου για να λάβετε τα εξαγόμενα δεδομένα σε μορφή αρχείου CSV.
Μόνο οι κάτοχοι λογαριασμού μπορούν να δουν όλους τους ακόλουθους και τους ακόλουθους. Δεν θα μπορείτε να εξαγάγετε όλα τα δεδομένα των ακολούθων χρησιμοποιώντας αυτήν ή οποιαδήποτε άλλη μέθοδο.
# Εισαγωγή Βιβλιοθηκών
εισαγωγή installoader
εισαγωγή τα πάντα όπως και πδ# Δημιουργία μιας παρουσίας της κλάσης Instaloader
bot = installoader. Instaloader()
bot.login (user="Το όνομα χρήστη σας", passwd="Ο κωδικός σας")# Φόρτωση προφίλ από λαβή Instagram
προφίλ = πρόγραμμα εγκατάστασης. Profile.from_username (bot.context, 'Your_target_account_insta_handle')# Ανάκτηση των ονομάτων χρήστη όλων των ακολούθων
followers = [follower.username για follower στο profile.get_followers()]# Μετατροπή των δεδομένων σε DataFrame
followers_df = pd. DataFrame (ακόλουθοι)# Αποθήκευση των αποτελεσμάτων σε αρχείο CSV
followers_df.to_csv('ακόλουθοι.csv', ευρετήριο=Λάθος)# Ανάκτηση των ονομάτων χρήστη όλων των παρακάτω
follows = [followee.όνομα χρήστη για followee στο profile.get_followees()]# Μετατροπή των δεδομένων σε DataFrame
follows_df = pd. DataFrame (ακολουθούν)
# Αποθήκευση των αποτελεσμάτων σε αρχείο CSV
follows_df.to_csv('follows.csv', ευρετήριο=Λάθος)
Λήψη αναρτήσεων από λογαριασμό Instagram
Και πάλι, για να κατεβάσετε αναρτήσεις από οποιονδήποτε λογαριασμό, θα πρέπει να δώσετε ένα όνομα χρήστη και έναν κωδικό πρόσβασης. Αυτό γίνεται ώστε το bot να μπορεί να συνδεθεί στο Instagram χρησιμοποιώντας τον λογαριασμό σας. Μπορείτε να ανακτήσετε όλα τα δεδομένα των αναρτήσεων χρησιμοποιώντας το get_posts() μέθοδος. Και μπορείτε να επαναλάβετε και να κατεβάσετε όλες τις μεμονωμένες αναρτήσεις χρησιμοποιώντας το download_post() μέθοδος.
# Εισαγωγή Βιβλιοθηκών
εισαγωγή installoader
εισαγωγή τα πάντα όπως και πδ# Δημιουργήστε μια παρουσία κλάσης Instaloader
bot = installoader. Instaloader()
bot.login (user="Το όνομα χρήστη σας",passwd="Ο κωδικός σας")# Φόρτωση προφίλ από λαβή Instagram
προφίλ = πρόγραμμα εγκατάστασης. Profile.from_username (bot.context, 'Your_target_account_insta_handle')# Ανάκτηση όλων των αναρτήσεων σε ένα αντικείμενο
posts = profile.get_posts()
# Επανάληψη και λήψη όλων των μεμονωμένων αναρτήσεων
για ευρετήριο, ανάρτηση στην απαρίθμηση (αναρτήσεις, 1):
bot.download_post (ανάρτηση, target=f"{profile.username}_{index}")
Ξύστε τον Ιστό χρησιμοποιώντας Python
Η απόξεση δεδομένων ή η απόξεση ιστού είναι ένας από τους πιο συνηθισμένους τρόπους εξαγωγής χρήσιμων πληροφοριών από τον ιστό. Μπορείτε να χρησιμοποιήσετε τα δεδομένα που εξάγετε για μάρκετινγκ, δημιουργία περιεχομένου ή λήψη αποφάσεων.
Η Python είναι η προτιμώμενη γλώσσα για την απόξεση δεδομένων. Βιβλιοθήκες όπως το BeautifulSoup, το Scrapy και το Panda απλοποιούν την εξαγωγή, την ανάλυση και την οπτικοποίηση δεδομένων.