Αναζητάτε δωρεάν δεδομένα για να εξασκήσετε τις δεξιότητές σας στην ανάλυση δεδομένων; Εδώ είναι μερικοί από τους κορυφαίους ιστότοπους που μπορείτε να ελέγξετε.
Είτε διεξάγετε έρευνα αγοράς, είτε χτίζετε το χαρτοφυλάκιό σας ως αναλυτής είτε αναζητάτε πληροφορίες για να επεκτείνετε την εμβέλειά σας στην αγορά, τα πολύτιμα και αξιόπιστα δεδομένα είναι απαραίτητα για τη λήψη τεκμηριωμένων αποφάσεων.
Ωστόσο, η αναζήτηση στο διαδίκτυο για δωρεάν, αξιόπιστα και προσβάσιμα δεδομένα έχει ορισμένες προκλήσεις. Αυτό το άρθρο θα κάνει την αναζήτηση δεδομένων σας λιγότερο δύσκολη, παρουσιάζοντάς σας μερικούς από τους κορυφαίους ιστότοπους για πρόσβαση σε δωρεάν δεδομένα.
Το Google Trends είναι μια δωρεάν υπηρεσία που αναπτύχθηκε από την Google και παρέχει στους χρήστες αφιλτράριστα δείγματα δεδομένων των αιτημάτων αναζήτησης που υποβάλλονται στην Google. Αν και αυτή η υπηρεσία εμφανίζει δεδομένα χρονοσειρών από το 2004 έως σήμερα τόσο σε παγκόσμια κλίμακα όσο και σε επίπεδο πόλης, δεν εμφανίζει τα προσωπικά στοιχεία των χρηστών της μηχανής αναζήτησης.
Μπορείτε επίσης να περιορίσετε τα δεδομένα ώστε να εστιάζουν σε κατηγορίες, γλώσσες, οντότητες ή ανερχόμενες αναζητήσεις στο Google με το Google Trends. Παραδείγματα διαθέσιμων δεδομένων περιλαμβάνουν καθημερινές τάσεις αναζήτησης και τάσεις αναζήτησης σε πραγματικό χρόνο, τα οποία εμφανίζουν δεδομένα για τις τελευταίες επτά ημέρες.
Το FiveThirtyEight είναι ένας ιστότοπος δημοσιογραφίας δεδομένων που έχει δεδομένα σχετικά με την ανάλυση δημοσκοπήσεων, τον αθλητισμό, την ποπ κουλτούρα, την πολιτική, την επιστήμη και τα οικονομικά γεγονότα.
Το υπέροχο με τον ιστότοπο είναι ότι μπορείτε να κάνετε λήψη των δεδομένων από τον ιστότοπό τους ή από τον δικό τους επίσημο αποθετήριο GitHub και χρησιμοποιήστε το δικό σας εργαλεία οπτικοποίησης δεδομένων για τη δημιουργία συναρπαστικών γραφικών δημοσιογραφίας δεδομένων για το κοινό σας. Μερικά παραδείγματα διαθέσιμων ενδιαφερόντων δεδομένων περιλαμβάνουν το προβλέψεις για το παγκόσμιο κύπελλο και Δεδομένα προβλέψεων NHL 2022-23.
Το BuzzFeed News είναι μια αμερικανική πλατφόρμα έκτακτων ειδήσεων και πρωτότυπων ρεπορτάζ που αναφέρει τα πάντα, από τη δημοσιογραφία, την τεχνολογία, την ψυχαγωγία, τα νέα των διασημοτήτων, τον πολιτισμό και τις DIY hacks μέχρι την υγεία και την πολιτική.
Στο GitHub του, το BuzzFeed News καθιστά το σύνολο δεδομένων, τα εργαλεία και την ανάλυσή του από το newsroom του BuzzFeed ανοιχτού κώδικα, προσβάσιμο και διαθέσιμο. Ένα παράδειγμα περιλαμβάνει το Δεδομένα ελέγχου ιστορικού πυροβόλου όπλου FBI NICS.
Το Data.gov είναι ο ιστότοπος ανοιχτών δεδομένων της κυβέρνησης των Ηνωμένων Πολιτειών που φιλοξενεί πάνω από 250.000 διαθέσιμα στο κοινό, καλά τεκμηριωμένα σύνολα δεδομένων από διεθνείς και πολλαπλούς ομοσπονδιακούς κυβερνητικούς φορείς. Η ιδέα πίσω από αυτή την πρωτοβουλία ήταν να παράσχει μια ανοιχτή και διαφανή κυβέρνηση.
Μπορείτε να αποκτήσετε πρόσβαση σε δεδομένα από τον ιστότοπο με βάση το θέμα και την εταιρεία ή τον οργανισμό. Μερικά παραδείγματα δεδομένων που μπορείτε να βρείτε στο Data.gov είναι το εθνικό σύστημα δεδομένων φοιτητικών δανείων και δεδομένα πληθυσμού ηλεκτρικών οχημάτων.
Το Kaggle είναι μια δημόσια παιδική χαρά δεδομένων που αποκτήθηκε από την Google και προσφέρει ένα ευρύ φάσμα συνόλων δεδομένων για διάφορα θέματα. Αυτή η πλατφόρμα κοινότητας σάς επιτρέπει να μοιράζεστε τους κωδικούς σας, να μαθαίνετε, να συνεργάζεστε με άλλους επαγγελματίες δεδομένων και να αποκτάτε δεξιότητες. Το Kaggle φιλοξενεί επίσης διαγωνισμούς επιστήμης δεδομένων όπου μπορείτε να κερδίσετε διάφορα βραβεία.
Αυτός ο οδηγός παρέχει α οδηγός για αρχάριους για το πώς να ξεκινήσετε με το Kaggle για την επιστήμη δεδομένων. Ένα παράδειγμα είναι το Παγκόσμια στατιστικά YouTube 2023.
Το EarthData είναι μια πρωτοβουλία δεδομένων της NASA που χρησιμεύει ως αποθήκη δεδομένων της γης από το 1994 έως σήμερα. Μπορείτε να λάβετε δεδομένα που σχετίζονται από πληροφορίες απομακρυσμένου δορυφόρου έως δεδομένα σχετικά με την ατμόσφαιρα της Γης, τον ωκεανό και την Υδρόσφαιρα της Γης.
Μπορείτε να περιηγηθείτε σε διάφορα θέματα και να αποκτήσετε πρόσβαση σε δεδομένα όπως δεδομένα ακραίας θερμότητας. Ωστόσο, θα πρέπει να εξερευνήσετε Το πλανητικό σύστημα δεδομένων της NASA για μη γήινα δεδομένα.
Το IMDb παρέχει δεδομένα σχετικά με ταινίες, τηλεοπτικές σειρές, οικιακά βίντεο, podcast, βιντεοπαιχνίδια, πληροφορίες ροής και περιεχόμενο διασημοτήτων. Ένα παράδειγμα είναι Μη εμπορικά σύνολα δεδομένων IMDb.
Το AWS Public Dataset είναι ένας ιστότοπος που φιλοξενεί πάνω από 3000 σύνολα δεδομένων από σύνολα δεδομένων που διατίθενται δημόσια μέσω των υπηρεσιών AWS. Τα περισσότερα από τα σύνολα δεδομένων εδώ βασίζονται σε έργα. Μερικά περιλαμβάνουν το άτλαντας του γονιδιώματος του καρκίνου και Foldingathome σύνολα δεδομένων COVID-19.
Το Inside Airbnb είναι ένας ιστότοπος παρακολούθησης που ξεκίνησε από τον Murray Cox. Αυτός ο ιστότοπος προέρχεται από δεδομένα δημόσια διαθέσιμα από Airbnb, μια πλατφόρμα που προσφέρει στους χρήστες οικονομικά δωμάτια σε όλο τον κόσμο. Μπορείτε να χρησιμοποιήσετε πληροφορίες από αυτόν τον ιστότοπο για να πραγματοποιήσετε αναλύσεις όπως το αναλυτικά στοιχεία ενοικίασης του Μόντρεαλ.
Το Google Dataset Search είναι μια μηχανή αναζήτησης δεδομένων που δημιουργήθηκε από την Google και φιλοξενεί πάνω από 20 εκατομμύρια σύνολα δεδομένων. Όπως και η μηχανή αναζήτησής τους, μπορείτε να λάβετε δεδομένα από σχεδόν οτιδήποτε. Ένα καλό παράδειγμα είναι το Καναδικά εθνικά μακροπρόθεσμα δεδομένα παρακολούθησης της ποιότητας του νερού.
Το UC Irvine Machine Learning Repository είναι το σπίτι 624 συνόλων δεδομένων για την κοινότητα μηχανικής μάθησης στον κόσμο. Αυτός ο ιστότοπος έχει μεγάλη φήμη στην κοινότητα, επειδή τα σύνολα δεδομένων κατηγοριοποιούνται με βάση τις εργασίες μηχανικής εκμάθησης για τις οποίες είναι κατάλληλα. Ένα παράδειγμα είναι το Δεδομένα Iris, ένα διάσημο σύνολο δεδομένων μοντέλων ταξινόμησης και ομαδοποίησης.
Το Datahub ως πλατφόρμα έχει πολλά σύνολα δεδομένων που καλύπτουν ένα ευρύ φάσμα θεμάτων όπως το Αποδόσεις 10ετών κρατικών ομολόγων των ΗΠΑ (μακροπρόθεσμο επιτόκιο). Εκτός από τα δεδομένα, εμφανίζουν επίσης εργαλεία δεδομένων και εργαλειοθήκες που μπορούν να χρησιμοποιηθούν για επαγγελματίες δεδομένων.
Αυτός είναι ο πρώτος ιστότοπος στη λίστα μας για αποκλειστικά δεδομένα υγείας. Το Παγκόσμιο Παρατηρητήριο Υγείας χρησιμεύει ως αποθήκη δεδομένων που εμφανίζει στατιστικά στοιχεία που σχετίζονται με την υγεία για περισσότερους από 1000 δείκτες για τα 194 κράτη μέλη του ΠΟΥ. Τα δεδομένα καταγράφονται για την παρακολούθηση της προόδου αυτών των κρατών μελών προς τους στόχους ΣΒΑ. Μπορείτε να λάβετε δεδομένα φιλτράροντας το θέμα, την κατηγορία, τα μεταδεδομένα και την ένδειξη των δεδομένων.
Αυτή η πλατφόρμα είναι πραγματικά εξειδικευμένη. Εμφανίζει δεδομένα έρευνας και πληροφορίες ευφυΐας αγοράς όπως το στοιχεία ταμείου του Σαββατοκύριακου και σχετικά στοιχεία για την κινηματογραφική βιομηχανία του Ηνωμένου Βασιλείου.
Το GitHub είναι κάτι περισσότερο από το σπίτι εκατομμυρίων έργων συνεργασίας και ανοιχτού κώδικα. Η πλατφόρμα φιλοξενεί επίσης πολλά αποθετήρια που στοχεύουν να διατηρούν δωρεάν, δημόσια και ανοιχτού κώδικα σύνολα δεδομένων. Ακόμη και Το BuzzFeedNews διαθέτει αποθετήριο GitHub ανοιχτού κώδικα.
Άλλα παραδείγματα είναι τα Καταπληκτικό αποθετήριο δημόσιων συνόλων δεδομένων και ανυψώνετε καν το σύνολο δεδομένων. Μπορείτε επίσης να συνεισφέρετε σε αυτά τα έργα ανοιχτού κώδικα στο GitHub.
Το Data.world είναι μια κοινότητα δεδομένων και μια πλατφόρμα συνεργασίας που φιλοξενεί έργα δεδομένων και σύνολα δεδομένων. Ενώ πληρώνονται μερικά σύνολα δεδομένων, κυρίως από τα δεδομένα στην πλατφόρμα, όπως π.χ Makeover Monday's 2021/W16: μηνιαίες αεροπορικές επιβάτες στην Αμερική, είναι δωρεάν και μπορούν εύκολα να ληφθούν τοπικά ή να προσπελαστούν μέσω του API τους.
Τα Open Data της Παγκόσμιας Τράπεζας είναι ένας κατάλογος παγκόσμιων οικονομικών και αναπτυξιακών δεδομένων. Μπορείτε να περιηγηθείτε και να φιλτράρετε τα δεδομένα, όπως το παγκόσμιες στατιστικές σχετικά με το κόστος και την οικονομική προσιτότητα της υγιεινής διατροφής ανά δείκτη και χώρα.
Το Nasdaq Data Link είναι για όλα τα οικονομικά, οικονομικά και εναλλακτικά δεδομένα. Μπορείτε να αποκτήσετε πρόσβαση σε δεδομένα όπως το Ανακοινώσεις δεδομένων ομοσπονδιακών αποθεματικών των ΗΠΑ μέσω ενός υπολογιστικού φύλλου όπως το Excel ή ενός API.
Η πλατφόρμα δεδομένων NYC Taxi and Limousine Commission καταγράφει και φιλοξενεί πληροφορίες όπως π.χ κίτρινα και πράσινα ρεκόρ ταξιδιών με ταξί σε όλη τη Νέα Υόρκη. Το υπέροχο με αυτόν τον ιστότοπο είναι ότι εμφανίζει πληροφορίες για τα πάντα, από την παραλαβή/αποβίβαση μέχρι τη ζώνη του ταξί και τους ναύλους ταξιδιού.
Το Academic Torrents είναι ένας κατάλογος δεδομένων με περισσότερα από 127,15 TB ερευνητικών δεδομένων. Χτίστηκε, όπως λένε, για ερευνητές και από ερευνητές.
Εξερευνήστε και Μάθετε
Ας ελπίσουμε ότι, με αυτήν τη λίστα, μπορείτε να λάβετε δεδομένα που μπορούν να διαμορφώσουν το τοπίο της επιχείρησής σας, να οδηγήσουν την έρευνα αγοράς σας, να αποκτήσετε ανταγωνιστικό πλεονέκτημα και να σας βοηθήσουν να δημιουργήσετε αυτό το μοναδικό χαρτοφυλάκιο δεδομένων δωρεάν. Αγκαλιάστε λοιπόν τις ευκαιρίες, εξερευνήστε και πραγματοποιήστε μια λιγότερο απαιτητική αναζήτηση δεδομένων.