Το Pandas είναι μια βιβλιοθήκη Python ανοιχτού κώδικα που χρησιμοποιείται κυρίως για χειρισμό και ανάλυση δεδομένων. Είναι χτισμένο πάνω στη βιβλιοθήκη NumPy και παρέχει δομές δεδομένων υψηλής απόδοσης, εύχρηστες και εργαλεία ανάλυσης δεδομένων για τη γλώσσα προγραμματισμού Python.
Σε αυτό το άρθρο, θα μάθετε πώς να εκτελείτε 6 βασικές λειτουργίες χρησιμοποιώντας τα Panda.
Χρήση Παραδειγμάτων Pandas
Μπορείτε να εκτελέσετε τα παραδείγματα σε αυτό το άρθρο χρησιμοποιώντας υπολογιστικά σημειωματάρια όπως Σημειωματάριο Jupyter, Google Colab, και τα λοιπά. Μπορείτε επίσης να εκτελέσετε τα παραδείγματα εισάγοντας τον κώδικα απευθείας στον διερμηνέα Python σε διαδραστική λειτουργία.
Εάν θέλετε να ρίξετε μια ματιά στον πλήρη πηγαίο κώδικα που χρησιμοποιείται σε αυτό το άρθρο, μπορείτε να αποκτήσετε πρόσβαση στο αρχείο Σημειωματάριου Python από αυτό Αποθετήριο GitHub.
1. Πώς να εισαγάγετε τα Panda ως pd και να εκτυπώσετε τον αριθμό έκδοσης
Πρέπει να χρησιμοποιήσετε το εισαγωγή λέξη-κλειδί για εισαγωγή οποιασδήποτε βιβλιοθήκης στην Python. Τα πάντα εισάγονται συνήθως με το
πδ ψευδώνυμο. Με αυτήν την προσέγγιση, μπορείτε να ανατρέξετε στο πακέτο Pandas ως πδ αντί τα πάντα.εισαγωγή panda ως pd
εκτύπωση (pd.__έκδοση__)
Παραγωγή:
1.2.4
2. Πώς να δημιουργήσετε μια σειρά στα Pandas
Το Pandas Series είναι ένας μονοδιάστατος πίνακας που περιέχει δεδομένα οποιουδήποτε τύπου. Είναι σαν μια στήλη σε έναν πίνακα. Μπορείτε να δημιουργήσετε μια σειρά χρησιμοποιώντας numpy πίνακες, numpy συναρτήσεις, λίστες, λεξικά, βαθμωτές τιμές κ.λπ.
Οι τιμές της σειράς επισημαίνονται με τον αριθμό ευρετηρίου τους. Από προεπιλογή, η πρώτη τιμή έχει δείκτη 0, η δεύτερη τιμή έχει δείκτη 1 και ούτω καθεξής. Για να ονομάσετε τις δικές σας ετικέτες, πρέπει να χρησιμοποιήσετε το δείκτης διαφωνία.
Πώς να δημιουργήσετε μια κενή σειρά
s = pd. Σειρά (dtype='float64')
μικρό
Παραγωγή:
Σειρά ([], dtype: float64)
Στο παραπάνω παράδειγμα, μια κενή σειρά με το φλοτέρ δημιουργείται τύπος δεδομένων.
Πώς να δημιουργήσετε μια σειρά χρησιμοποιώντας το NumPy Array
εισαγωγή panda ως pd
εισαγωγή numpy ως np
d = np.array([1, 2, 3, 4, 5])
s = pd. Σειρά (δ)
μικρό
Παραγωγή:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Σχετίζεται με: Λειτουργίες NumPy για αρχάριους
Πώς να δημιουργήσετε μια σειρά χρησιμοποιώντας τη λίστα
d = [1, 2, 3, 4, 5]
s = pd. Σειρά (δ)
μικρό
Παραγωγή:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Πώς να δημιουργήσετε μια σειρά με ευρετήριο
Για να δημιουργήσετε μια σειρά με ευρετήριο, πρέπει να χρησιμοποιήσετε το δείκτης διαφωνία. Ο αριθμός των ευρετηρίων πρέπει να είναι ίσος με τον αριθμό των στοιχείων της σειράς.
d = [1, 2, 3, 4, 5]
s = pd. Σειρά (d, index=["ένα", "δύο", "τρία", "τέσσερα", "πέντε"])
μικρό
Παραγωγή:
ένα 1
δύο 2
τρεις 3
τέσσερα 4
πέντε 5
dtype: int64
Πώς να δημιουργήσετε μια σειρά χρησιμοποιώντας λεξικό
Τα κλειδιά του λεξικού γίνονται οι ετικέτες της σειράς.
d = {"one": 1,
"δύο": 2,
"τρία": 3,
"τέσσερα": 4,
"πέντε": 5}
s = pd. Σειρά (δ)
μικρό
Παραγωγή:
ένα 1
δύο 2
τρεις 3
τέσσερα 4
πέντε 5
dtype: int64
Πώς να δημιουργήσετε μια σειρά χρησιμοποιώντας κλιμακωτή τιμή
Εάν θέλετε να δημιουργήσετε μια σειρά χρησιμοποιώντας μια βαθμωτή τιμή, πρέπει να παράσχετε το δείκτης διαφωνία.
s = pd. Σειρά (1, ευρετήριο = ["a", "b", "c", "d"])
μικρό
Παραγωγή:
Α'1
β 1
γ 1
δ 1
dtype: int64
3. Πώς να δημιουργήσετε ένα πλαίσιο δεδομένων στο Pandas
Το DataFrame είναι μια δισδιάστατη δομή δεδομένων όπου τα δεδομένα ευθυγραμμίζονται με τη μορφή σειρών και στηλών. Ένα DataFrame μπορεί να δημιουργηθεί χρησιμοποιώντας λεξικά, λίστες, λίστα λεξικών, numpy array κ.λπ. Στον πραγματικό κόσμο, τα DataFrames δημιουργούνται χρησιμοποιώντας υπάρχοντα χώρο αποθήκευσης όπως αρχεία CSV, αρχεία excel, βάσεις δεδομένων SQL κ.λπ.
Το αντικείμενο DataFrame υποστηρίζει μια σειρά από χαρακτηριστικά και μεθόδους. Εάν θέλετε να μάθετε περισσότερα για αυτά, μπορείτε να δείτε την επίσημη τεκμηρίωση του πλαίσιο δεδομένων pandas.
Πώς να δημιουργήσετε ένα κενό πλαίσιο δεδομένων
df = πδ. Πλαίσιο δεδομένων()
εκτύπωση (df)
Παραγωγή:
Κενό DataFrame
Στήλες: []
Ευρετήριο: []
Πώς να δημιουργήσετε ένα DataFrame χρησιμοποιώντας τη λίστα
listObj = ["MUO", "τεχνολογία", "απλοποιημένη"]
df = πδ. DataFrame (listObj)
εκτύπωση (df)
Παραγωγή:
0
0 MUO
1 τεχνολογία
2 απλοποιημένο
Πώς να δημιουργήσετε ένα DataFrame χρησιμοποιώντας το λεξικό ndarray/Lists
batmanData = {'Όνομα ταινίας': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Έτος κυκλοφορίας': [2005, 2008, 2012]}
df = πδ. DataFrame (batmanData)
εκτύπωση (df)
Παραγωγή:
Όνομα ταινίας Έτος κυκλοφορίας
0 Batman Begins 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012
Πώς να δημιουργήσετε ένα DataFrame χρησιμοποιώντας τη λίστα λιστών
δεδομένα = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = πδ. DataFrame (δεδομένα, στήλες = ['Όνομα', 'Αριθμός ρολού'])
εκτύπωση (df)
Παραγωγή:
Όνομα Ρολό Αρ.
0 Alex 601
1 Bob 602
2 Cataline 603
Πώς να δημιουργήσετε ένα DataFrame χρησιμοποιώντας λίστα λεξικών
data = [{'Name': 'Alex', 'Roll No.': 601},
{'Name': 'Bob', 'Roll No.': 602},
{'Name': 'Cataline', 'Roll No.': 603}]
df = πδ. DataFrame (δεδομένα)
εκτύπωση (df)
Παραγωγή:
Όνομα Ρολό Αρ.
0 Alex 601
1 Bob 602
2 Cataline 603
Σχετίζεται με: Πώς να μετατρέψετε μια λίστα σε λεξικό στην Python
Πώς να δημιουργήσετε ένα DataFrame χρησιμοποιώντας τη συνάρτηση zip().
Χρησιμοποιήστε το φερμουάρ() λειτουργία για τη συγχώνευση λιστών στην Python.
Όνομα = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = λίστα (zip (Όνομα, RollNo))
df = πδ. DataFrame (listOfTuples, στήλες = ['Όνομα', 'Αριθμός ρολού'])
εκτύπωση (df)
Παραγωγή:
Όνομα Ρολό Αρ.
0 Alex 601
1 Bob 602
2 Cataline 603
4. Πώς να διαβάσετε δεδομένα CSV στα Pandas
Ένα αρχείο "τιμές διαχωρισμένες με κόμμα" (CSV) είναι ένα οριοθετημένο αρχείο κειμένου που χρησιμοποιεί κόμμα για να διαχωρίσει τιμές. Μπορείτε να διαβάσετε ένα αρχείο CSV χρησιμοποιώντας το read_csv() μέθοδος στα πάντα. Εάν θέλετε να εκτυπώσετε ολόκληρο το DataFrame, χρησιμοποιήστε το to_string() μέθοδος.
Σε αυτό και στα επόμενα παραδείγματα, αυτό αρχείο CSV θα χρησιμοποιηθεί για την εκτέλεση των εργασιών.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
εκτύπωση (df.to_string())
Παραγωγή:
5. Πώς να αναλύσετε DataFrames χρησιμοποιώντας τις μεθόδους head(), tail() and info()
Πώς να προβάλετε δεδομένα χρησιμοποιώντας τη μέθοδο head().
ο κεφάλι() μέθοδος είναι ένας από τους καλύτερους τρόπους για να αποκτήσετε μια γρήγορη επισκόπηση του DataFrame. Αυτή η μέθοδος επιστρέφει την κεφαλίδα και τον καθορισμένο αριθμό σειρών, ξεκινώντας από την κορυφή.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
εκτύπωση (df.head (10))
Παραγωγή:
Εάν δεν καθορίσετε τον αριθμό των σειρών, οι πρώτες 5 σειρές θα επιστραφούν.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
εκτύπωση (df.head())
Παραγωγή:
Πώς να προβάλετε δεδομένα χρησιμοποιώντας τη μέθοδο tail().
ο ουρά() μέθοδος επιστρέφει την κεφαλίδα και τον καθορισμένο αριθμό σειρών, ξεκινώντας από το κάτω μέρος.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
εκτύπωση (df.tail (10))
Παραγωγή:
Εάν δεν καθορίσετε τον αριθμό των σειρών, θα επιστραφούν οι τελευταίες 5 σειρές.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
εκτύπωση (df.tail())
Παραγωγή:
Πώς να λάβετε πληροφορίες σχετικά με τα δεδομένα
ο πληροφορίες () Οι μέθοδοι επιστρέφουν μια σύντομη περίληψη ενός DataFrame, συμπεριλαμβανομένου του dtype του ευρετηρίου και των τύπων στήλης d, των μη μηδενικών τιμών και της χρήσης μνήμης.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
εκτύπωση (df.info())
Παραγωγή:
6. Πώς να διαβάσετε δεδομένα JSON στα Pandas
JSON (Javaμικρόcript Οαντικείμενο Νotation) είναι μια ελαφριά μορφή ανταλλαγής δεδομένων. Μπορείτε να διαβάσετε ένα αρχείο JSON χρησιμοποιώντας το read_json() μέθοδος στα πάντα. Εάν θέλετε να εκτυπώσετε ολόκληρο το DataFrame, χρησιμοποιήστε το to_string() μέθοδος.
Στο παρακάτω παράδειγμα, αυτό αρχείο JSON χρησιμοποιείται για την εκτέλεση των λειτουργιών.
Σχετίζεται με: Τι είναι το JSON; A Layman's Overview
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
εκτύπωση (df.to_string())
Παραγωγή:
Ανανεώστε τις γνώσεις σας για την Python με ενσωματωμένες συναρτήσεις και μεθόδους
Οι λειτουργίες βοηθούν στη συντόμευση του κώδικά σας και στη βελτίωση της αποτελεσματικότητάς του. Λειτουργίες και μέθοδοι όπως περιορίζω(), διαίρεση(), απαριθμώ(), eval(), γύρος(), και τα λοιπά. μπορεί να κάνει τον κώδικά σας ισχυρό και εύκολο στην κατανόηση. Είναι πάντα καλό να γνωρίζετε για τις ενσωματωμένες λειτουργίες και μεθόδους, καθώς μπορούν να απλοποιήσουν τις εργασίες προγραμματισμού σας σε μεγάλο βαθμό.
Η τυπική βιβλιοθήκη Python περιέχει πολλές λειτουργίες για να σας βοηθήσει με τις προγραμματιστικές σας εργασίες. Μάθετε για τους πιο χρήσιμους και δημιουργήστε πιο ισχυρό κώδικα.
Διαβάστε Επόμενο
- Προγραμματισμός
- Πύθων
- Ανάπτυξη διαδικτύου
- Προγραμματισμός
- Ανάλυση δεδομένων
Ο Yuvraj είναι προπτυχιακός φοιτητής της Επιστήμης Υπολογιστών στο Πανεπιστήμιο του Δελχί, Ινδία. Είναι παθιασμένος με την Full Stack Web Development. Όταν δεν γράφει, εξερευνά το βάθος των διαφορετικών τεχνολογιών.
Εγγραφείτε στο ενημερωτικό μας δελτίο
Εγγραφείτε στο ενημερωτικό μας δελτίο για συμβουλές τεχνολογίας, κριτικές, δωρεάν ebook και αποκλειστικές προσφορές!
Κάντε κλικ εδώ για να εγγραφείτε