Η βιβλιοθήκη pandas κάνει την επιστήμη δεδομένων που βασίζεται σε python μια εύκολη διαδρομή. Είναι μια δημοφιλής βιβλιοθήκη Python για ανάγνωση, συγχώνευση, ταξινόμηση, καθαρισμό δεδομένων και πολλά άλλα. Αν και το panda είναι εύκολο στη χρήση και εφαρμογή σε σύνολα δεδομένων, έχει πολλές λειτουργίες χειρισμού δεδομένων για εκμάθηση.

Μπορεί να χρησιμοποιείτε πάντα πάντα, αλλά υπάρχει μεγάλη πιθανότητα να το χρησιμοποιείτε ελάχιστα για την επίλυση προβλημάτων που σχετίζονται με δεδομένα. Ακολουθεί η λίστα μας με τις πολύτιμες λειτουργίες των panda που χειρίζονται δεδομένα που κάθε επιστήμονας δεδομένων πρέπει να γνωρίζει.

Εγκαταστήστε τα πάντα στο εικονικό σας περιβάλλον

Πριν προχωρήσουμε, βεβαιωθείτε ότι έχετε εγκαταστήσει τα panda στο εικονικό σας περιβάλλον χρησιμοποιώντας το pip:

pip install panda

Αφού το εγκαταστήσετε, κάντε εισαγωγή πάντα στην κορυφή του σεναρίου σας και ας προχωρήσουμε.

1. πάντα. Πλαίσιο δεδομένων

Εσυ χρησιμοποιεις πάντα. Πλαίσιο δεδομένων() για να δημιουργήσετε ένα DataFrame σε panda. Υπάρχουν δύο τρόποι χρήσης αυτής της λειτουργίας.

instagram viewer

Μπορείτε να σχηματίσετε μια στήλη DataFrame περνώντας ένα λεξικό στο πάντα. Πλαίσιο δεδομένων() λειτουργία. Εδώ, κάθε κλειδί είναι μια στήλη, ενώ οι τιμές είναι οι σειρές:

εισαγωγή παντα
DataFrame = pandas. DataFrame({"A": [1, 3, 4], "B": [5, 9, 12]})
εκτύπωση (DataFrame)

Η άλλη μέθοδος είναι να σχηματίσετε το DataFrame στις σειρές. Αλλά εδώ, θα διαχωρίσετε τις τιμές (στοιχεία γραμμής) από τις στήλες. Ο αριθμός των δεδομένων σε κάθε λίστα (δεδομένα σειράς) πρέπει επίσης να αντιστοιχεί στον αριθμό των στηλών.

εισαγωγή παντα
DataFrame = pandas. DataFrame([[1, 4, 5], [7, 19, 13]], στήλες= ["J", "K", "L"])
εκτύπωση (DataFrame)

2. Διαβάστε από και γράψτε σε Excel ή CSV στα panda

Μπορείτε να διαβάσετε ή να γράψετε σε αρχεία Excel ή CSV με panda.

Ανάγνωση αρχείων Excel ή CSV

Για να διαβάσετε ένα αρχείο Excel:

#Αντικαταστήστε το example.xlsx με τη διαδρομή του αρχείου σας Excel
DataFrame = DataFrame.read_excel("example.xlsx")

Δείτε πώς μπορείτε να διαβάσετε ένα αρχείο CSV:

#Αντικαταστήστε το example.csv με τη διαδρομή του αρχείου σας CSV
DataFrame = DataFrame.read_csv("example.csv")

Γράψιμο σε Excel ή CSV

Η εγγραφή σε Excel ή CSV είναι μια πολύ γνωστή λειτουργία των panda. Και είναι βολικό για την αποθήκευση πινάκων που έχουν υπολογιστεί πρόσφατα σε ξεχωριστά φύλλα δεδομένων.

Για να γράψετε σε ένα φύλλο Excel:

DataFrame.to_excel("full_path_of_the_destination_folder/filename.xlsx")

Εάν θέλετε να γράψετε στο CSV:

DataFrame.to_csv("full_path_of_the_destination_folder/filename.csv")

Μπορείτε επίσης να υπολογίσετε τις κεντρικές τάσεις κάθε στήλης σε ένα DataFrame χρησιμοποιώντας panda.

Δείτε πώς μπορείτε να λάβετε τη μέση τιμή κάθε στήλης:

DataFrame.mean()

Για τη διάμεση τιμή ή την τιμή λειτουργίας, αντικαταστήστε σημαίνω() με διάμεσος() ή τρόπος().

4. DataFrame.transform

παντα' DataFrame.transform() τροποποιεί τις τιμές ενός DataFrame. Δέχεται μια συνάρτηση ως όρισμα.

Για παράδειγμα, ο παρακάτω κώδικας πολλαπλασιάζει κάθε τιμή σε ένα DataFrame επί τρεις χρησιμοποιώντας Η συνάρτηση λάμδα της Python:

DataFrame = DataFrame.transform (λάμδα y: y*3)
εκτύπωση (DataFrame)

5. DataFrame.isnull

Αυτή η συνάρτηση επιστρέφει μια Boolean τιμή και επισημαίνει όλες τις σειρές που περιέχουν μηδενικές τιμές ως Αληθής:

DataFrame.isnull()

Το αποτέλεσμα του παραπάνω κώδικα μπορεί να είναι δύσκολο να διαβαστεί για μεγαλύτερα σύνολα δεδομένων. Έτσι μπορείτε να χρησιμοποιήσετε το isnull().sum() αντ' αυτού. Αυτό επιστρέφει μια σύνοψη όλων των τιμών που λείπουν για κάθε στήλη:

DataFrame.isnull().sum()

6. Dataframe.info

ο πληροφορίες () η συνάρτηση είναι μια βασική λειτουργία των πάντα. Αντ' αυτού, επιστρέφει τη σύνοψη των τιμών που δεν λείπουν για κάθε στήλη:

DataFrame.info()

7. DataFrame.describe

ο περιγράφω() Η συνάρτηση σάς δίνει τη συνοπτική στατιστική ενός DataFrame:

DataFrame.describe()

8. DataFrame.replace

Χρησιμοποιώντας το DataFrame.replace() μέθοδος στα panda, μπορείτε να αντικαταστήσετε επιλεγμένες σειρές με άλλες τιμές.

Για παράδειγμα, για εναλλαγή μη έγκυρων σειρών με Nan:

# Βεβαιωθείτε ότι έχετε εγκαταστήσει το pip numpy για να λειτουργήσει αυτό
εισαγωγή numpy
εισαγωγή παντα
# Η προσθήκη μιας λέξης-κλειδιού εντόπισης και η ρύθμιση της σε True κάνει τις αλλαγές μόνιμες:
DataFrame.replace([invalid_1, invalid_2], numpy.nan, inplace=True)
εκτύπωση (DataFrame)

9. DataFrame.fillna

Αυτή η συνάρτηση σάς επιτρέπει να γεμίζετε κενές σειρές με μια συγκεκριμένη τιμή. Μπορείτε να τα γεμίσετε όλα Nan σειρές σε ένα σύνολο δεδομένων με τη μέση τιμή, για παράδειγμα:

DataFrame.fillna (df.mean(), inplace = True)
εκτύπωση (DataFrame)

Μπορείτε επίσης να είστε συγκεκριμένοι για τη στήλη:

DataFrame['column_name'].fillna (df[column_name].mean(), inplace = True)
εκτύπωση (DataFrame)

10. DataFrame.dropna

ο dropna() Η μέθοδος αφαιρεί όλες τις σειρές που περιέχουν μηδενικές τιμές:

DataFrame.dropna (inplace = True)
εκτύπωση (DataFrame)

11. DataFrame.insert

Μπορείτε να χρησιμοποιήσετε τα πάντα εισάγετε() λειτουργία για να προσθέσετε μια νέα στήλη σε ένα DataFrame. Δέχεται τρεις λέξεις-κλειδιά, το όνομα στήλης, μια λίστα με τα δεδομένα του και του τοποθεσία, που είναι ευρετήριο στήλης.

Δείτε πώς λειτουργεί αυτό:

DataFrame.insert (στήλη = 'C', τιμή = [3, 4, 6, 7], loc=0)
εκτύπωση (DataFrame)

Ο παραπάνω κωδικός εισάγει τη νέα στήλη στο μηδενικό ευρετήριο στήλης (γίνεται η πρώτη στήλη).

12. DataFrame.loc

Μπορείς να χρησιμοποιήσεις loc για να βρείτε τα στοιχεία σε ένα συγκεκριμένο ευρετήριο. Για να προβάλετε όλα τα στοιχεία στην τρίτη σειρά, για παράδειγμα:

DataFrame.loc[2]

13. DataFrame.pop

Αυτή η συνάρτηση σάς επιτρέπει να αφαιρέσετε μια καθορισμένη στήλη από ένα pandas DataFrame.

Δέχεται ένα είδος λέξη-κλειδί, επιστρέφει την αναδυόμενη στήλη και τη διαχωρίζει από το υπόλοιπο DataFrame:

DataFrame.pop (στοιχείο= 'όνομα_στήλης')
εκτύπωση (DataFrame)

14. DataFrame.max, ελάχ

Η λήψη των μέγιστων και ελάχιστων τιμών χρησιμοποιώντας τα πάντα είναι εύκολη:

DataFrame.min()

Ο παραπάνω κωδικός επιστρέφει την ελάχιστη τιμή για κάθε στήλη. Για να πάρετε το μέγιστο, αντικαταστήστε ελάχ με Μέγιστη.

15. DataFrame.join

ο Συμμετοχή() Η λειτουργία των pandas σάς επιτρέπει να συγχωνεύετε DataFrames με διαφορετικά ονόματα στηλών. Μπορείτε να χρησιμοποιήσετε την αριστερή, δεξιά, εσωτερική ή εξωτερική ένωση. Για να συμμετάσχετε αριστερά σε ένα DataFrame με δύο άλλα:

#Αριστερή ένωση μακρύτερων στηλών με μικρότερες
newDataFrame = df1.join([df_shorter2, df_shorter3], how='left')
εκτύπωση (newDataFrame)

Για να ενώσετε DataFrames με παρόμοια ονόματα στηλών, μπορείτε να τα διαφοροποιήσετε προσθέτοντας ένα επίθημα στα αριστερά ή στα δεξιά. Κάντε αυτό συμπεριλαμβάνοντας το l επίθημα ή rs επίθημα λέξη-κλειδί:

newDataFrame = df1.join([df2, rsuffix='_', how='outer') 
εκτύπωση (newDataFrame)

16. DataFrame.combine

ο συνδυασμός() Η λειτουργία είναι χρήσιμη για τη συγχώνευση δύο DataFrames που περιέχουν παρόμοια ονόματα στηλών με βάση καθορισμένα κριτήρια. Δέχεται α λειτουργία λέξη-κλειδί.

Για παράδειγμα, για να συγχωνεύσετε δύο DataFrames με παρόμοια ονόματα στηλών με βάση μόνο τις μέγιστες τιμές:

newDataFrame = df.combine (df2, numpy.minimum)
εκτύπωση (newDataFrame)

Σημείωση: Μπορείτε επίσης να ορίσετε μια προσαρμοσμένη λειτουργία επιλογής και να εισάγετε numpy.ελάχιστο.

17. DataFrame.atype

ο astype() η συνάρτηση αλλάζει τον τύπο δεδομένων μιας συγκεκριμένης στήλης ή DataFrame.

Για να αλλάξετε όλες τις τιμές σε ένα DataFrame σε συμβολοσειρά, για παράδειγμα:

DataFrame.atype (str)

18. DataFrame.sum

ο άθροισμα() Η συνάρτηση στο pandas επιστρέφει το άθροισμα των τιμών σε κάθε στήλη:

DataFrame.sum()

Μπορείτε επίσης να βρείτε το αθροιστικό άθροισμα όλων των στοιχείων που χρησιμοποιείτε cumsum():

DataFrame.cumsum()

19. DataFrame.drop

παντα' πτώση() η συνάρτηση διαγράφει συγκεκριμένες γραμμές ή στήλες σε ένα DataFrame. Πρέπει να δώσετε τα ονόματα στηλών ή το ευρετήριο γραμμών και έναν άξονα για να το χρησιμοποιήσετε.

Για να αφαιρέσετε συγκεκριμένες στήλες, για παράδειγμα:

df.drop (columns=['colum1', 'column2'], axis=0)

Για να ρίξετε σειρές στους δείκτες 1, 3 και 4, για παράδειγμα:

df.drop([1, 3, 4], axis=0)

20. DataFrame.corr

Θέλετε να βρείτε τη συσχέτιση μεταξύ ακέραιων ή αιωρούμενων στηλών; τα πάντα μπορούν να σας βοηθήσουν να το πετύχετε χρησιμοποιώντας το corr() λειτουργία:

DataFrame.corr()

Ο παραπάνω κώδικας επιστρέφει ένα νέο DataFrame που περιέχει την αλληλουχία συσχέτισης μεταξύ όλων των ακέραιων ή αιωρούμενων στηλών.

21. DataFrame.add

ο Προσθήκη() Η λειτουργία σάς επιτρέπει να προσθέσετε έναν συγκεκριμένο αριθμό σε κάθε τιμή στο DataFrame. Λειτουργεί με επανάληψη μέσω ενός DataFrame και λειτουργίας σε κάθε στοιχείο.

Σχετίζεται με:Πώς να χρησιμοποιήσετε το For Loops στην Python

Για να προσθέσετε 20 σε καθεμία από τις τιμές σε μια συγκεκριμένη στήλη που περιέχει ακέραιους ή κινητήριους αριθμούς, για παράδειγμα:

DataFrame['interger_column'].add (20)

22. DataFrame.sub

Όπως και η συνάρτηση πρόσθεσης, μπορείτε επίσης να αφαιρέσετε έναν αριθμό από κάθε τιμή σε ένα DataFrame ή σε συγκεκριμένη στήλη:

DataFrame['interger_column'].sub (10)

23. DataFrame.mul

Αυτή είναι μια έκδοση πολλαπλασιασμού της συνάρτησης πρόσθεσης των πάντα:

DataFrame['interger_column'].mul (20)

24. DataFrame.div

Ομοίως, μπορείτε να διαιρέσετε κάθε σημείο δεδομένων σε μια στήλη ή DataFrame με έναν συγκεκριμένο αριθμό:

DataFrame['interger_column'].div (20)

25. DataFrame.std

Χρησιμοποιώντας το std() λειτουργία, το pandas σάς επιτρέπει επίσης να υπολογίσετε την τυπική απόκλιση για κάθε στήλη σε ένα DataFrame. Λειτουργεί επαναλαμβάνοντας κάθε στήλη σε ένα σύνολο δεδομένων και υπολογίζοντας την τυπική απόκλιση για κάθε:

DataFrame.std()

26. DataFrame.sort_values

Μπορείτε επίσης να ταξινομήσετε τις τιμές αύξουσα ή φθίνουσα με βάση μια συγκεκριμένη στήλη. Για να ταξινομήσετε ένα DataFrame με φθίνουσα σειρά, για παράδειγμα:

newDataFrame = DataFrame.sort_values ​​(κατά = "colmun_name", φθίνουσα = True)

27. DataFrame.melt

ο τήκω() Η λειτουργία στα pandas αναστρέφει τις στήλες σε ένα DataFrame σε μεμονωμένες σειρές. Είναι σαν να εκθέτεις την ανατομία ενός DataFrame. Έτσι, σας επιτρέπει να προβάλετε ρητά την τιμή που έχει εκχωρηθεί σε κάθε στήλη.

newDataFrame = DataFrame.melt()

28. DataFrame.count

Αυτή η συνάρτηση επιστρέφει τον συνολικό αριθμό των στοιχείων σε κάθε στήλη:

DataFrame.count()

29. DataFrame.query

παντα' ερώτηση() σας επιτρέπει να καλείτε στοιχεία χρησιμοποιώντας τον αριθμό ευρετηρίου τους. Για να λάβετε τα στοιχεία στην τρίτη σειρά, για παράδειγμα:

DataFrame.query('4') # Καλέστε το ερώτημα στο τέταρτο ευρετήριο

30. DataFrame.where

ο που() Η συνάρτηση είναι ένα ερώτημα pandas που δέχεται μια συνθήκη για τη λήψη συγκεκριμένων τιμών σε μια στήλη. Για παράδειγμα, για να πάρετε όλες τις ηλικίες κάτω των 30 από ένα Ηλικία στήλη:

DataFrame.where (DataFrame['Age'] < 30)

Ο παραπάνω κώδικας εξάγει ένα DataFrame που περιέχει όλες τις ηλικίες κάτω των 30 ετών αλλά εκχωρεί Nan σε σειρές που δεν πληρούν την προϋπόθεση.

Χειριστείτε δεδομένα σαν επαγγελματίας με πάντα

Το pandas είναι ένας θησαυρός λειτουργιών και μεθόδων για τη διαχείριση συνόλων δεδομένων μικρής έως μεγάλης κλίμακας με την Python. Η βιβλιοθήκη είναι επίσης χρήσιμη για τον καθαρισμό, την επικύρωση και την προετοιμασία δεδομένων για ανάλυση ή μηχανική εκμάθηση.

Αφιερώνοντας χρόνο για να το κατακτήσετε σίγουρα κάνει τη ζωή σας πιο εύκολη ως επιστήμονας δεδομένων και αξίζει τον κόπο. Επομένως, μη διστάσετε να σηκώσετε όλες τις λειτουργίες που μπορείτε να χειριστείτε.

20 Λειτουργίες Python που πρέπει να γνωρίζετε

Η τυπική βιβλιοθήκη Python περιέχει πολλές λειτουργίες για να σας βοηθήσει με τις προγραμματιστικές σας εργασίες. Μάθετε για τους πιο χρήσιμους και δημιουργήστε πιο ισχυρό κώδικα.

Διαβάστε Επόμενο

ΜερίδιοΤιτίβισμαΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Σχετικά θέματα
  • Προγραμματισμός
  • Πύθων
  • Προγραμματισμός
  • βάση δεδομένων
Σχετικά με τον Συγγραφέα
Idowu Omisola (Δημοσιεύτηκαν 123 άρθρα)

Ο Idowu είναι παθιασμένος με οτιδήποτε έξυπνη τεχνολογία και παραγωγικότητα. Στον ελεύθερο χρόνο του, παίζει με την κωδικοποίηση και μεταβαίνει στη σκακιέρα όταν βαριέται, αλλά του αρέσει επίσης να ξεφεύγει από τη ρουτίνα που και που. Το πάθος του να δείχνει στους ανθρώπους τον τρόπο γύρω από τη σύγχρονη τεχνολογία τον παρακινεί να γράψει περισσότερα.

Περισσότερα από τον Idowu Omisola

Εγγραφείτε στο ενημερωτικό μας δελτίο

Εγγραφείτε στο ενημερωτικό μας δελτίο για συμβουλές τεχνολογίας, κριτικές, δωρεάν ebook και αποκλειστικές προσφορές!

Κάντε κλικ εδώ για να εγγραφείτε