Η Python, ως γλώσσα, είναι πολύτιμη πέρα ​​από κάθε μέτρο, ειδικά όταν θέλετε να εργαστείτε με δομημένα δεδομένα. Δεδομένου ότι οι άνθρωποι αποθηκεύουν πολλά δεδομένα σε αρχεία Excel, είναι επιτακτική ανάγκη να ενοποιηθούν πολλά αρχεία για εξοικονόμηση χρόνου και προσπάθειας.

Η Python σάς επιτρέπει να κάνετε ακριβώς αυτό. ανεξάρτητα από το πόσα αρχεία Excel θέλετε να συνδυάσετε, μπορείτε να το κάνετε με σχετική ευκολία. Δεδομένου του εύρους βιβλιοθηκών και πόρων τρίτων, μπορείτε να εισάγετε και να χρησιμοποιήσετε τα πολύπλευρα εργαλεία της Python για να κάνετε τις προσφορές σας.

Σε αυτόν τον οδηγό, θα χρειαστεί να εγκαταστήσετε και να χρησιμοποιήσετε τις βιβλιοθήκες Pandas για να εισάγετε δεδομένα στην Python πριν τα ενοποιήσετε.

Εγκαταστήστε τις βιβλιοθήκες Pandas στην Python

Το Pandas είναι μια βιβλιοθήκη τρίτου μέρους που μπορείτε να εγκαταστήσετε στην Python. Ορισμένα IDE έχουν ήδη εγκατεστημένα Panda.

Εάν χρησιμοποιείτε ένα Έκδοση IDE που δεν συνοδεύεται από προεγκατεστημένα Panda, να είστε σίγουροι, μπορείτε να το εγκαταστήσετε απευθείας στην Python.

instagram viewer

Δείτε πώς να εγκαταστήσετε τα Panda:

pip install panda

Εάν χρησιμοποιείτε το Jupyter Notebook, μπορείτε να εγκαταστήσετε το Panda απευθείας με το Εντολή PIP. Κυρίως, όταν έχετε εγκαταστήσει το Jupyter με το Anaconda, υπάρχουν μεγάλες πιθανότητες να έχετε ήδη Panda διαθέσιμα για άμεση χρήση.

Εάν δεν μπορείτε να καλέσετε τα Panda, μπορείτε να χρησιμοποιήσετε την παραπάνω εντολή για να τα εγκαταστήσετε απευθείας.

Συνδυασμός αρχείων Excel με Python

Αρχικά, πρέπει να δημιουργήσετε έναν φάκελο στην τοποθεσία που προτιμάτε με όλα τα αρχεία Excel. Μόλις ο φάκελος είναι έτοιμος, μπορείτε να αρχίσετε να γράφετε τον κώδικα για την εισαγωγή των βιβλιοθηκών.

Θα χρησιμοποιήσετε δύο μεταβλητές σε αυτόν τον κώδικα:

  1. Πάντα: Η βιβλιοθήκη Pandas παρέχει τα πλαίσια δεδομένων για την αποθήκευση αρχείων Excel.
  2. ΛΣ: Η βιβλιοθήκη είναι χρήσιμη για την ανάγνωση δεδομένων από το φάκελο του μηχανήματος σας

Για να εισαγάγετε αυτές τις βιβλιοθήκες, χρησιμοποιήστε αυτές τις εντολές:

Εισαγωγή Panda ως pd
Εισαγωγή ΛΣ
  • Εισαγωγή: Σύνταξη Python που χρησιμοποιείται για την εισαγωγή των βιβλιοθηκών στην Python
  • Πάντα: Όνομα της βιβλιοθήκης
  • pd: Ψευδώνυμο που δόθηκε στη βιβλιοθήκη
  • ΛΣ: Μια βιβλιοθήκη για πρόσβαση στο φάκελο του συστήματος

Αφού εισαγάγετε τις βιβλιοθήκες, δημιουργήστε δύο μεταβλητές για να αποθηκεύσετε τη διαδρομή του αρχείου εισόδου και εξόδου. Η διαδρομή του αρχείου εισόδου είναι απαραίτητη για την πρόσβαση στο φάκελο των αρχείων. Η διαδρομή του αρχείου εξόδου είναι απαραίτητη καθώς το συνδυασμένο αρχείο θα εξαχθεί εκεί.

Εάν χρησιμοποιείτε Python, βεβαιωθείτε ότι έχετε αλλάξει την αντίστροφη κάθετο σε κάθετο προς τα εμπρός (\ προς την /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel αρχεία/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Προσάρτηση του / στο τέλος επίσης για να ολοκληρωθούν τα μονοπάτια.

Τα αρχεία του φακέλου είναι διαθέσιμα σε λίστα. Δημιουργήστε μια λίστα για να αποθηκεύσετε όλες τις αναφορές αρχείων του φακέλου εισόδου χρησιμοποιώντας το listdir λειτουργία από το OS βιβλιοθήκη.

Εάν δεν είστε βέβαιοι για τις λειτουργίες που είναι διαθέσιμες σε μια βιβλιοθήκη, μπορείτε να χρησιμοποιήσετε το σκην λειτουργία με το όνομα της βιβλιοθήκης. Για παράδειγμα, για να ελέγξετε την ακριβή έκδοση της συνάρτησης listdir, μπορείτε να χρησιμοποιήσετε την εντολή ως εξής:

σκηνοθεσία (OS)

Η έξοδος θα αποτελείται από όλες τις σχετικές λειτουργίες που είναι διαθέσιμες στη βιβλιοθήκη του λειτουργικού συστήματος. Η συνάρτηση listdir είναι μία από τις πολλές λειτουργίες που είναι διαθέσιμες σε αυτήν τη βιβλιοθήκη.

Δημιουργήστε μια νέα μεταβλητή για να αποθηκεύσετε τα αρχεία εισόδου από το φάκελο.

excel_file_list = os.listdir (input_file_path)

Εκτυπώστε αυτήν τη μεταβλητή για να δείτε τα ονόματα των αρχείων που είναι αποθηκευμένα στο φάκελο. Όλα τα αρχεία που είναι αποθηκευμένα στο φάκελο εμφανίζονται μόλις χρησιμοποιήσετε τη λειτουργία εκτύπωσης.

εκτύπωση (excel_file_list)

Στη συνέχεια, πρέπει να προσθέσετε ένα νέο πλαίσιο δεδομένων για την αποθήκευση κάθε αρχείου Excel. Φανταστείτε ένα πλαίσιο δεδομένων ως κοντέινερ για την αποθήκευση δεδομένων. Εδώ είναι η εντολή για τη δημιουργία ενός πλαισίου δεδομένων.

df = πδ. Πλαίσιο δεδομένων()
  • df: Μεταβλητή για την αποθήκευση της τιμής του DataFrame
  • pd: Ψευδώνυμο για το Βιβλιοθήκη Pandas
  • Πλαίσιο δεδομένων: Προεπιλεγμένη σύνταξη για την προσθήκη πλαισίου δεδομένων

Ο φάκελος εισαγωγής έχει τρεις .xlsx αρχεία σε αυτό το παράδειγμα. Τα ονόματα των αρχείων είναι:

File1_excel.xlsx
File2_excel.xlsx
File3_excel.xlsx

Για να ανοίξετε κάθε αρχείο από αυτόν τον φάκελο, πρέπει να εκτελέσετε έναν βρόχο. Ο βρόχος θα εκτελεστεί για καθένα από τα αρχεία στη λίστα που δημιουργήθηκε παραπάνω.

Δείτε πώς μπορείτε να το κάνετε:

για excel_files στο excel_file_list:

Στη συνέχεια, είναι απαραίτητο να ελέγξετε τις επεκτάσεις των αρχείων, καθώς ο κώδικας θα ανοίγει μόνο αρχεία XLSX. Για να ελέγξετε αυτά τα αρχεία, μπορείτε να χρησιμοποιήσετε ένα Αν δήλωση.

Χρησιμοποιήστε το τελειώνει με λειτουργούν για το σκοπό αυτό, ως εξής:

για excel_files στο excel_file_list:

εάν excel_files.endswith(.xlsx"):

  • excel_files: Λίστα με όλες τις τιμές του αρχείου
  • τελειώνει με: Λειτουργία ελέγχου της επέκτασης των αρχείων
  • (".xlsx"): Αυτή η τιμή συμβολοσειράς μπορεί να αλλάξει, ανάλογα με το τι θέλετε να αναζητήσετε

Τώρα που έχετε αναγνωρίσει τα αρχεία Excel, μπορείτε να δημιουργήσετε ένα νέο πλαίσιο δεδομένων για να διαβάσετε και να αποθηκεύσετε τα αρχεία μεμονωμένα.

για excel_files στο excel_file_list:

εάν excel_files.endswith(.xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)

  • df1: Νέο πλαίσιο δεδομένων
  • pd: Βιβλιοθήκη Pandas
  • read_excel: Λειτουργία ανάγνωσης αρχείων Excel στη βιβλιοθήκη Pandas
  • input_file_path: Διαδρομή του φακέλου όπου είναι αποθηκευμένα τα αρχεία
  • excel_files: Οποιαδήποτε μεταβλητή που χρησιμοποιείται στον βρόχο for

Για να ξεκινήσετε την προσάρτηση των αρχείων, πρέπει να χρησιμοποιήσετε το προσαρτώ λειτουργία.

για excel_files στο excel_file_list:

εάν excel_files.endswith(.xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)
df = df.append (df1)

Τέλος, τώρα που το ενοποιημένο πλαίσιο δεδομένων είναι έτοιμο, μπορείτε να το εξαγάγετε στη θέση εξόδου. Σε αυτήν την περίπτωση, εξάγετε το πλαίσιο δεδομένων σε ένα αρχείο XLSX.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Πλαίσιο δεδομένων για εξαγωγή
  • αριστεύω: Εντολή που χρησιμοποιείται για την εξαγωγή των δεδομένων
  • output_file_path: Καθορισμένη διαδρομή για την αποθήκευση της εξόδου
  • Consolidated_file.xlsx: Όνομα του συγκεντρωτικού αρχείου

Τώρα, ας δούμε τον τελικό κώδικα:

Το #Pandas χρησιμοποιείται ως πλαίσιο δεδομένων για το χειρισμό αρχείων Excel
εισαγωγή panda ως pd
εισαγωγή os

# αλλάξτε την κάθετο από "\" σε "/", εάν χρησιμοποιείτε συσκευές Windows

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel αρχεία/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

#create a list για να αποθηκεύσετε όλες τις αναφορές αρχείων του φακέλου εισόδου χρησιμοποιώντας τη συνάρτηση listdir από τη βιβλιοθήκη του λειτουργικού συστήματος.
#Για να δείτε τα περιεχόμενα μιας βιβλιοθήκης (όπως η συνάρτηση listdir, μπορείτε να χρησιμοποιήσετε τη συνάρτηση dir στο όνομα της βιβλιοθήκης).
#Χρησιμοποιήστε το dir (library_name) για τη λίστα περιεχομένων

excel_file_list = os.listdir (input_file_path)

#print όλα τα αρχεία που είναι αποθηκευμένα στο φάκελο, αφού ορίσετε τη λίστα
excel_file_list

#Μόλις ανοίξει κάθε αρχείο, χρησιμοποιήστε τη συνάρτηση προσάρτησης για να ξεκινήσετε την ενοποίηση των δεδομένων που είναι αποθηκευμένα σε πολλά αρχεία

#create ένα νέο, κενό πλαίσιο δεδομένων, για να χειριστείτε τις εισαγωγές αρχείων excel
df = πδ. Πλαίσιο δεδομένων()

#Εκτελέστε έναν βρόχο for για να περιηγηθείτε σε κάθε αρχείο της λίστας
για excel_files στο excel_file_list:
#check για αρχεία επιθήματος .xlsx μόνο
εάν excel_files.endswith(.xlsx"):
#create a new dataframe για την ανάγνωση/άνοιγμα κάθε αρχείου Excel από τη λίστα των αρχείων που δημιουργήθηκαν παραπάνω
df1 = pd.read_excel (input_file_path+excel_files)
#append κάθε αρχείο στο αρχικό κενό πλαίσιο δεδομένων
df = df.append (df1)

#transfer τελικό αποτέλεσμα σε ένα αρχείο Excel (xlsx) στη διαδρομή εξόδου
df.to_excel (output_file_path+"Consolidated_file.xlsx")

Χρήση Python για συνδυασμό πολλών βιβλίων εργασίας του Excel

Το Python's Pandas είναι ένα εξαιρετικό εργαλείο για αρχάριους και προχωρημένους χρήστες. Η βιβλιοθήκη χρησιμοποιείται εκτενώς από προγραμματιστές που θέλουν να κυριαρχήσουν στην Python.

Ακόμα κι αν είστε αρχάριος, μπορείτε να επωφεληθείτε πάρα πολύ μαθαίνοντας τις αποχρώσεις των Pandas και πώς χρησιμοποιείται η βιβλιοθήκη στην Python.

6 Επιχειρήσεις Pandas για Αρχάριους

Απολαύστε τα Pandas με αυτές τις δραστηριότητες για αρχάριους.

Διαβάστε Επόμενο

ΜερίδιοΤιτίβισμαΗΛΕΚΤΡΟΝΙΚΗ ΔΙΕΥΘΥΝΣΗ
Σχετικά θέματα
  • Προγραμματισμός
  • Πύθων
  • Microsoft Excel
  • Υπολογιστικό φύλλο
Σχετικά με τον Συγγραφέα
Gaurav Siyal (Δημοσιεύτηκαν 59 άρθρα)

Ο Gaurav Siyal έχει δύο χρόνια συγγραφικής εμπειρίας, γράφοντας για μια σειρά από εταιρείες ψηφιακού μάρκετινγκ και έγγραφα κύκλου ζωής λογισμικού.

Περισσότερα από τον Gaurav Siyal

Εγγραφείτε στο ενημερωτικό μας δελτίο

Εγγραφείτε στο ενημερωτικό μας δελτίο για συμβουλές τεχνολογίας, κριτικές, δωρεάν ebook και αποκλειστικές προσφορές!

Κάντε κλικ εδώ για να εγγραφείτε