כיצד לקרוא קובץ אקסל (xlsx) בפייתון

How Read Excel File Python



ה .xlsx הוא הרחבה של מסמך האקסל שיכול לאחסן כמות גדולה של נתונים בצורה טבלאית, וניתן לבצע סוגים רבים של חישוב אריתמטי והגיוני בקלות בגיליון אלקטרוני של אקסל. לפעמים נדרש לקרוא את הנתונים ממסמך האקסל באמצעות סקריפט פייתון לצורכי תכנות. מודולים רבים קיימים ב- Python לקריאת מסמך האקסל. חלק מהמודולים השימושיים הם xlrd , openpyxl , ו פנדות . הדרכים לשימוש במודולים אלה לקריאת קובץ האקסל ב- Python הוצגו במדריך זה.

תְנַאִי מוּקדָם:

יידרש קובץ אקסל דמה עם סיומת .xlsx בכדי לבדוק את הדוגמאות של הדרכה זו. אתה יכול להשתמש בכל קובץ אקסל קיים או ליצור קובץ חדש. הנה, קובץ אקסל חדש בשם sales.xlsx הקובץ נוצר עם הנתונים הבאים. קובץ זה שימש לקריאה באמצעות מודולי פייתון שונים בחלק הבא של מדריך זה.







sales.xlsx



תאריך מכירה איש מכירות כמות
05/12/18 סילה אחמד 60000
12/06/19 אני חוסיין 50,000
08/09/20 סרמין ג'האן 45000
04/07/21 מחמודול חסן 30000

דוגמה 1: קרא קובץ אקסל באמצעות xlrd

המודול xlrd אינו מותקן עם Python כברירת מחדל. לכן, עליך להתקין את המודול לפני השימוש בו. הגרסה העדכנית ביותר של מודול זה אינה תומכת בקובץ האקסל עם הסיומת .xlsx. לכן, עליך להתקין את גירסת 1.2.0 של מודול זה כדי לקרוא את קובץ xlsx. הפעל את הפקודה הבאה מהמסוף כדי להתקין את הגירסה הנדרשת של xlrd .



$צִפצוּףלהתקין xlrd== 1.2.0

לאחר השלמת תהליך ההתקנה, צור קובץ פייתון עם הסקריפט הבא לקריאת sales.xlsx קובץ באמצעות ה xlrd מודול. ספר עבודה פתוח () הפונקציה משמשת בתסריט פתח את קובץ xlsx לקריאה. קובץ אקסל זה מכיל גיליון אחד בלבד. אז ה workbook.sheet_by_index () הפונקציה שימשה בתסריט עם ערך הארגומנט 0. לאחר מכן, המקונן 'ל' לולאה שימשה לקרוא את ערכי התא של גליון העבודה באמצעות ערכי השורה והעמודה. שתי פונקציות טווח () שימשו בתסריט כדי להגדיר את גודל השורה והעמודה בהתבסס על נתוני הגיליון. ה cell_value () פונקציה שימשה לקרוא את ערך התא המסוים של הגיליון בכל איטרציה של הלולאה. כל שדה בפלט יופרד ברווח כרטיסייה אחד.





# ייבא את המודול xlrd
יבוא xlrd

# פתח את חוברת העבודה
חוברת עבודה = xlrd.open_workbook('sales.xlsx')

# פתח את דף העבודה
גליון עבודה = workbook.sheet_by_index(0)

# חזור על השורות והעמודות
לאניבטווח(0,5):
ליבטווח(0,3):
# הדפס את ערכי התא עם שטח הכרטיסייה
הדפס(workheet.cell_value(אני, י),סוֹף='לא')
הדפס('')

תְפוּקָה:

הפלט הבא יופיע לאחר ביצוע התסריט לעיל.



דוגמה 2: קרא קובץ אקסל באמצעות openpyxl

ה openpyxl הוא מודול פייתון אחר לקריאת קובץ xlsx, והוא גם אינו מותקן עם Python כברירת מחדל. הפעל את הפקודה הבאה מהמסוף כדי להתקין מודול זה לפני השימוש בו.

$צִפצוּףלהתקיןopenpyxl

לאחר השלמת תהליך ההתקנה, צור קובץ פייתון עם הסקריפט הבא לקריאת sales.xlsx קוֹבֶץ. כמו המודול xlrd, ה- openpyxl המודול כולל את load_workbook () פונקציה לפתיחת קובץ xlsx לקריאה. ה sales.xlsx קובץ משמש כערך הארגומנט של פונקציה זו. מושא ה wookbook.active נוצר בתסריט כדי לקרוא את הערכים של max_row וה max_column נכסים. מאפיינים אלה שימשו בלולאות המקוננות כדי לקרוא את התוכן של sales.xlsx קוֹבֶץ. הפונקציה range () שימשה לקריאת שורות הגיליון, והפונקציה iter_cols () שימשה לקריאת העמודות של הגיליון. כל שדה בפלט יופרד על ידי שני רווחי כרטיסיות.

# ייבא מודול openyxl
ייבא openpyxl

# הגדר משתנה לטעינת ה- wookbook
wookbook = openpyxl.load_workbook('sales.xlsx')

# הגדר משתנה לקריאת הגיליון הפעיל:
גליון עבודה = wookbook.active

# חזור על הלולאה כדי לקרוא את ערכי התא
לאניבטווח(0, גליון עבודה):
ל עם ה בגליון עבודה .iter_cols(1, גליון עבודה.מקס_עמודה):
הדפס(עם ה[אני].ערך,סוֹף=' t t')
הדפס('')

תְפוּקָה:

הפלט הבא יופיע לאחר ביצוע התסריט לעיל.

דוגמה 3: קרא קובץ אקסל באמצעות פנדות

מודול הפנדה אינו מותקן במודול הקודם דמוי פייתון. לכן, אם לא התקנת אותו קודם לכן, עליך להתקין אותו. הפעל את הפקודה הבאה כדי להתקין את פנדות מהטרמינל.

$צִפצוּףלהתקיןפנדות

לאחר השלמת תהליך ההתקנה, צור קובץ פייתון עם הסקריפט הבא לקריאת sales.xlsx קוֹבֶץ. ה read_excel () הפונקציה של פנדה משמשת לקריאת קובץ xlsx. פונקציה זו השתמשה בתסריט כדי לקרוא את sales.xlsx קוֹבֶץ. ה DataFrame () פונקציה השתמשה כאן לקריאת התוכן של קובץ xlsx במסגרת הנתונים ושמירת הערכים במשתנה בשם נתונים . ערך הנתונים הודפס מאוחר יותר.

# ייבא פנדות
לייבא פנדותכפי שpd

# טען את קובץ xlsx
excel_data = pd.read_excel('sales.xlsx')
# קרא את ערכי הקובץ במסגרת הנתונים
data = pd.DataFrame(excel_data,עמודות=['תאריך מכירה','איש מכירות','כמות'])
# הדפס את התוכן
הדפס('תוכן הקובץ הוא: n', נתונים)

תְפוּקָה:

הפלט הבא יופיע לאחר ביצוע התסריט לעיל. הפלט של סקריפט זה שונה משתי הדוגמאות הקודמות. מספרי השורות מודפסים בעמודה הראשונה, שם ערך השורה נספר מ 0. ערכי התאריך מיושרים במרכז. שמות אנשי המכירות מיושרים נכון. הסכום מיושר לשמאל.

סיכום:

משתמשי הפיתון צריכים לעבוד עם קבצי xlsx למטרות תכנות שונות. שלוש דרכים שונות לקריאת קובץ xlsx הוצגו במדריך זה באמצעות שלושה מודולי פייתון. לכל מודול יש פונקציות ומאפיינים שונים לקריאת קובץ ה- xlsx. הדרכה זו תעזור למשתמשי פיתון לקרוא את קובץ ה- xlsx בקלות באמצעות סקריפט הפיתון לאחר קריאת הדרכה זו.