Pandas Sum Column

Pandas Sum Column



'מאמר זה ידגים כיצד לסכם את כל העמודות או המסוימות ב-Pandas DataFrame באמצעות Python. הפונקציה DataFrame.sum() תשמש יחד עם כמה פרמטרים מועילים בדוגמאות הרבות של מדריך זה.'

כאשר המדריך הזה יסתיים, אולי תדע כיצד:







    • מצא את הסכום של עמודת מסגרת הנתונים בפנדות.
    • הוספת עמודות מסגרת הנתונים יחד
    • הוסף עמודות ל-Pandas Dataframe שעומדות בתנאי שצוין.
    • קבע את הסכום לאחר קיבוץ הנתונים של מסגרת הנתונים.

כיצד לקבוע את סכום עמודות מסגרות הנתונים?

הפונקציה 'dataframe.sum()' ב-Pandas מחזירה את הסכום הכולל עבור הציר שצוין. אם הקלט הוא ציר של האינדקס, הפונקציה מוסיפה את הערכים של כל עמודה בנפרד, ואז עושה את אותו הדבר עבור כל עמודה, ומחזירה סדרה המאחסנת את סכום הנתונים/ערכים בכל עמודה. בנוסף, הוא תומך בחישוב הסכום של מסגרת הנתונים על ידי התעלמות מהערכים החסרים.



תחביר: DataFrame.sum(axis = None, skipna = None, level = None, numeric_only = None, min_count = 0, **kwargs)



איפה,





צִיר: {עמודות (1), אינדקס (0)}

להזמין: התעלם מערכי NA/null בעת חישוב התוצאה.



רָמָה: אם הציר שצוין הוא היררכי (רב אינדקס), ספור לרמת אינדקס מסוימת לפני ההמרה לסדרה.

מספרי_בלבד: עמודות צפות, int ובוליאניות מקובלות. אם אין, נסה להשתמש בהכל; אם לא, רק נתונים מספריים. עבור סדרות, לא מיושם.

min_count: מספר הערכים האפשריים הנדרשים להשלמת הפעולה. התוצאה תהיה NA אם קיימים פחות ערכים שאינם NA מאשר min_count.

החזרות: DataFrame (אם הרמה צוינה) או סדרה.

דוגמה מס' 01: קבע את הסכום של עמודת Dataframe וכל העמודות

דרשנו תחילה מסגרת נתונים עם סוגי הנתונים החוקיים, כלומר, int, float וכו', עמודה או עמודות שעבורן נוכל למצוא את סכום הנתונים. מסגרת הנתונים תיווצר באמצעות הפונקציה pd.DataFrame()‎.


יצרנו את מסגרת הנתונים הנדרשת מתוך מילון פיתון בתוך הפונקציה pd.DataFrame() . במסגרת הנתונים שנוצרה לעיל, יש ארבע עמודות 'שם', 'day1', 'day2' ו-'day3'. מתוך ארבע עמודות שלוש העמודות, כלומר 'day1', 'day2' ו-'day3' הן עמודות מספריות עם ערכי הנתונים (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) ו- (7, 4, 3, 5, 6, 2, 1, 4) בהתאמה. אנחנו יכולים למצוא רק את הסכום עבור שלוש העמודות הללו. ניתן לקבוע את הסכום עבור שתי סדרות (כלומר, עמודה) ומסגרת נתונים שלמה באמצעות שיטת sum() . נתחיל מלמד כיצד לסכם את כל הנתונים בעמודת פנדה.


כדי לקבוע את הסכום, השתמשנו בשיטת sum() בעמודה 'day2'. הפונקציה החזירה את ערך הסכום של 28. בדומה לזה, אנו עשויים לקבוע את הסכום של כל עמודת Dataframe. פשוט שימוש בשיטת sum() על פני כל מסגרת הנתונים תשיג זאת.


כפי שניתן לראות, סכום העמודה 'יום1' הוא 31; עבור 'day2', ערך הסכום הוא 28, בעוד שבעמודה 'day3', ערך הסכום הוא 32.

דוגמה מס' 02: שימוש בפונקציה sum() כדי לסכם את ערכי עמודת ה-Dataframe ביחד

כפי שניתן לראות מהפלט של הדוגמה הקודמת, הפונקציה לא החזירה את נתוני עמודת מסגרת הנתונים בפועל שהרכיבו את הסכום. עם זאת, על ידי הקצאת השיטה 'DataFrame.sum()'  לעמודה DataFrame, אתה יכול לגשת לכל עמודה ב-DataFrame, כולל עמודת הסכום. ראשית, אנו יוצרים מסגרת נתונים נוספת עבור דוגמה זו.


באמצעות ה-pd.DataFrame() מסגרת הנתונים שלנו נוצרה. יצרנו את מסגרת הנתונים עם שלוש עמודות: פריט, מחיר ומס. פריט העמודה המכיל את ערכי המחרוזת ('עט', 'סמן', 'סרגל', 'מחק', 'עיפרון', 'לוח', 'מהדק', 'סיכות'), מחיר העמודה המאחסן את הערכים (20, 15, 10, 3, 5, 30, 35, 10), והעמודה 'מס' מורכבת מערכים (8, 5, 3, 3, 4, 10, 5, 2). כעת בואו נחבר את ערכי עמודת המחיר והמס ונשמור את התוצאות בעמודה חדשה על ידי שמירה על עמודות ה-dataframe המקוריות.


כפי שניתן להבחין יחד עם העמודה החדשה 'סה'כ, העמודות המקוריות של מסגרת הנתונים הנתונה מוחזרות גם הן על ידי הפונקציה. העמודה 'סה'כ מאחסנת את סכום הערכים של העמודות 'מחיר' ו'מס' מול כל נתוני 'פריט'.

דוגמה מס' 03: שימוש בפונקציה sum() כדי לקבוע את הסכום של עמודות מסגרות נתונים שצוינו

כדי לסכם את מספר העמודות של מסגרת הנתונים יחד, נוכל לציין רשימה עם תוויות העמודות ולאחר מכן להחיל את השיטה sum() ברשימה כדי למצוא את הסכום. כמו דוגמאות קודמות, תחילה ניצור את מסגרת הנתונים.


יצרנו את מסגרת הנתונים שלנו עם ארבע עמודות 'סטודנטים', 'סימנים1', 'סימנים2' ו'סימנים3'. העמודה 'סטודנטים' מאחסנת את הנתונים ('לארי', 'ג'יימס', 'רוב', 'אריה', 'מקס', 'בן', 'גוון', 'ביל'), והעמודה 'מסמנים1' מאחסנת את ערכים (8, 9, 6, 8, 10, 7, 9, 9), בעוד שהעמודות 'marks2' ו-'marks3' מאחסנות את הערכים המספריים (6, 6, 8, 6, 7, 9, 10, 9 ) ו- (7, 6, 9, 7, 8, 7, 10, 10) בהתאמה.


ראשית, יצרנו אובייקט רשימה עם תוויות העמודות 'תלמידים', 'סימנים1' ו'סימנים3'. אז שיטת sum() מוחלת על הרשימה. הפונקציה סיכמה את הערכים של עמודות marks1 ו-marks3 רק בגלל שהעמודה 'תלמידים' אינה מספרית, כך שהפונקציה sum() לא יכולה למצוא את הסכום עבור הערכים של העמודה 'תלמידים'. שמרנו את סכום הערכים של העמודות 'marks1' ו-'marks3' בעמודה 'sum'.

דוגמה מס' 04: הוסף עמודות של מסגרת נתונים של Pandas שעומדות בתנאי מוגדר

בדוגמה זו, נוסיף את הערכים של העמודות שצוינו אם הן עומדות בתנאי שצוין.


ישנן 5 עמודות במסגרת הנתונים החדשה שנוצרה, כלומר 'חברה', 'שבוע1_מכירות', 'שבוע2_מכירות', 'שבוע3_מכירות' ו'סניפים'. כעת, נניח שאיננו רוצים להוסיף את הערך של העמודה האחרונה כאשר אנו מוסיפים או מוצאים את סכום הערכים של שורות מסגרות הנתונים הנתונות. נניח שרק רצינו להוסיף את ערכי העמודות עם המילה 'שבוע' בתוויות שלהם. ניתן ליצור הבנת רשימה כדי לקבוע אם המילה 'שבוע' קיימת בתווית עמודה או לא.


כעת הבאנו את העמודות עם המילה 'שבוע' בתוויות שלהן. אנו יכולים לסכם את העמודות המכילות את המילה 'שבוע' באמצעות הארגומנט axis=1 בפונקציה sum() .


באופן זה, אנו יכולים לסכם נתונים בבטחה על פני עמודות לפי שורה מבלי לכלול עמודות שאיננו רוצים.

דוגמה מס' 5: קבע את הסכום לאחר קיבוץ הנתונים של מסגרת הנתונים

אנו יכולים גם למצוא את הסכום של עמודות מסגרות נתונים לאחר קיבוץ הנתונים של עמודה אחת או יותר. שיטת groupby() תשמש כדי לקבץ את הנתונים לקטגוריות בתוך העמודה. בואו ניצור מסגרת נתונים כדי שנוכל לקבץ את הנתונים של אחת העמודות שלה.


כעת נקבץ את הנתונים בעמודה 'גיל' ונסכם את ערכי העמודות 'score1' ו-'score2' עבור כל קטגוריה של הקבוצה.


אנו יכולים לראות שסיכום הנתונים ב-dataframe לאחר קיבוץ תחילה של ערכי הנתונים לפי גיל מביא לסכום לפי עמודה בהתאם לקבוצות הגיל.

סיכום

במדריך זה, ניסינו ללמד אותך כיצד לחשב את הסכום על פני מסגרות נתונים באמצעות שיטת Pandas sum. דנו בהוספת ערכים בשורה ובעמודה בדוגמאות של פוסט זה. בנוסף, למדת כיצד להוסיף עמודות באופן מותנה וכיצד לסכם את הערכים לאחר קיבוץ העמודה של מסגרת הנתונים. כעת ייתכן שתוכל לסכם את העמודות של מסגרת הנתונים יחד או לסכם את הערכים בתוך עמודת ה-dataframe בעצמך.