שימוש ב-Pandas.DataFrame.Append
הפונקציה pandas.DataFrame.append() משמשת להוספת השורות של DataFrame אחר ל-DataFrame הקיים. אם העמודות ב-DataFrame הקיים אינן קיימות, עמודות ה-DataFrame האחרות נוצרות ב-DataFrame הקיים. השתמש בפונקציה זו בצורה כזו שיש להכניס את השורה ל-DataFrame על ידי הוספת המילון.
תחביר :
להלן התחביר בפועל של הפונקציה pandas.DataFrame.append() :
פנדות. DataFrame . לְצַרֵף ( אַחֵר , ignore_index , verify_integrity , סוג )
- אַחֵר : זה מתייחס ל-DataFrame אחר שבו השורות של DataFrame זה מצורפות ל-DataFrame הקיים. אם ברצונך להוסיף שורה בודדת, עליך להעביר מילון ערכים כפרמטר.
- ignore_index (כברירת מחדל = False): פרמטר זה משמש כאשר אתה מוסיף שורות ל-DataFrame שכבר יש לו שורות. אם הוא 'שקר', מדדי השורות הקיימים יצורפו גם הם. אם הוא 'True', השורות מסומנות מ-0 עד n-1. ודא שהפרמטר הזה מוגדר ל-'True' בזמן הוספת מילון ל-DataFrame. אחרת, מועלה סוג שגיאה - 'TypeError: יכול להוסיף dict רק אם ignore_index=True'.
- אנו יכולים לבדוק את המדדים הכפולים באמצעות הפרמטר verify_integrity (כברירת מחדל = False). אם המדדים משוכפלים וה-verify_integrity מוגדר ל-'True', הוא מחזיר את ה-'ValueError: לאינדקס יש ערכים חופפים'.
- אפשר למיין את העמודות אם העמודות של ה-DataFrame הקיים ושל DataFrame אחר אינן מיושרות באמצעות פרמטר המיון על-ידי הגדרתו ל-'True' (כברירת מחדל = False).
דוגמה 1: הוסף מילון יחיד
צור Pandas DataFrame עם ארבע עמודות - 'Campaign_Name', 'Location', 'StartDate' ו-'Budget' - ושלוש שורות. הוסף מילון ל-DataFrame זה.
יְבוּא פנדות
# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )
# הוסף שורה בודדת
קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה טכני' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '05/12/2023' , 'תַקצִיב' : 2000 } , ignore_index = נָכוֹן )
הדפס ( קמפיין , ' \n ' )
תְפוּקָה :
אנו יכולים לראות שהמילון מצורף ל-'Campaign' DataFrame. האינדקס של שורה חדשה זו הוא 3 מכיוון שמתעלמים מהאינדקס.
דוגמה 2: הוסף מילונים מרובים
השתמש באותו DataFrame שנוצר תחת דוגמה 1 והוסף שלוש שורות בכל פעם באמצעות הפונקציה pandas.DataFrame.append(). הגדר את הפרמטר ignore_index ל-'True'.
יְבוּא פנדות# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )
קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה טכני' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '05/12/2023' , 'תַקצִיב' : 2000 } , ignore_index = נָכוֹן )
קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה שיווק' , 'מקום' : 'הוֹדוּ' , 'תאריך התחלה' : '23/06/2023' , 'תַקצִיב' : 9000 } , ignore_index = נָכוֹן )
קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה מכירה' , 'מקום' : 'אִיטַלִיָה' , 'תאריך התחלה' : '24/01/2023' , 'תַקצִיב' : 1200 } , ignore_index = נָכוֹן )
הדפס ( קמפיין )
תְפוּקָה :
שלוש שורות מצורפות בזו אחר זו עם 3, 4 ו-5 מדדים ל-DataFrame הקיים.
שימוש ב-Pandas.Concat
הפונקציה pandas.concat() משרשרת שתיים או יותר DataFrames לאורך השורות או העמודות. אז, אנחנו צריכים להפוך את המילון ל-DataFrame ולהעביר שני DataFrames לפונקציה הזו.
תחביר :
הוסף מילון ל-DataFrame הקיים:
פנדות. קוצר ( [ Existing_DataFrame , Transformed_Dictionary ] , צִיר = 0 , ignore_index , verify_integrity )- אם ציר = 0, השרשור מתבצע לאורך השורות. השרשור נעשה לאורך העמודות אם הוא מוגדר. הוחל באותיות רישיות כיוון שזוהי כותרת משנה. נוסף מאמר הכרחי לקיצור.ל-1.
- ה- ignore_index (כברירת מחדל = False): פרמטר זה משמש כאשר אתה מוסיף את השורות ל-DataFrame שכבר יש לו שורות. אם הוא 'שקר', מדדי השורות הקיימים יצורפו גם הם. אם הוא 'True', השורות מסומנות מ-0 עד n-1.
- אנו יכולים לבדוק את המדדים הכפולים באמצעות הפרמטר verify_integrity (כברירת מחדל = False). אם המדדים משוכפלים וה-verify_integrity מוגדר ל-'True', הוא מחזיר את ה-'ValueError: לאינדקס יש ערכים חופפים'.
דוגמה 1: הוסף מילון יחיד
צור Pandas DataFrame עם ארבע עמודות - 'Campaign_Name', 'Location', 'StartDate' ו-'Budget' - ושלוש שורות. באמצעות הפונקציה pandas.concat(), הוסף מילון אחד (DataFrame) כשורה ל-DataFrame זה.
יְבוּא פנדות# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )
dictionary_from_DataFrame = פנדות. DataFrame ( [ { 'Campaign_Name' : 'מחנה שירות' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '04/17/2023' , 'תַקצִיב' : 1000 } ] )
# הוסף שורה בודדת
קמפיין = פנדות. קוצר ( [ קמפיין , dictionary_from_DataFrame ] , צִיר = 0 )
הדפס ( קמפיין , ' \n ' )
תְפוּקָה :
אנו יכולים לראות שהמילון מצורף ל-'Campaign' DataFrame. האינדקס של שורה חדשה זו הוא 0 מכיוון שלא מתעלמים מהאינדקס.
דוגמה 2: הוסף מילונים מרובים
השתמש ב-DataFrame הקודם וצרף שלושה מילונים (DataFrame) על ידי התעלמות מהאינדקס.
יְבוּא פנדות# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )
dictionary_from_DataFrame = פנדות. DataFrame ( [ { 'Campaign_Name' : 'מחנה טכנולוגי' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '05/17/2023' , 'תַקצִיב' : 1000 } ,
{ 'Campaign_Name' : 'שירותי רווחה' , 'מקום' : 'יפן' , 'תאריך התחלה' : '04/17/2023' , 'תַקצִיב' : 200 } ,
{ 'Campaign_Name' : 'מחנה מכירות' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '04/18/2023' , 'תַקצִיב' : 500 } ] )
# הוסף שורות מרובות
קמפיין = פנדות. קוצר ( [ קמפיין , dictionary_from_DataFrame ] , צִיר = 0 , ignore_index = נָכוֹן )
הדפס ( קמפיין , ' \n ' )
תְפוּקָה :
אנו יכולים לראות ששלושה מילונים מצורפים ל-'Campaign' DataFrame. המדדים של מילונים אלה הם 3, 4 ו-5 מאחר שהפרמטר ignore_index מוגדר ל-'False'.
סיכום
המילונים הבודדים/המרובים מצורפים ל-DataFrame באמצעות הפונקציות pandas.DataFrame.append() ו- pandas.concat(). המדדים של השורות החדשות יכולים להיות ייחודיים על ידי הגדרת הפרמטר ignore_index ל-'True' בפונקציה pandas.concat() . בזמן השימוש בפונקציה pandas.DataFrame.append(), הגדר את הפרמטר ignore_index ל-'True'. אחרת, TypeError מועלה.