הוסף Dict ל-DataFrame ב-Pandas

Hwsp Dict L Dataframe B Pandas



נדון כיצד להוסיף מילון ל-Pandas DataFrame הקיים באמצעות הפונקציות pandas.DataFrame.append() ו- pandas.concat() עם דוגמאות. כאן, המילון מתייחס לזוג key:value כך שהמפתח מתייחס לתוויות העמודות הקיימות ב-DataFrame והערכים מתווספים בשורה. כמו כן, נראה את הדוגמאות המצרפות מילונים מרובים ל-Pandas DataFrame.

שימוש ב-Pandas.DataFrame.Append

הפונקציה pandas.DataFrame.append() משמשת להוספת השורות של DataFrame אחר ל-DataFrame הקיים. אם העמודות ב-DataFrame הקיים אינן קיימות, עמודות ה-DataFrame האחרות נוצרות ב-DataFrame הקיים. השתמש בפונקציה זו בצורה כזו שיש להכניס את השורה ל-DataFrame על ידי הוספת המילון.

תחביר :







להלן התחביר בפועל של הפונקציה pandas.DataFrame.append() :



פנדות. DataFrame . לְצַרֵף ( אַחֵר , ignore_index , verify_integrity , סוג )
  1. אַחֵר : זה מתייחס ל-DataFrame אחר שבו השורות של DataFrame זה מצורפות ל-DataFrame הקיים. אם ברצונך להוסיף שורה בודדת, עליך להעביר מילון ערכים כפרמטר.
  2. ignore_index (כברירת מחדל = False): פרמטר זה משמש כאשר אתה מוסיף שורות ל-DataFrame שכבר יש לו שורות. אם הוא 'שקר', מדדי השורות הקיימים יצורפו גם הם. אם הוא 'True', השורות מסומנות מ-0 עד n-1. ודא שהפרמטר הזה מוגדר ל-'True' בזמן הוספת מילון ל-DataFrame. אחרת, מועלה סוג שגיאה - 'TypeError: יכול להוסיף dict רק אם ignore_index=True'.
  3. אנו יכולים לבדוק את המדדים הכפולים באמצעות הפרמטר verify_integrity (כברירת מחדל = False). אם המדדים משוכפלים וה-verify_integrity מוגדר ל-'True', הוא מחזיר את ה-'ValueError: לאינדקס יש ערכים חופפים'.
  4. אפשר למיין את העמודות אם העמודות של ה-DataFrame הקיים ושל DataFrame אחר אינן מיושרות באמצעות פרמטר המיון על-ידי הגדרתו ל-'True' (כברירת מחדל = False).

דוגמה 1: הוסף מילון יחיד

צור Pandas DataFrame עם ארבע עמודות - 'Campaign_Name', 'Location', 'StartDate' ו-'Budget' - ושלוש שורות. הוסף מילון ל-DataFrame זה.



יְבוּא פנדות

# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )

# הוסף שורה בודדת
קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה טכני' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '05/12/2023' , 'תַקצִיב' : 2000 } , ignore_index = נָכוֹן )
הדפס ( קמפיין , ' \n ' )

תְפוּקָה :





אנו יכולים לראות שהמילון מצורף ל-'Campaign' DataFrame. האינדקס של שורה חדשה זו הוא 3 מכיוון שמתעלמים מהאינדקס.



דוגמה 2: הוסף מילונים מרובים

השתמש באותו DataFrame שנוצר תחת דוגמה 1 והוסף שלוש שורות בכל פעם באמצעות הפונקציה pandas.DataFrame.append(). הגדר את הפרמטר ignore_index ל-'True'.

יְבוּא פנדות

# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )

קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה טכני' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '05/12/2023' , 'תַקצִיב' : 2000 } , ignore_index = נָכוֹן )
קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה שיווק' , 'מקום' : 'הוֹדוּ' , 'תאריך התחלה' : '23/06/2023' , 'תַקצִיב' : 9000 } , ignore_index = נָכוֹן )
קמפיין = קמפיין. לְצַרֵף ( { 'Campaign_Name' : 'מחנה מכירה' , 'מקום' : 'אִיטַלִיָה' , 'תאריך התחלה' : '24/01/2023' , 'תַקצִיב' : 1200 } , ignore_index = נָכוֹן )
הדפס ( קמפיין )

תְפוּקָה :

שלוש שורות מצורפות בזו אחר זו עם 3, 4 ו-5 מדדים ל-DataFrame הקיים.

שימוש ב-Pandas.Concat

הפונקציה pandas.concat() משרשרת שתיים או יותר DataFrames לאורך השורות או העמודות. אז, אנחנו צריכים להפוך את המילון ל-DataFrame ולהעביר שני DataFrames לפונקציה הזו.

תחביר :

הוסף מילון ל-DataFrame הקיים:

פנדות. קוצר ( [ Existing_DataFrame , Transformed_Dictionary ] , צִיר = 0 , ignore_index , verify_integrity )
  1. אם ציר = 0, השרשור מתבצע לאורך השורות. השרשור נעשה לאורך העמודות אם הוא מוגדר. הוחל באותיות רישיות כיוון שזוהי כותרת משנה. נוסף מאמר הכרחי לקיצור.ל-1.
  2. ה- ignore_index (כברירת מחדל = False): פרמטר זה משמש כאשר אתה מוסיף את השורות ל-DataFrame שכבר יש לו שורות. אם הוא 'שקר', מדדי השורות הקיימים יצורפו גם הם. אם הוא 'True', השורות מסומנות מ-0 עד n-1.
  3. אנו יכולים לבדוק את המדדים הכפולים באמצעות הפרמטר verify_integrity (כברירת מחדל = False). אם המדדים משוכפלים וה-verify_integrity מוגדר ל-'True', הוא מחזיר את ה-'ValueError: לאינדקס יש ערכים חופפים'.

דוגמה 1: הוסף מילון יחיד

צור Pandas DataFrame עם ארבע עמודות - 'Campaign_Name', 'Location', 'StartDate' ו-'Budget' - ושלוש שורות. באמצעות הפונקציה pandas.concat(), הוסף מילון אחד (DataFrame) כשורה ל-DataFrame זה.

יְבוּא פנדות


# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )

dictionary_from_DataFrame = פנדות. DataFrame ( [ { 'Campaign_Name' : 'מחנה שירות' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '04/17/2023' , 'תַקצִיב' : 1000 } ] )

# הוסף שורה בודדת
קמפיין = פנדות. קוצר ( [ קמפיין , dictionary_from_DataFrame ] , צִיר = 0 )
הדפס ( קמפיין , ' \n ' )

תְפוּקָה :

אנו יכולים לראות שהמילון מצורף ל-'Campaign' DataFrame. האינדקס של שורה חדשה זו הוא 0 מכיוון שלא מתעלמים מהאינדקס.

דוגמה 2: הוסף מילונים מרובים

השתמש ב-DataFrame הקודם וצרף שלושה מילונים (DataFrame) על ידי התעלמות מהאינדקס.

יְבוּא פנדות


# צור DataFrame - מסע פרסום עם 4 עמודות ו-3 שורות
קמפיין = פנדות. DataFrame ( [ [ 'מחנה שיווק' , 'הוֹדוּ' , '01/12/2023' , 8000 ] ,
[ 'מחנה מכירות' , 'אִיטַלִיָה' , '25/01/2022' , 10000 ] ,
[ 'מחנה אחר' , 'ארה'ב' , '04/17/2023' , 2000 ] ] ,
עמודות = [ 'Campaign_Name' , 'מקום' , 'תאריך התחלה' , 'תַקצִיב' ] )
הדפס ( קמפיין , ' \n ' )

dictionary_from_DataFrame = פנדות. DataFrame ( [ { 'Campaign_Name' : 'מחנה טכנולוגי' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '05/17/2023' , 'תַקצִיב' : 1000 } ,
{ 'Campaign_Name' : 'שירותי רווחה' , 'מקום' : 'יפן' , 'תאריך התחלה' : '04/17/2023' , 'תַקצִיב' : 200 } ,
{ 'Campaign_Name' : 'מחנה מכירות' , 'מקום' : 'ארה'ב' , 'תאריך התחלה' : '04/18/2023' , 'תַקצִיב' : 500 } ] )

# הוסף שורות מרובות
קמפיין = פנדות. קוצר ( [ קמפיין , dictionary_from_DataFrame ] , צִיר = 0 , ignore_index = נָכוֹן )
הדפס ( קמפיין , ' \n ' )

תְפוּקָה :

אנו יכולים לראות ששלושה מילונים מצורפים ל-'Campaign' DataFrame. המדדים של מילונים אלה הם 3, 4 ו-5 מאחר שהפרמטר ignore_index מוגדר ל-'False'.

סיכום

המילונים הבודדים/המרובים מצורפים ל-DataFrame באמצעות הפונקציות pandas.DataFrame.append() ו- pandas.concat(). המדדים של השורות החדשות יכולים להיות ייחודיים על ידי הגדרת הפרמטר ignore_index ל-'True' בפונקציה pandas.concat() . בזמן השימוש בפונקציה pandas.DataFrame.append(), הגדר את הפרמטר ignore_index ל-'True'. אחרת, TypeError מועלה.