פנדות למילון

Pndwt Lmylwn



'ב-Python, מבנה נתונים הנקרא מילון משמש לאחסון מידע כזוגות מפתח-ערך. אובייקטי מילון מותאמים לחילוץ נתונים/ערכים כאשר המפתח או המפתחות ידועים. זכור כי מילונים עשויים לכלול מפתחות כפולים. כדי למצוא ביעילות ערכים באמצעות האינדקס הקשור, אנו יכולים להמיר סדרת פנדות או מסגרת נתונים עם אינדקס רלוונטי לאובייקט מילון עם צמדי מפתח-ערך של 'index: value'. כדי להשיג משימה זו, ניתן להשתמש בשיטת 'to_dict()'. פונקציה זו היא פונקציה מובנית שנמצאת במחלקה Series של מודול הפנדות. מסגרת נתונים מומרת למילון נתונים דמוי רשימת פיתון של סדרות באמצעות שיטת pandas.to_dict(), בהתאם לערך שצוין של הפרמטר orient.'

כיצד להמיר פנדות למילון פייתון?

ישנן מספר שיטות להמיר פנדות למילון. עם זאת, כדי להפוך מסגרת נתונים של Pandas למילון Python, נשתמש בשיטת to_dict() ב- Pandas. אנו יכולים לכוון את צמדי המפתח-ערך של המילון המוחזר במגוון דרכים באמצעות הפונקציה to_dict() . התחביר של הפונקציה הוא כדלקמן:







תחביר



pandas.to_dict ( מזרח = 'dict', לְתוֹך = )



פרמטרים

מִזְרָח: לאיזה סוג נתונים להמיר עמודות (סדרה) מצוין ערך המחרוזת ('dict', 'list', 'records', 'index', 'series', 'split'). לדוגמה, מילת המפתח 'רשימה' תיתן מילון פיתון של אובייקטי רשימה עם המפתחות 'שם עמודה' ו'רשימה' (סדרה המרה) כפלט.





לְתוֹך: מחלקה, ניתן להעביר כמופע או מחלקה ממשית. לדוגמה, ניתן להעביר מופע מחלקה במקרה של דיקט ברירת מחדל. ערך ברירת המחדל של הפרמטר הוא dict.

סוג החזרה: מילון הומר ממסגרת נתונים או סדרה.



דוגמה מס' 01: המרת מסגרת הנתונים של Pandas למילון

באמצעות טופלת הרשימות בפונקציה pd.DataFrame(), ניצור מסגרת נתונים בסיסית עם כמה עמודות ושורות כדי שנוכל להמיר אותה מאוחר יותר למילון פיתון.


יצרנו את מסגרת הנתונים שלנו על ידי העברת הרשימה בתוך הפונקציה pd.DataFrame() . במסגרת הנתונים לעיל, יש לנו שלוש עמודות 'חברה', 'מכירות' ו'הכנסה'. בחברת העמודות שמרנו את השמות של חברות אקראיות כ-('A&B', 'Max_tech', 'XT', 'MJ', 'Quanto', 'Mini_X', 'Zomo', 'AU', 'HL' , 'ZMX', 'Earny'), העמודה 'מכירות' מייצגת את המכירות של כל חברה בתור ('217', '200', '199', '150', '210', '216', '185 ', '189', '202', '159', '205'), והעמודה 'הכנסה' מאחסנת את הערכים המייצגים את ההכנסה של כל חברה מול המכירות המתאימות (340000   320000  300000 270000  315000  335 000 4 0 0 0 0 0 0 0 4 305000). כעת נמיר את מסגרת הנתונים שלנו 'df' למילון פיתון.


על ידי החלת השיטה to_dict() על מסגרת הנתונים של df, המרנו מסגרת נתונים של פנדה למילון.

דוגמה מס' 02: המרת מסגרת הנתונים של Pandas שנוצרה מקובץ CSV למילון

בדוגמה מס' 1, יצרנו מסגרת נתונים באמצעות tuples בתוך הרשימה. כעת ניצור מסגרת נתונים בעזרת קובץ CSV, ולאחר מכן נמיר אותה למילון באמצעות הפונקציה to_dict() .


כדי לקרוא קובץ כ-dataframe, השתמשנו בפונקציה pd.read_csv()‎. במסגרת הנתונים שלמעלה, יש לנו שתי עמודות (שם וסימנים) ושבע-עשרה שורות (מ-0 עד 16). כעת נשתמש בשיטה to_dict().


הפונקציה המירה את מסגרת הנתונים שלנו 'df' למילון פיתון.

דוגמה מס' 03: המרת מסגרת נתונים של Pandas למילון המכיל את רשימות הערכים

בדוגמאות הקודמות, המרנו את הפנדות למילון פיתון המכיל מילונים מרובים. בעת המרת מסגרת נתונים לאובייקט מילון, תוויות העמודות צריכות לשמש כמפתחות המילון, ויש להוסיף את כל הנתונים או הערכים של העמודות למילון המתקבל כרשימת ערכים עבור כל מפתח.


יצרנו את מסגרת הנתונים הכוללת שלוש עמודות 'שם', 'מדינה' ו'גיל'. בעמודה 'שם', אחסנו את ערכי הנתונים ('אנה', 'מרטי', 'קרל', 'מרי', 'קלב', 'עלי', 'אלכסה', 'בקי', 'ריאן'). . בעוד שהעמודות האחרות מדינה וגיל הם ערכים חזקים כמו ('ארה'ב', 'אנגליה', 'ארה'ב', 'צרפת', 'רוסיה', 'רוסיה', 'צרפת', 'אנגליה', 'ארה'ב') ו-( 34, 32, 30, 27, 31, 33, 35, 25, 30) בהתאמה. אנו ניצור מילון המכיל את הרשימות באמצעות הפרמטר 'list' בתוך השיטה to_dict().


על ידי שימוש בפרמטר list כארגומנט בתוך הפונקציה to_list(), יצרנו מילון המכיל מספר רשימות.

דוגמה מס' 03: המרת מסגרת נתונים של Pandas למילון המכיל את סדרת הערכים

כאשר צריך להפוך DataFrame למילון, שם העמודה משמש כמפתחות המילון ואינדקס השורה והנתונים בעמודה כערך עבור המפתחות המתאימים במילון.


יצרנו את מסגרת הנתונים הנדרשת באמצעות שיטת pd.DataFrame()‎. במסגרת הנתונים שנוצרה לאחרונה, יש לנו שתי עמודות. עמודת השם מאחסנת את ערכי הנתונים כמחרוזת ('קים', 'מוריס', 'קספר', 'מילי', 'דייב', 'וויל', 'בילי'), בעוד שעמודות הסימנים מורכבות מנתונים מספריים כמו ( 8, 9, 6, 7, 10, 7, 8). נשתמש בפרמטר 'series' כמחרוזת בתוך הפונקציה to_dict() .

דוגמה מס' 04: המר את מסגרת הנתונים של Pandas למילון ללא אינדקס וכותרת

ניתן להשתמש בפרמטר 'פיצול' של הפונקציה to_dict() כדי לחלץ נתונים מ-DataFrame ללא כותרות של עמודות או כאשר אנו צריכים להסיר את הכותרת והשורה אינדקס מהנתונים. תוויות עמודות, אינדקס שורות ונתונים בפועל מחולקים לשלושה רכיבים באמצעות פרמטר זה. בואו ניצור מסגרת נתונים, כדי שנוכל לפצל אותה לשלושה חלקים תוך המרתה למילון.


יצרנו שתי עמודות עם תוויות 'שם' ו'גיל' המכילות ערכים ('דייב', 'מוריס', 'בילי', 'מילי', 'קים', 'וויל', 'קספר') ו-(19, 19 , 25, 21, 19, 21, 23) בהתאמה. בואו נמיר אותם למילוני פיתון.


באמצעות המפתח 'נתונים', נוכל לאחזר את הנתונים מהמילון שנוצר ללא אינדקס או כותרת.

דוגמה מס' 05: המר את מסגרת הנתונים של Pandas למילון לפי שורה ושורה אינדקס

ניתן להשתמש בפרמטר 'record' בתוך הפונקציה to_dict() כדי לאחסן נתונים של כל שורת מסגרת נתונים במספר אובייקטי מילון נפרדים בתוך רשימה או כאשר נדרשים נתונים לפי שורה. תוחזר רשימה המכילה אובייקטי מילון. מילון עם תווית עמודה כמפתח ונתוני עמודה כערך עבור כל שורה.


יצרנו מסגרת נתונים עם עמודות 'שם' ו'שכר'. העמודה 'שם' מכילה את ערכי הנתונים ('ליאו', 'הריס', 'ונדה', 'מייק', 'קלי', 'אדם', 'ג'ק'), ועמודת השכר מאחסנת את הערכים (12000, 12500 , 14000, 11000, 12000, 13000, 12500). כעת בואו ניצור רשימה עם מילוני פיתון מרובים המכילים נתונים של כל שורה.


ניתן להשתמש בפרמטר האינדקס גם כדי להמיר את הנתונים של כל שורה ממסגרת נתונים למילון. תוחזר רשימה המכילה פריטי מילון. כל שורה יוצרת מילון. כאשר אינדקס השורה יהיה המפתח והערך יהיה מילון הנתונים ותווית העמודות.

סיכום

במדריך זה, דנו כיצד אנו יכולים להמיר את מסגרת הנתונים או אובייקטי הפנדות למילון פיתון. ראינו את התחביר של הפונקציה to_dict() כדי להבין את הפרמטרים של פונקציה זו וכיצד ניתן לשנות את הפלט של הפונקציה על ידי ציון הפונקציה עם פרמטרים שונים. בדוגמאות של מדריך זה, השתמשנו בשיטת to_dict(), פונקציית פנדות מובנית, כדי לשנות את אובייקטי הפנדות למילון פיתון.