Pandas Dataframe ייחודי

Pandas Dataframe Yyhwdy



ספריית Python הפופולרית ביותר שנמצאת בשימוש במדעי הנתונים נקראת Pandas. הוא מציע למתכנתי Python ביצועים גבוהים, ידידותיים למשתמש וניתוח נתונים. ברגע שאתה מבין את הפונקציות הבסיסיות וכיצד להשתמש בהן, Pandas הוא כלי רב עוצמה לשינוי נתונים. ב'פנדות' השיטות הסטנדרטיות לאחסון נתונים בצורה טבלאית הן ה-DataFrames. אנו יכולים להשתמש בכמה שיטות 'פנדות' כדי לקבל את הערכים הייחודיים בעמודה של 'פנדות' DataFrame. כאשר אנו צריכים לקבל ערכים ייחודיים בעמודות של ה-DataFrame ולא רוצים שכפול של ערכים בעמודה של ה-'Pandas' של DataFrame, אנו יכולים להשתמש בשיטות ש-'Pandas' מספק לעשות זאת. בואו נסתכל על שיטות כאלה במדריך זה, יחד עם כמה דוגמאות ופלט כדי לקבל ערכים ייחודיים בעמודת ה'פנדות' של ה-DataFrame.

שיטות לקבלת ערכים ייחודיים בעמודות 'פנדות' של DataFrame

אנו יכולים להשתמש בשתי שיטות להשגת הערכים הייחודיים בעמודות ה-DataFrame של 'פנדות'. אנו שומטים את הערכים הכפולים ומקבלים רק את הערכים הייחודיים בעמודות של DataFrames. השיטות ש'פנדות' מספקות לביצוע משימה זו הן:







  • על ידי שימוש בשיטה ייחודית() .
  • על ידי שימוש בשיטת drop_dupliactes() .

כעת, נשתמש בשתי השיטות בקודי ה'פנדות' לקבלת הערכים הייחודיים בעמודות ה-DataFrame של ה'פנדות'.



דוגמה מס' 01

אפליקציית 'Spyder' משמשת כאן ליצירת קודי 'פנדות' אלה כדי להשתמש באותן שיטות שעוזרות לנו לקבל את הערכים הייחודיים בעמודות ה-DataFrame של 'פנדות'. עלינו לייבא את מודולי ה-'pandas', הנחוצים לקוד 'pandas', לפני יצירת ה-DataFrame. על ידי שימוש במונח 'ייבוא' והצבת 'פנדות כ-pd', אנו מייבאים את המודולים הללו.



כעת, בעזרת 'pd', נוכל להשיג במהירות את הפונקציות או השיטות של 'פנדות'. לאחר מכן שמים את 'Subject_data' שבו אנו מוסיפים 'שם' וב-'שם', אנו מוסיפים את נתוני השם שהם 'רומן, וויליאם, פיטר, סמית', ג'ון, מילי, תומס וג'יימס'. לאחר מכן, אנו מוסיפים את נתוני הנושא ב'נושא' שהם 'מתמטיקה, כלכלה, מדעים, מתמטיקה, סטטיסטיקה, סטטיסטיקה, סטטיסטיקה ומחשב'. לאחר מכן, אנו ממירים את 'Subject_data' זה ל-'Subject_df' DataFrame באמצעות שיטת 'pd.DataFrame()'. אנו ממקמים את 'Subject_df' בשיטת 'print()' כך שהוא יופיע בטרמינל.





כעת, אנו רוצים לקבל את הערכים הייחודיים בעמודה 'Subj' של ה-'pandas' DataFrame. למטרה זו, אנו משתמשים כאן בשיטת 'unique()' ומוסיפים את שם העמודה וגם את שם ה-DataFrame כפי שמוצג להלן. אנו מוסיפים שיטה זו ב-'print()' כך שהתוצאה תוצג גם בטרמינל.



כעת, אנו לוחצים על 'Shift+Enter' לקבלת התוצאה של הקוד הזה והוא מוצג בטרמינל ומוצג גם כאן, המכיל את ה-DataFrame עם כל הערכים. זהו ה-DataFrame המקורי שהוספנו בקוד ומתחתיו מוצגים הערכים הייחודיים של העמודה 'Subj'. זה מוריד את הערכים הכפולים ומציג את הערכים הייחודיים של העמודה 'Subj' של ה-DataFrame.

דוגמה מס' 02

אנו יוצרים את ה-'Sample_list' המכילה מידע מסוים. אנו מכניסים 'Layla, 21, 28, 31, 14 ו-39' אשר יופיע בתור העמודה הראשונה כאשר נמיר רשימה זו ל-DataFrame. לאחר מכן, נוסיף את 'Lusy, 31, 25, 34, 26 ו-21' כשורה השנייה של ה-DataFrame. לאחר מכן, יש לנו 'פיטר, 38, 20, 20, 35 ו-24' ו-'Layla 38, 23, 39 24, 23' שיהיו השורה השלישית והרביעית של ה-DataFrame. אנו גם מוסיפים שלושה נתונים נוספים שהם 'סטלה, 21, 24, 24, 28, 31', 'ליילה, 33, 32, 26, 30, 25' וגם 'פיטר, 21, 21, 31, 21, 29' .

כעת, אנו ממירים את ה-'Sample_list' ל-'DF_Sample' שהוא השם של ה-DataFrame כאן על ידי הכנסת הפונקציה 'pd.DataFrame()'. כמו כן, אנו מגדירים את השם של העמודות של DataFrame זה והשמות הללו הם 'שם, Ass_1, Ass_2, Ass_3, Ass_4 ו-Ass_5'. לאחר מכן, אנו משתמשים ב-'print()' שעוזר בהצגת ה-DataFrame 'DF_Sample'. כעת, אנו משתמשים בשיטה אחרת בדוגמה זו לקבלת הערכים הייחודיים בעמודה של DataFrame. שיטה זו היא שיטת 'drop_duplicates()' של 'פנדות'.

בשיטת 'drop_duplicates()', אנו מגדירים את שם העמודה שבה נרצה לקבל את הערכים הייחודיים בעמודה של ה-DataFrame. אנו מקבלים ערכים ייחודיים של העמודה 'שם' על ידי שחרור הערכים הכפולים בעמודה זו בעזרת שיטת 'drop_duplicates()' וגם עיבוד ערכים ייחודיים אלה באמצעות הפונקציה 'print()' כאן.

השמות המשוכפלים נשמטים וערכים ייחודיים מוצגים לאחר החלת שיטת 'drop_duplicates()'. אתה יכול לשים לב שהשם 'ליילה' מופיע בשלושה תאים של העמודה 'שם'. אבל כאשר שיטת 'drop_duplicates()' מוחלת על עמודה זו, כל הערכים הכפולים נשמטים ושם 'Layla' אחד הופיע על המסך. לאחר שחרור הערכים הכפולים, הופיע ה-DataFrame החדש שמכיל את הערכים הייחודיים בעמודה 'שם' זו. בדרך זו, נוכל להוריד את הערכים הכפולים ולקבל את הערך הייחודי בעמודה של ה-DataFrame בעזרת שיטת 'drop_duplicates()'.

דוגמה מס' 03

אותו DataFrame מנוצל שוב וכעת אנו מיישמים כאן את השיטה 'unique()'. בשיטת 'unique()' אנו מניחים את שם העמודה וכן את השם של ה-DataFrame עליו אנו רוצים ליישם את שיטת ה-'unique()' הזו לקבלת הערכים הייחודיים. זה יציג רק את הערכים הייחודיים של אותה עמודה ולא יציג את הערכים האלה בצורה של DataFrame.

כאן, ה-DataFrame מכיל שבעה ערכים בעמודה 'שם', אך כאשר אנו מיישמים את שיטת ה-'unique()' על העמודה הזו, רק ארבעה ערכים הופיעו ואלו הם הערכים הייחודיים של העמודה הזו. זה לא מציג ערכים כפולים.

דוגמה מס' 04

ה-DataFrame שאנו יוצרים בדוגמה זו היא 'F_G_df'. אנו מכניסים את 'My_fruits' ו-'my_Vegs' ל-DataFrame זה. העמודה 'הפירות שלי' מכילה 'תפוח, תפוז, תפוח, אגס, ליצ'י, תפוח, תפוח, אגס ותפוח'. לאחר מכן, יש לנו את ה-'My_Vegs' שמכיל את שמות הירקות שהם 'צ'ילי, ברינגל, גזר, תפוח אדמה, תפוח אדמה, גזר, בצל, שום וג'ינג'ר'. DataFrame זה מכיל רק שתי עמודות.

כעת, אנו מקבלים את הערכים הייחודיים בשתי העמודות בעזרת השיטה 'unique()'. אנו מזכירים את השם של ה-DataFrame. לאחר מכן, שים את שם העמודה הראשונה של העמודה. לאחר מכן, אנו משתמשים בשיטת append() . בתוספת זו, אנו מציבים שוב את שם ה-DataFrame ואת שם העמודה השנייה וממקמים את השיטה 'unique()'. זה יקבל את הערכים הייחודיים של שתי העמודות ולאחר מכן יצורף את הערכים הייחודיים של שתי העמודות ויופיעו על המסך.

ה-DataFrame מוצג תחילה ומכיל את כל הערכים. לאחר מכן, השיטה 'unique()' מוחלת והערכים הייחודיים של שתי העמודות מוצגים למטה. בקוד זה, אנו מקבלים את הערכים הייחודיים בעמודות המרובות של ה-DataFrame באמצעות שיטת 'unique()'.

סיכום

ההסבר המלא על קבלת הערכים הייחודיים בעמודה של DataFrame נמצא במדריך זה. דנו בשיטות 'unique()' ו-'drop_duplicates()' אשר עוזרות לנו לקבל את הערכים הייחודיים של העמודה של DataFrame. בדקנו כיצד להשתמש בשיטות אלו בקוד 'פנדות' על ידי שימוש בשיטות אלו כאן בקודים שלנו. הדגמנו דוגמאות שונות במדריך זה והראנו לך כיצד לקבל את הערכים הייחודיים של עמודה אחת על ידי שימוש בשיטת 'unique()' כמו גם בשיטת 'drop_duplicates()'. כמו כן, בדקנו כיצד להשיג את הערכים הייחודיים במספר עמודות על ידי שימוש בשיטת 'unique()' במדריך זה.