סטיית תקן של פנדה

Styyt Tqn Sl Pndh



'הפנדות' היא שפה נהדרת לביצוע ניתוח נתונים בגלל המערכת האקולוגית הנהדרת שלה של חבילות פיתון ממוקדות נתונים. זה מקל על הניתוח והייבוא ​​של שני הגורמים. סטיית התקן היא סטייה 'טיפוסית' הנגזרת מהממוצע. נעשה בו שימוש רב, מכיוון שהוא מחזיר את יחידות המידה המקוריות של מסגרת הנתונים. הפנדות השתמשו ב-std() לחישוב סטיית התקן. ניתן לחשב את סטיית התקן מהערכים הנתונים שיכולים להיות ב-dataframe בצורה של שורה או עמודה. אנו ניישם את כל הדרכים האפשריות בהן נעשה שימוש בסטיית תקן של פנדה. לצורך יישום הקוד, נשתמש בכלי 'spyder' כפי שהוא כתוב בסביבה ידידותית לפייתון.'

תחביר







'df.std ( )


התחביר הבא משמש לחישוב סטיית התקן במסגרת הנתונים. ה-'df' ב-dataframe הוא הקיצור של 'dataframe'. מה עושה סטיית התקן? הוא מודד עד כמה מורחבים הנתונים הנדרשים. ככל שערכים גבוהים מורחבים יותר, סטיית התקן צריכה להתרחש גבוה יותר.



לַחֲזוֹר

סטיית התקן של הפנדות מחזירה את מסגרת הנתונים אם הרמה מוגדרת על סמך הדרישה.



שימו לב שהפונקציה 'std()' תתעלם אוטומטית מערכי 'NaN' ב-'df' בזמן חישוב סטיית התקן של הפנדות. ניתן להסביר את 'NaN' כ'לא מספר', כלומר אין ערך שהוקצה לפרט.





להלן השיטות שיבוצעו עם דוגמאות של סטיית התקן של הפנדות:

    • חישוב סטיית התקן של פנדה בעמודה אחת.
    • חישוב סטיית התקן של פנדה במספר עמודות.
    • חישוב סטיית התקן של פנדה של כל העמודות המספריות.
    • סטיית תקן של פנדות באמצעות הציר = 1.
    • סטיית תקן של פנדה באמצעות הציר = 0.

יצירת ה-Dataframe לחישוב סטיית תקן בפנדות

ראשית, פתח את תוכנת 'ספיידר'. כעת ייבא את ספריית הפנדות כ-pd. ניצור מסגרת נתונים המורכבת מלוח תוצאות עם מונחים כמו 'x', 'y' ו- 'z' כאשר הנקודות שלהם הן '22', '10', '11', '16', '12', '45'. ', '36', ו-'40'. יש לנו את ערכי האסיסטים שלהם כמו '8', '9', '13', '7', '22', '24', '4' ו- '6', עם ערכי הריבאונדים כמו '17', ' 14', '3', 5', '9', '8', '7' ו- '4'.




התצוגות מציגות את מסגרת הנתונים שנוצרה לפי הערכים שהוקצו בקוד:

דוגמה מס' 01: חישוב סטיית תקן של פנדה בעמודה אחת

בדוגמה זו, נחשב את סטיית התקן של עמודה בודדת במסגרת הנתונים של הפנדות. למסגרת הנתונים יש את ערכי הצוות כ-'u', 'v' ו-'b' כשהנקודות שלהם הן '44', '33', '22', '44', '45', '88', '96 ' ו'78'. ערכי האסיסטים הם '7', '8', '9', '10', '11', '14', '18' ו- '17', גם עם ערכי הריבאונדים '11', ' 9', '8', '7', '6', '5', '4' ו- '3'. העמודה 'נקודות' נבחרת ממסגרת הנתונים כדי לחשב את סטיית התקן של העמודה הבודדת.


הפלט מציג את סטיית התקן המחושבת של העמודה 'נקודות':

דוגמה מס' 02: חישוב סטיית תקן של פנדה במספר עמודות

בדוגמה זו, נבצע את חישובי סטיית התקן של הפנדות במספר עמודות. במסגרת הנתונים הזו, הנתונים הם שוב של לוח התוצאות של הספורט עם ערכי הקבוצה כ-'n', 'w' ו-'t' עם הציון כ-'33', '22', '66', '55', '44', '88', '99' ו-'77'. האסיסטים הם '9', '7', '8', '11', '16', '14', '12' ו- '13' והריבאונדים כ'5', '8', '1', ' 2', '3', '4', '6' ו- '7'. כאן נחשב את סטיית התקן של שתי העמודות 'נקודות' ו'ריבאונדים' באמצעות הפונקציה std() המוחלת על מסגרת הנתונים.


כפי שאנו רואים, הפלט מראה שסטיית התקן הגיעה ל-26.944387 בעמודת הנקודות ו-2.449490 בעמודת הריבאונד, בהתאמה.

דוגמה מס' 03: חישוב סטיית תקן של פנדה של כל העמודות המספריות

כעת למדנו כיצד לחשב את סטיית התקן של שורות בודדות ומספר שורות. מה אם אנחנו לא רוצים לציין את כל שמות העמודות ב-dataframe ולחשב את כל הנתונים-frame? זה אפשרי עם יישום פשוט של פונקציה של סטיית התקן של הפנדות לחישוב של מסגרת הנתונים המלאה בסך הכל בתוצאות. מסגרת הנתונים כאן מורכבת מ-'l', 'm' ו-'o' עם ערכי הניקוד '33', '36', '79', '78', '58', '55', ושתי קבוצות ניקוד זהה כלומר '25'. האסיסטים הם '1', '2', '3', '4', '6', '9', '5' ו- '7' והריבאונדים שלהם הם '14', '10', '2' , '5', '8', '3', '6' ו- '9'. אנו יכולים לחשב את כל סטיות העמודות הסטנדרטיות על ידי פנדות במסגרת הנתונים באמצעות הפונקציה 'std()' של פנדה.


לתצוגה יש את סטיית התקן המחושבת של כל 'df' המוצג להלן; אנו יכולים גם לשים לב שהפנדות לא חישבו את סטיית התקן של העמודה הראשונה, שהיא 'צוות', מכיוון שהיא לא עמודה מספרית.

דוגמה מס' 04: סטיית תקן של פנדה באמצעות הציר = 0

בדוגמה זו, למסגרות הנתונים יש את קבוצות הספורט כ-'g', 'h' ו-'k' עם נתונים נוספים. כאן, נחשב את סטיית התקן על ידי שימוש בציר בתור '0', פרמטר המשמש בסטיית התקן של הפנדות. ארגומנט זה מחשב את סטיית התקן לפי עמודה של מסגרת הנתונים.


הפלט הבא מציג את התוצאות בעמודות של סטיית התקן המחושבת. בעמודת הנקודות יש את סטיית התקן המחושבת כ-'24.0313062', בעמודת האסיסטים יש את סטיית התקן המחושבת כ-'2.669270' וסטיית התקן המחושבת של עמודת הריבאונד מוצגת כ-'3.943802'.

דוגמה מס' 05: סטיית תקן של פנדה באמצעות הציר = 1

כאן נשתמש בפרמטר הציר שהוקצה כ-'1' כדי לחשב את סטיית התקן בפנדות. איזה הבדל יכול לעשות ציר '1'? הארגומנט של ציר '1' מחשב את סטיית התקן מבחינת השורה של הערכים המספריים במסגרת הנתונים. ל-dataframe יש את שלושת הקבוצות כ-'s', 'd' ו-'e', עם תוספת של עמודות נתונים שנוצרו כנקודות של הצוות, אסיסטים של הצוות וריבאונדים של הצוות. כיוונים כולם מוקצים עם ערכים שונים במסגרת הנתונים. פרמטר הציר הזה הוא מחליף משחק, שעד עתה, עלינו לעבוד על הנתונים היכן שאנו רוצים שהם יהיו בעמודה פלוס נקודה המחושבת של סטיית התקן שבוצעה.


הפלט הבא מציג את סטיית התקן המחושבת בשורה של מסגרת הנתונים:

סיכום

סטיית התקן של פנדה היא פונקציה טכנית מאוד, שהיא פונקציה מאוד מועילה מכיוון שהיא מוצאת את סטיית התקן של הסכם ההתלהבות של מסגרות נתונים של פנדות. במאמר מערכת זה, למדנו את השיטות לחישוב סטיית התקן בפנדות. עשינו חישובים של עמודה אחת של סטיית תקן ומספר עמודות וגם חישבנו את סטיית התקן של כל ה-dataframe ביחד. כל האסטרטגיות עובדות היטב כל עוד נעשה בהן שימוש עקבי ועם התוצאות הרצויות.