קבל מספר עמודות ב-R DataFrame

Qbl Mspr Mwdwt B R Dataframe



ב-R, קבלת מספר העמודות היא פעולה בסיסית שנדרשת במצבים רבים בעבודה עם DataFrames. בעת הגדרת משנה, ניתוח, מניפולציה, פרסום והצגה של הנתונים, ספירת העמודות היא פיסת מידע חיונית שיש לדעת. לכן, R מספק גישות שונות כדי לקבל את סך העמודות של ה-DataFrame שצוין. במאמר זה, נדון בכמה מהגישות שעוזרות לנו לקבל את ספירת העמודות של ה-DataFrame.

דוגמה 1: שימוש בפונקציה Ncol()

ה-ncol() הוא הפונקציה הנפוצה ביותר לקבל את סך העמודות של ה-DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----מספר עמודות במסגרת Data Frame :', n)

בדוגמה זו, אנו יוצרים תחילה DataFrame 'df' עם שלוש עמודות המסומנות כ-'y1', 'y2' ו-'y3' באמצעות הפונקציה data.frame() ב-R. האלמנטים בכל עמודה מצוינים באמצעות הפונקציה c() שיוצרת וקטור של אלמנטים. לאחר מכן, באמצעות המשתנה 'n', הפונקציה ncol() משמשת לקביעת סך העמודות ב-'df' DataFrame. לבסוף, עם ההודעה התיאורית והמשתנה 'n', הפונקציה cat() המסופקת מדפיסה את התוצאות בקונסולה.



כצפוי, הפלט שאוחזר מציין של-DataFrame שצוין יש שלוש עמודות:







דוגמה 2: ספור את סך העמודות עבור מסגרת הנתונים הריקה

לאחר מכן, אנו מיישמים את הפונקציה ncol() על ה-DataFrame הריק שמקבלת גם את הערכים של סך העמודות אבל הערך הזה הוא אפס.

empty_df <- data.frame()

n <- ncol(empty_df)

cat('---עמודות במסגרת נתונים :', n)

בדוגמה זו, אנו יוצרים את ה-DataFrame הריק, 'empty_df', על ידי קריאה ל-data.frame() מבלי לציין עמודות או שורות כלשהן. לאחר מכן, אנו משתמשים בפונקציה ncol() המשמשת למציאת ספירת העמודות ב-DataFrame. הפונקציה ncol() מוגדרת עם DataFrame 'empty_df' כאן כדי לקבל את סך העמודות. מכיוון ש-'empty_df' DataFrame ריק, אין לו עמודות. אז הפלט של ncol(empty_df) הוא 0. התוצאות מוצגות על ידי הפונקציה cat() שנפרסת כאן.



הפלט מציג את הערך '0' כצפוי מכיוון שה-DataFrame ריק.

דוגמה 3: שימוש בפונקציה Select_If() עם הפונקציה Length()

אם ברצוננו לאחזר את מספר העמודות מכל סוג מסוים, עלינו להשתמש בפונקציה select_if() בשילוב עם הפונקציה length() של R. נעשה שימוש בפונקציות אלו המשולבות כדי לקבל את סך כל העמודות של כל סוג . הקוד לשימוש בפונקציות אלו מיושם בפעולות הבאות:

library(dplyr)

x1<-אותיות[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Summer','Winter'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

length(select_if(df1,is.numeric))

בדוגמה זו, אנו טוענים תחילה את חבילת dplyr כדי שנוכל לגשת לפונקציה select_if() ולפונקציה length(). לאחר מכן, אנו יוצרים את ארבעת המשתנים - 'x1', 'x2', 'x3' ו-'x4', בהתאמה. כאן, 'x1' מכיל את 10 האותיות הראשונות של האלפבית האנגלי. המשתנים 'x2' ו-'x3' נוצרים באמצעות הפונקציה rpois() ליצירת שני וקטורים נפרדים של 10 מספרים אקראיים עם פרמטרים 2 ו-5, בהתאמה. המשתנה 'x4' הוא וקטור פקטור עם 10 אלמנטים שנדגמים באופן אקראי מווקטור c ('קיץ', 'חורף').

לאחר מכן, אנו מנסים ליצור את DataFrame 'df1' שבו כל המשתנים מועברים בפונקציה data.frame() . לבסוף, אנו מפעילים את הפונקציה length() כדי לקבוע את אורך ה-'df1' DataFrame שנוצר באמצעות הפונקציה select_if() מחבילת dplyr. הפונקציה select_if() בוחרת את העמודות מתוך DataFrame 'df1' כארגומנט והפונקציה is.numeric() בוחרת רק את העמודות המכילות ערכים מספריים. לאחר מכן, הפונקציה length() מקבלת את סך העמודות שנבחר על ידי select_if() שהוא הפלט של הקוד כולו.

אורך העמודה מוצג בפלט הבא המציין את סך כל העמודות של ה-DataFrame:

דוגמה 4: שימוש בפונקציה Sapply()

לעומת זאת, אם אנחנו רוצים לספור רק את הערכים החסרים של העמודות, יש לנו את הפונקציה sapply() . הפונקציה sapply() חוזרת על כל עמודה של ה-DataFrame כדי לפעול באופן ספציפי. הפונקציה sapply() מועברת תחילה עם ה-DataFrame כארגומנט. לאחר מכן, נדרשת הפעולה שתבוצע על אותה DataFrame. היישום של הפונקציה sapply() כדי לקבל את הספירה של ערכי NA בעמודות DataFrame מסופק באופן הבא:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

בדוגמה זו, אנו יוצרים את DataFrame 'new_df' עם שלוש עמודות - 'c1', 'c2' ו-'c3'. העמודות הראשונות, 'c1' ו-'c3', מכילות את הערכים המספריים כולל כמה ערכים חסרים שמיוצגים על ידי NA. העמודה השנייה, 'c2', מכילה את התווים כולל כמה ערכים חסרים אשר מיוצגים גם על ידי NA. לאחר מכן, אנו מיישמים את הפונקציה sapply() על DataFrame 'new_df' ומחשבים את מספר הערכים החסרים בכל עמודה באמצעות הביטוי sum() בתוך הפונקציה sapply().

הפונקציה is.na() היא הביטוי שצוין לפונקציה sum() שמחזירה וקטור לוגי המציין אם כל אלמנט בעמודה חסר או לא. הפונקציה sum() מחברת את ערכי TRUE כדי לספור את מספר הערכים החסרים בכל עמודה.

לפיכך, הפלט מציג את ערכי ה-NA הכוללים בכל אחת מהעמודות:

דוגמה 5: שימוש בפונקציה Dim()

בנוסף, אנו רוצים לקבל את סך העמודות יחד עם השורות של ה-DataFrame. לאחר מכן, הפונקציה dim() מספקת את הממדים של ה-DataFrame. הפונקציה dim() לוקחת את האובייקט כארגומנט שאת מימדיו אנו רוצים לאחזר. הנה הקוד לשימוש בפונקציית dim():

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

points=c(8, 10, 7, 4))

עמום(ד1)

בדוגמה זו, אנו מגדירים תחילה את ה-'d1' DataFrame שנוצר באמצעות הפונקציה data.frame() שבה שתי עמודות מוגדרות 'צוות' ו-'נקודות'. לאחר מכן, אנו מפעילים את הפונקציה dim() על ה-'d1' DataFrame. הפונקציה dim() מחזירה את מספר השורות והעמודות של ה-DataFrame. לכן, כאשר אנו מריצים את ה-dim(d1), הוא מחזיר וקטור עם שני אלמנטים - הראשון שבהם משקף את מספר השורות ב-'d1' DataFrame והשני מייצג את מספר העמודות.

הפלט מייצג את הממדים של ה-DataFrame כאשר הערך '4' מציין את סך העמודות והערך '2' מייצג את השורות:

סיכום

כעת למדנו שספירת מספר העמודות ב-R היא פעולה פשוטה וחשובה שניתן לבצע ב-DataFrame. מבין כל הפונקציות, הפונקציה ncol() היא הדרך הנוחה ביותר. כעת, אנו מכירים את הדרכים השונות לקבל את מספר העמודות מ-DataFrame הנתון.