פונקציית Sample() ב-R

Pwnqzyyt Sample B R



ב-R, אנו מקבלים ערכי מדגם אקראי מווקטור או רשימה באמצעות הפונקציה sample() . זה מאפשר לנו לבחור באופן אקראי קבוצת משנה של נתונים שימושית ביישומים סטטיסטיים רבים. אם הקלט הוא רשימה בפונקציה sample(), הפלט יהיה גם רשימה עם אותו מספר אלמנטים, אך עם האלמנטים שנבחרו. מאמר זה מדגים את הפונקציה sample() של R עם היישום שקובע את הארגומנטים השונים.

דוגמה 1: שימוש בפונקציה Sample() עם ארגומנט הנתונים

יש לספק את הפונקציה sample() של R עם נתוני המדגם כדי ליצור מספר באופן אקראי. נתוני המדגם הם הארגומנט הנדרש של הפונקציה sample() שהקוד שלה ניתן בקטע הבא:

dataX < - ג ( 10 , עשרים , 30 , 40 , חמישים , 60 , 70 , 80 , 90 , 100 )

לִטעוֹם ( dataX , 3 )

לִטעוֹם ( dataX , 3 )

כאן, אנו יוצרים תחילה את הוקטורים של רכיבי המספרים השלמים בתוך המשתנה 'dataX'. לאחר מכן, אנו קוראים לפונקציה sample() פעמיים בקוד ומעבירים אליו את הווקטור 'dataX' שיצרנו בעבר כארגומנט. השימוש הראשון במדגם (dataX, 3) לוקח מדגם אקראי של שלושה אלמנטים מהוקטור 'dataX'. התוצאות הן תמורה אקראית של שלושה אלמנטים מ-'dataX'. לאחר מכן, אנו משתמשים שוב במדגם(a, 5) אשר לוקח מדגם אקראי בלתי תלוי נוסף של שלושה אלמנטים מהוקטור 'dataX'. הפעם, התוצאה שונה לחלוטין מהקודמת.







הפלט מציג את האלמנטים השונים בקריאה לפונקציה sample() פעמיים. שימו לב שבכל פעם שאנו יוצרים את המדגם באופן אקראי, מתקבלים אלמנטים שונים מהווקטורים:





דוגמה 2: שימוש בפונקציה Sample() עם ארגומנט החלף

יתר על כן, יש לנו את הארגומנט 'replace' של הפונקציה sample() שלוקחת את הערכים הלוגיים. ניתן לבחור אלמנט דומה יותר מפעם אחת אם הרכיב נדגם עם אפשרות ההחלפה, TRUE. עם זאת, אם הערך מוגדר כ-FALSE, יכולה להיות רק בחירה אחת מכל אלמנט שגורמת לדגימת הרכיבים ללא החלפה.





מספרים אקראיים = ג ( אחד עשר , 25 , 12 , 89 , ארבע חמש , 16 , 67 , 38 , 96 , 55 , 73 )

לִטעוֹם ( מספרים אקראיים , 4 , החלף = נָכוֹן )

לִטעוֹם ( מספרים אקראיים , 5 , החלף = נָכוֹן )

כאן, אנו מגדירים תחילה את הווקטור עם כמה ערכים מספריים במשתנה 'רנדומלי_מספרים'. לאחר מכן, אנו מפעילים את הפונקציה sample() שבה ה-'random_numbers' מועבר כארגומנט. הערך של '4' מצוין לפונקציה sample() המציינת שהיא בוחרת רק ארבעה ערכים אקראיים מהווקטורים ב-'random_numbers'.

לאחר מכן, הפונקציה replace=TRUE בפונקציה sample() מציינת שניתן לבחור כל ערך יותר מפעם אחת. לאחר מכן, אנו פורסים שוב את הפונקציה sample() אשר בוחרת הפעם '5' ערכים אקראיים מהווקטורים. באופן דומה, אנו מגדירים את ארגומנט ההחלפה ב-'TRUE' כמו קודם עבור אפשרויות הבחירה המרובות עבור כל ערך.



כפי שאנו יכולים לראות, הפלט הראשון מציג את הווקטור של 4 אלמנטים שנבחרו באקראי מהוקטור 'מספרים_אקראיים'. הפלט הבא, לעומת זאת, מציג וקטור של '5' אלמנטים שנבחרו באקראי:

דוגמה 3: שימוש בפונקציה Sample() עם ארגומנט הגודל

הארגומנט הבא שהפונקציה sample() מעבירה הוא ה-'size'. ה'גודל' הוא פרמטר אופציונלי המציין את ערך הדגימות שיש לצייר. הקוד של הפונקציה sample() עם הפרמטר 'size' ניתן בקטע הבא:

וקטורים < - 1 : 10

לִטעוֹם ( וקטורים , גודל = 5 )

כאן, וקטור מספרי מוגדר כרצף של מספרים שלמים מ-1 עד 10 במשתנה 'וקטורים'. הפונקציה sample() מופעלת לאחר מכן לבחירת אלמנטים אקראית מהווקטור. כפי שאנו יכולים לראות, הפונקציה sample() לוקחת שני ארגומנטים. הארגומנט הראשון הם הוקטורים שמהם אנו מקבלים את המדגם. הארגומנט הבא הוא הגודל שצוין עם הערך של '5' שמציין שיש רק חמישה אלמנטים לבחירה מהווקטור.

לפיכך, האלמנטים שנבחרו מוחזרים בסדר אקראי כווקטור חדש בפלט הבא:

דוגמה 4: שימוש בפונקציה Sample() עבור רשימת R

יתרה מכך, ניתן להשתמש בפונקציה sample() עבור הרשימה ב-R. חלק זה של הדוגמה מקבל ערכים אקראיים מהרשימה.

R_list < - רשימה ( 1 : 4 ,

913 ,

ג ( 'איקס' , 'YYY' , 'טוֹב' ) ,

'ZZZ' ,

5 )

תוֹצָאָה < - ר_רשימה [ לִטעוֹם ( 1 :אורך ( R_list ) , גודל = 4 ) ]

תוֹצָאָה

כאן, הרשימה של 'R_list' מוגדרת עם אלמנטים מסוגים שונים כולל וקטור של מספרים, מספר בודד, וקטור תו, מחרוזת ומספר נוסף. לאחר מכן, אנו יוצרים משתנה 'result' שבו הפונקציה sample() מופעלת.

בתוך הפונקציה sample() אנו מגדירים את הביטוי '1:length(R_list)' המציין את הוקטורים של המדדים לדגימה. לאחר מכן, יש לנו ארגומנט 'גודל' כדי לציין את מספר האלמנטים שיש לדגום שהוא '4'. לכן, ה-'R_list' מייצר שלושה אלמנטים שנבחרו באקראי מתוך הרשימה של 'R_list'. מכיוון שהאלמנטים ברשימה של 'R_list' הם מסוגים שונים, האלמנטים המתקבלים ב'תוצאה' יכולים להיות גם מסוגים שונים.

הפלט מייצג את הרשימה החדשה המכילה תת-קבוצה אקראית של הרשימה המקורית:

דוגמה 5: שימוש בפונקציה Sample() עם ארגומנט ה-Prob

בנוסף, יש לנו את הפרמטר 'prob' של הפונקציה sample() . הארגומנט 'הסתברות' נותן את ההסתברות של האלמנט הנבחר בווקטור. שימו לב שלכל האלמנטים יש הסתברות שווה כאשר לא נעשה שימוש בארגומנט 'הסתברות'.

הנתונים שלי = ג ( 31 , 99 , 5 , 24 , 72 )

לִטעוֹם ( הנתונים שלי , גודל = 10 , החלף = נָכוֹן ,

prob = ג ( 0.5 , נציג ( 0.1 , 4 ) ) )

כאן, האלמנטים של וקטורים מספריים מופנים ל-'my_data'. בשלב הבא, אנו קוראים לפונקציה sample() שבה ה-'my_data' מועבר ל-10 אלמנטים שנבחרו באקראי ממנה. לאחר מכן, מוגדר הארגומנט 'גודל' המציין שהערך לבחירה באופן אקראי צריך להיות בגודל '10'. לאחר מכן, אנו מקצים 'TRUE' לארגומנט 'החלף' כלומר כל אלמנט שנבחר מוחלף לווקטור לפני בחירת האלמנט הבא. הארגומנט השלישי שמוגדר בפונקציה sample() הוא 'prob' שמגדיר את ההסתברות של כל אלמנט בוקטור 'my_data' שייבחר. ההסתברות של האלמנט הראשון מוגדרת ל-'0.5'. עבור ארבעת האלמנטים הווקטוריים הנותרים, ההסתברות היא '0.1'.

הפלט הבא מאוחזר עם ההסתברות הגבוהה ביותר של האלמנט הראשון בוקטורים כצפוי:

דוגמה 6: שימוש בפונקציה Sample() לעיבוד הברפלט

לבסוף, הפונקציה sample() משמשת לבניית תרשים ה-Barplot ב-R כדי להמחיש את ההתפלגות של משתנה קטגורי עם התפלגות הסתברות נתונה.

sample_data = ג ( 1 , 2 , 3 )

ברplot ( שולחן ( לִטעוֹם ( sample_data , גודל = 500 , החלף = נָכוֹן , prob = ג ( .30 , .60 , .10 ) ) ) )

כאן, לאחר הגדרת ה-'sample_data' עם הווקטור של ערך שלם, אנו יוצרים את ה-barplot על ידי פריסת הפונקציה sample(). ראשית, אנו קוראים ל-barplot אשר מפעיל את הפונקציה table() כדי ליצור טבלת תדירות של המדגם המתקבל. לאחר מכן, אנו מציינים את הפונקציה sample() בתוך הפונקציה table() שבה נמשך מדגם אקראי בגודל 1000 מוקטור של מספרים שלמים 1 עד 3. לאחר מכן, הארגומנט 'prob' משמש לציון ההסתברות לבחירת כל מספר שלם .

כפי שאנו יכולים לראות כעת, ה-barplot מוצג להלן עם שלושת הפסים, אחד לכל מספר שלם, וגובה הפסים רלוונטיים למספר השלם המופיע במדגם:

סיכום

ראינו כיצד פועלת הפונקציה sample() עם דוגמאות שונות. הפונקציה sample() משמשת עם ארגומנטים שונים כאשר נתוני המדגם נדרשים וכל שאר הארגומנטים הם אופציונליים ונקראים במקרים ספציפיים. עם זאת, הפונקציה sample() שימושית בניתוח סטטיסטי או בעבודה עם מערכי נתונים גדולים.