סדרת פנדה ל-CSV

Sdrt Pndh L Csv



שיטת 'Series.to_csv()' ב-Pandas מפלטת את אובייקט הסדרה שצוין בסימון ערכים מופרדים בפסיקים (csv). פונקציה זו פשוט לוקחת את הערכים מסדרה ומשנה את הפורמט שלהם על ידי הוספת פסיקים להפרדה בין ערכי אינדקס ועמודות.

כדי להשתמש בפונקציה זו, עלינו להשתמש בתחביר הבא:









מאמר זה יספק לך שתי טכניקות שונות כדי ללמוד את הדרכים להשתמש בשיטה זו בתוכנית פיתון.



דוגמה מס' 1: שימוש בשיטת Series.to_csv() להמרת סדרה עם DatetimeIndex לערכים מופרדים בפסיק

כדי לשנות סדרה לפורמט CSV, נשתמש בפונקציה 'Series.to_csv()'. איור זה יפיק סדרה עם DatetimeIndex ולאחר מכן תמיר אותה לתבנית ערכים מופרדים בפסיקים.





כדי להפעיל את השיטה הזו, אנחנו חייבים כלי שתומך בתכנות python. הכלי 'Spyder' נבחר להידור הקודים. כדי לכתוב עליו את הסקריפט, השקנו תחילה את הכלי המותקן במערכת שלנו. תוכנית python זקוקה לספרייה כדי להפעיל את השיטות שלה להשגת התוצאה הנדרשת. הספרייה שהעלינו כאן היא ה'פנדות'. באותה שורת קוד, הכינוי של ספרייה זו מזוהה כ-'pd'. אז, בכל מקום בתוכנית, אנחנו צריכים לכתוב 'פנדות' כדי לגשת לפונקציה. במקום זאת נכתוב 'pd'.

הצעד הראשון להתחיל עם הקוד הוא ליצור סדרת Pandas. אנחנו צריכים לכתוב 'pd' כדי להשתמש בשיטת יצירת הסדרה מפנדות. הפונקציה 'pd.Series()' נקראת כדי לבנות סדרה עם הערכים שצוינו. הערכים שסיפקנו לסדרה הם 'איסטנבול', 'איזמיר', 'אנקרה', 'אנקרה', 'אנטליה', 'קוניה' ו'בורסה'. אם ברצונך לתת שם למערך הערכים הזה, תוכל לעשות זאת על ידי שימוש בפרמטר 'שם'. כאן, קראנו למערך הערכים הזה 'ערים' מכיוון שהוא מחזיק בשמות של 6 ערים. כדי לאחסן סדרה זו, נוצר אובייקט סדרה 'טורקיה'.



כדי ליצור DatetimeIndex, הפעלנו את השיטה 'pd.date_range()'. בין הסוגריים של פונקציה זו, העברנו 4 ארגומנטים שהם: 'התחלה', 'תדר', 'נקודות' ו-'צ'.

הארגומנט 'התחלה' לוקח תאריך ושעה כדי להתחיל ליצור ממנו טווח תאריכים. כאן, ציינו את תאריך ושעה ההתחלה כ-'2022-03-02 02:30'. הפרמטר 'freq' הוא סיווג התדירות עבור טווח התאריכים. אז, סיפקנו לו את הערך 'D'. כעת, זה יצור טווח תאריכים בתדירות היומית. הארגומנט 'תקופה' מוגדר ל-'6', כלומר הוא יפיק טווח תאריכים למשך 6 ימים. הפרמטר האחרון הוא 'tz' המציין את אזור הזמן עבור האזור שצוין. ציינו את אזור הזמן עבור 'אסיה/איסטנבול'.

כדי לאחסן טווח תאריכים זה, יצרנו משתנה 'Datetime'. כדי להגדיר את DatetimeIndex, השתמשנו במאפיין 'Series.index'. שם הסדרה 'טורקיה' מסופק עם המאפיין '.index' ומוקצה לו את טווח התאריכים והשעה המאוחסן במשתנה 'Datetime'. לפיכך, המאפיין 'אינדקס' ייקח את הערכים מהמשתנה 'תאריך תאריך' ויהפוך אותם לרשימת האינדקסים של סדרת 'טורקיה'. לבסוף, כדי להציג את סדרת הפלט, השתמשנו בשיטת 'print()' והעברנו את סדרת 'טורקיה' כקלט לה כדי להציג את תוכנה.

פשוט לחצנו על האפשרות 'הפעל קובץ' כדי להפעיל את הסקריפט. כתוצאה מכך, אנו יכולים לראות סדרה עם ה-DatetimeIndex שמתחילה מ-'2022-03-02 02:30:00+03:00' ומסתיימת ב-'2022-03-07 02:30:00+03:00' ויוצרות תקופה של 6 ימים. מתחת לסדרה מוזכרים גם ה-'Freq :D', שם רשימת המערך 'Cities' וה-dtype 'object'.

כעת, נלמד להמיר את הסדרה הזו שראינו זה עתה בתמונת המצב למעלה לפורמט CSV. כדי לשנות את הסדרה לערכים מופרדים בפסיקים, יש לנו שיטה שסופקה על ידי מודול הפנדות שהיא 'Series.to_csv()'. שיטה זו לוקחת את הערכים של הסדרה המסופקת ומוסיפה פסיקים בין ערכי העמודה.

הפונקציה 'Series.to_csv()' נקראת. שם הסדרה שברצוננו להמיר מוזכר בשיטה בתור 'Turkey.to_csv()'. כדי לשמר את הערכים המופרדים בפסיקים, יצרנו משתנה 'Comma_Separated' ולאחר מכן שמנו את התוכן שלו בחלון הפלט על ידי הפעלת הפונקציה 'print()'.

הנה הסדרה שלנו בפורמט csv. אנו יכולים לראות בתמונת המצב שהאינדקס וערכי הסדרה הופרדו באמצעות הפסקים שבהם.

דוגמה מס' 2: שימוש בשיטת Series.to_csv() להמרת סדרה עם ערכי NaN לערכים מופרדים בפסיק

הטכניקה השנייה להפעלת שיטת 'Series.to_csv()' היא ליישם שיטה זו כדי להמיר סדרה שמחזיקה כמה ערכים null לפורמט CSV.

בהתחלה ייבאנו את החבילות הדרושות. ה-'pd' נעשה ככינוי לפנדות ו-'np' ככינוי ל-numpy. ערכת הכלים numpy נטען כאן מכיוון שאנו נבצע מספר כניסות Null לסדרה שלנו באמצעות 'np.NaN' תוך כדי יצירתה בשיטת pandas 'pd.Series()'.

הפונקציה 'pd.Series()' מופעלת לבניית סדרת פנדות עם הערכים הבאים: 'נילוס', 'אמזון', np.NaN, 'Ganges', 'מיסיסיפי', 'np.NaN', 'יאנגצה', 'דנובה', 'מקונג', 'np.NaN' ו-'וולגה'. יש סה'כ 21 ערכים שהוגדרו לסדרה שמתוכם 3 ערכים מכילים ערכי 'np.NaN' כלומר חסרים 3 ערכים בסדרה. המאפיין 'שם' מציין את השם עבור מערך הערכים הזה שסיפקנו 'כותרות'. המאפיין 'אינדקס' משמש כדי להגדיר את רשימת האינדקס המוגדרת על ידי המשתמש במקום ללכת עם רשימת ברירת המחדל.

כאן, אנו רוצים את רשימת האינדקס עם הערכים '10', '11', '12', '13', '14', '16', '17', '18', '19', '20', ו-21'. כעת, לסדרה שלנו תהיה רשימת האינדקס החל מ-'10' במקום '0'. כעת, אחסן את הסדרה הזו כדי שנוכל להשתמש בה בהמשך התוכנית. אתחלנו אובייקט סדרה 'Rivers' והקצנו לו את סדרת הפלט שנוצרה מקריאה לשיטת 'pd.Series()'. ניתן לראות את הסדרה על ידי הצבתה לתצוגה באמצעות הפונקציה 'print()' על ידי python.

הפלט המעובד בטרמינל הדפיס סדרה שרשימת האינדקס שלה מתחילה מ-10 ומסתיימת ב-21, כלומר לסדרה יש 21 ערכים.

הסדרה תהפוך לפורמט CSV בשיטת 'Series.to_csv()'.

הפעלנו את שיטת 'Series.to_csv()' עם הסדרה שלנו 'טורקיה'. לפיכך, שיטה זו תיקח את הערכים מסדרת 'טורקיה' ותמיר אותם לתבנית ערכים מופרדים בפסיקים. התוצאה נשמרת במשתנה 'Converted_csv'. ובסופו של דבר, הסדרה המומרת מודפסת בעזרת הפונקציה 'print()'.

בתמונת המצב של התוצאה למטה, אתה יכול לראות שערכי הסדרה משתנים כעת באופן שבו נעשה שימוש בפסיק כדי להפריד אותם מרשימת האינדקסים. יתרה מכך, כאשר הערכים חסרים, רק מספר האינדקס מודפס עם פסיק.

סיכום

השינוי של סדרת פנדות לפורמט CSV הוא גישה מעשית. ניתן להשיג זאת על ידי שימוש בפונקציית הפנדות 'Series.to_csv()'. מדריך זה הביא לפועל שתי טכניקות לשימוש בשיטה זו. באיור הראשון, השתמשנו בשיטה זו כדי להמיר סדרה עם DatetimeIndex לתבנית ערכים מופרדים בפסיקים. המופע השני השתמש בפונקציה 'Series.to_csv()' כדי לשנות סדרה עם כמה ערכים חסרים לפורמט CSV. שתי הטכניקות יושמו באופן מעשי באמצעות הכלי 'Spyder' במערכת ההפעלה Windows.