כיצד ליצור סורק כדי להביא נתונים מ-S3 Bucket?

Kyzd Lyzwr Swrq Kdy Lhby Ntwnym M S3 Bucket



AWS Glue משמש לגילוי נתונים, שילוב נתונים, סריקת נתונים ויצירת קטלוג נתונים בענן. המשתמש יכול ליצור סורק מ-AWS Glue שיסרוק נתונים מהמקור הנתון ואז יאחסן אותם בקטלוג הנתונים כדי לקבל מידע. המשתמש צריך רק להפעיל את הסורק וכל השאר יתבצע על ידי הסורק תוך מספר רגעים.

מדריך זה יסביר כיצד ליצור סורקים כדי להביא נתונים מדלי S3.

כיצד ליצור סורק כדי להביא נתונים מ-S3 Bucket?

כדי ליצור סורק ב-AWS, בקר ב' דבק AWS שירות מלוח המחוונים של אמזון:









הקלק על ה ' מאגרי מידע ' כפתור מקטע קטלוג הנתונים ליצירת מסד נתונים:







הקלק על ה ' הוסף מסד נתונים 'כפתור כדי להתחיל את התצורה:



הזן את שם מסד הנתונים והשאיר הכל כפי שהוא אופציונלי לפני שתלחץ על ' צור מסד נתונים ' כפתור:

מסד הנתונים נוצר בהצלחה:

לאחר מכן, פשוט עבור אל ' זחלנים ' על ידי לחיצה עליו מהחלונית השמאלית:

הקלק על ה ' צור סורק ' כפתור:

הקלד את שם הסורק ולחץ על ' הַבָּא ' כפתור:

הקלק על ה ' הוסף מקור נתונים 'כפתור לבחירת מקור הנתונים:

כדי לבדוק את הנתיב שבו הנתונים מאוחסנים, בקר בשירות S3:

היכנס לדלי S3 שבו הנתונים מועלים. המשתמש יכול לִיצוֹר דלי ו להעלות נתונים עליו מלוח המחוונים של AWS S3:

הקלק על ה ' עיין ב-S3 לחצן ' כדי לבחור את הנתיב של הנתונים:

בחר את התיקיה המכילה את הנתונים ולאחר מכן לחץ על ' בחר ' כפתור:

נתיב S3 נבחר, כעת לחץ על ' הוסף מקור נתונים S3 ' כפתור:

לאחר הוספת מקור הנתונים, פשוט לחץ על ' הַבָּא ' כפתור:

הוסף את תפקיד IAM ולאחר מכן לחץ על ' הַבָּא ' כפתור:

הזן את מסד הנתונים היעד שנוצר קודם לכן ולאחר מכן הקלד את השם לטבלה:

בחר את לוח הזמנים לפי דרישה עבור הסורק ולחץ על ' הַבָּא ' כפתור:

סקור את הסורק ולחץ על ' צור סורק ' כפתור:

הסורק נוצר בהצלחה, לחץ על ' לָרוּץ כפתור ' לאחר בחירתו:

ייקח כמה רגעים להפעיל את הסורק והוא יאחזר נתונים ויצור טבלה לאחסון הנתונים:

פנה אל ' טבלאות ' דף מלוח המחוונים של דבק:

בחר את הטבלה על ידי לחיצה על השם שלה:

פרטי הסיפור הוצגו המכילים את המטא נתונים של הנתונים שהובאו:

גלול מטה בעמוד ובחר את הקטע כדי להציג את הטבלה המכילה את הנתונים:

זה הכל על יצירת סורק כדי להביא נתונים מדלי S3.

סיכום

כדי ליצור סורק כדי להביא נתונים מדלי S3, צור מסד נתונים ב-AWS Glue שבו הנתונים הנסרקים יאוחסנו. הגדר את הסורק מלוח המחוונים של Glue על ידי אספקת מקור הנתונים (דלי S3) ומסד הנתונים היעד. הפעל את הסורק ואחזר את הנתונים מ-S3 דלי לטבלת מסד הנתונים כפי שהוסבר מדריך זה ביסודיות.