מהם סוגי הנתונים של אמזון הסטת אדום?

Mhm Swgy Hntwnym Sl Mzwn Hstt Dwm



Amazon Redshift הוא פתרון ענן המוצע על ידי AWS הממלא את המטרה של מחסן נתונים. מחסן נתונים הוא חלל גדול בענן המאחסן כמויות אדירות של נתונים. ההבדל בין מחסן נתונים למסד נתונים הוא שהראשון לא שומר רק נתונים נוכחיים אלא גם את ההיסטוריה המלאה של הנתונים.

מאמר זה ילמד על Amazon Redshift מאת AWS ועל סוגי הנתונים שבהם שירות זה תומך.







מה זה Amazon RedShift?

זהו פתרון ענן למחסני נתונים המבוסס על 'PostgreSQL' . הוא משתמש בטכנולוגיה שנקראת 'עיבוד מקביל מסיבי (MPP)' לעבד פטה-בייט של נתונים במהירות הבזק. זה מספק פתרון קל לחיזוי בזמן אמת המבוסס על נתונים היסטוריים ופתרונות סטרימינג.



האיור הבא מציג את מנגנון העבודה של Amazon Redshift:







ההסבר הגרפי הזה של איך Amazon Redshift עובד הוא מאוד פשוט וברור. זה נותן לנו מידע על האופן שבו נתונים מאוחזרים ומעבדים נוספים כדי ליצור פלטים וליצור יישומים מונעי נתונים.

ניתן לראות את ארכיטקטורת מחסני הנתונים של Amazon Redshift באיור המופיע למטה:



כעת, נפנה אל השימושים והתכונות של שירות זה.

מאפיינים

כפי שכבר הוזכר, Amazon Redshift מבוססת על PostgreSQL ומשתמשת בטכנולוגיה הנקראת Massively Parallel Processing המאפשרת לה לעבד פטה-בייט של נתונים תוך זמן קצר. לכן, Redshift מציעה מספר רב של תכונות ושימושים. חלק מהתכונות הללו מופיעות להלן:

  • אבטחת מידע והצפנה.
  • ניתוח עסקי.
  • תמיכה באפליקציות מונעות נתונים.
  • ניתוח חזוי.
  • חזרה אוטומטית על משימות.
  • קנה מידה של נתונים במקביל.
  • אחסון נתונים.

ניתן לראות כמה תכונות נוספות של שירות זה באיור המופיע למטה:

אלו היו רוב התכונות שמציעה Redshift וכעת נעבור לסוגי הנתונים הנתמכים על ידי שירות זה.

סוגי מידע

Amazon Redshift הוא פתרון אחסון נתונים עם מספר רב של תכונות. הוא תומך בסוגי נתונים מובנים ובלתי מובנים כאחד. מכיוון שהוא מבוסס על PostgreSQL, ניתן לתפעל את הנתונים באמצעות שאילתות SQL פשוטות.

כעת, מתעוררת שאלה נוספת, כלומר, כיצד פורמטים אלה של נתונים שונים זה מזה? הבה נדון בשני פורמטי הנתונים הללו.

נתונים מובנים

סוג נתונים בעל עיצוב גבוה שמתורגם בקלות על ידי אלגוריתמים של למידת מכונה נקרא נתונים מובנים. מסד נתונים של SQL עובד עם נתונים מובנים. נתונים מובנים הם בצורת טבלה כגון נתונים המשמשים מסדי נתונים יחסיים

אחת המערכות הנפוצות לניהול מסדי נתונים של SQL היא MYSQL. ניתן לראות את הארכיטקטורה שלה למטה באיור הנתון:

נתונים לא מובנים

נתונים לא מובנים הם פחות דפוסים ופורמט פחות נתונים, כגון נתונים המשמשים בבסיסי נתונים לא יחסיים. MongoDB הוא מסד נתונים מפורסם שאינו יחסי. שאילתות SQL אינן פועלות על מסדי נתונים שאינם יחסיים, ולכן מסדי נתונים אלה נקראים גם מסדי נתונים NoSQL.

כפי שכבר הוזכר, MongoDB היא מערכת ניהול מסד נתונים לא מובנית וניתן לראות את הארכיטקטורה שלה למטה באיור הנתון:

עברנו על שני סוגי הנתונים הבסיסיים המשמשים בבסיסי נתונים וכעת נעבור לסוגי הנתונים בפועל הנתמכים על ידי Amazon Redshift. סוגי נתונים אלה הם:

  • נתונים מספריים
  • נתוני דמות
  • נתוני תאריך ושעה
  • נתונים בוליאניים
  • HLLSKETCH נתונים
  • SUPER נתונים
  • נתוני החלפה

הבה נדון בסוגי הנתונים הבאים:

נתונים מספריים

סוג נתונים זה מובן מאליו. הוא תומך בנתונים בצורת מספרים שלמים, עשרונים, נקודה צפה וסוגי נתונים מספריים אחרים.

ניתן לראות את המאפיינים של סוג נתונים שלמים באיור שלהלן:

סוג נתונים עשרוני מאחסן את הנתונים על סמך דיוק מהמשתמש. המאפיינים שלו הם כדלקמן:

נתוני דמות

סוגי נתונים CHAR ו-VARCHAR נמצאים בקטגוריה של סוגי נתונים מבוססי תווים. NCHAR ו-NVARCHAR הם גם סוגי נתונים מסוג תווים. שלא כמו CHAR ו-VARCHAR, שני סוגי הנתונים הללו מאחסנים תווי Unicode באורך קבוע. הבה נבחן את המאפיינים של סוגי נתונים אלה, כגון:

  • ל-CHAR, CHARACTER, NCHAR יש טווח של 4KB.
  • ל-VARCHAR, ל-NVARCHAR טווח של 64KB.
  • ל-BPCHAR טווח של 256 בייטים.
  • ל-TEXT יש טווח של 260 בייטים.

נתוני תאריך ושעה

סוגי הנתונים של תאריך ושעה הם DATE, TIME, TIMETZ,TIMESTAMP, TIMESTAMPTZ. היכולות הפונקציונליות של סוגי נתונים אלה הן כדלקמן:

  • DATE פשוט מאחסן תאריכים בלוח השנה.
  • TIME מאחסן זמן ללא התייחסות לאזור זמן כלשהו. זה UTC, כברירת מחדל.
  • TIMETZ מאחסן זמן בהתייחס לאזור הזמן. זה UTC הן בטבלאות המשתמש והן בטבלאות המערכת, כברירת מחדל.
  • TIMESTAMP לא רק כולל זמן אלא גם תאריכים. זה UTC הן בטבלאות המשתמש והן בטבלאות המערכת, כברירת מחדל.
  • TIMESTAMPTZ כולל לא רק זמן אלא גם תאריכים. זה UTC רק בטבלאות משתמש, כברירת מחדל.

נתונים בוליאניים

סוג נתונים בוליאני הוא סוג נתונים בינארי, כלומר ישנם שני ערכים בלבד. טבלת המאפיינים עבור סוג נתונים בוליאני ניתנת להלן באיור:

HLLSKETCH נתונים

סוג נתונים זה משמש לאחסון סקיצות. הסטה לאדום יכולה לייצג את הסקיצות בצורה דלילה או צפופה. סקיצות מתחילות כדלילות והופכות לצפופות בהדרגה כאשר פורמט צפוף מספק יותר יעילות על ידי ביצוע הקישור.

SUPER נתונים

סוג נתונים זה עוסק בנתונים לא מובנים שיכולים להיות בצורה של מערכים, מבנים מקוננים או JSON. אין מודל או פורמט של הנתונים. משתמשים יכולים לחקור מידע נוסף על ידי ניווט בקישור.

נתוני החלפה

סוג נתונים זה מאחסן גם תווים. עם זאת, האורך מוגבל. Amazon Redshift מאפשר ליהוק של נתוני VARBYTE לכל סוג מספר שלם או נתוני סוג תו. כדי לקבל מידע נוסף על סוג נתונים זה, עקוב אחר הקישור למטה.

זה כל מה שיש לאמזון Redshift וסוגי הנתונים שבהם היא תומכת.

סיכום

Amazon Redshift הוא שירות AWS שבצורתו הבסיסית משרת את המטרה של מחסן נתונים אבל הוא פתרון חזק מאוד ואופייני לניתוח וחיזוי. מאמר זה דן ב- Redshift ובסוגי הנתונים שבהם היא תומכת. סוגי נתונים אלה הוסברו בקצרה יחד עם המאפיינים שלהם.