רשימה של 10 הספרים והתיאורים הטובים ביותר במדעי הנתונים עבור הגנרליסט

Rsymh Sl 10 Hsprym Whty Wrym Htwbym Bywtr Bmd Y Hntwnym Bwr Hgnrlyst



Data Science הוא תחום המחקר שמטפל בכמויות עצומות של נתונים באמצעות שיטות, תהליכים, אלגוריתמים ומערכות מדעיות כדי למצוא את הדפוסים הבלתי נראים, להפיק מידע משמעותי, לקבל החלטות עסקיות בחברות, וגם להשתמש במוסדות שאינם עסקיים. המוסדות שאינם עסקיים כוללים תעשיות של שירותי בריאות, משחקים, זיהוי תמונות, מערכות המלצות, לוגיסטיקה, זיהוי הונאה (בנקאים ומוסדות פיננסיים), חיפוש באינטרנט, זיהוי דיבור, פרסום ממוקד, תכנון מסלולי תעופה ומציאות רבודה. Data Science הוא תת-קבוצה של בינה מלאכותית. הנתונים המשמשים לניתוח יכולים להגיע ממקורות רבים ושונים ומוצגים בפורמטים שונים. חלק מנתוני המקור עשויים להיות סטנדרטיים; אחרים עשויים שלא להיות סטנדרטיים.

במילים אחרות, נעשה שימוש במתודולוגיות שונות לאיסוף הנתונים (ריבוי של דטום). לאחר מכן, ידע (מסקנות חשובות) מופק מהנתונים שנאספו. תוך כדי כך, לאחר איסוף הנתונים, נעשה המחקר עליהם (נתונים) כדי לקבל נתונים חדשים (תוצאות) שמהם נפתרות הבעיות.







Data Science כדיסציפלינה (ראשית) קיימת ברמת התואר הראשון והשני באוניברסיטה. עם זאת, רק מעט אוניברסיטאות בעולם מציעות את מדעי הנתונים בתואר ראשון או שני. ברמת תואר ראשון, הסטודנט מסיים תואר במדעי נתונים. זה כמו תואר למטרה כללית. ברמת תואר שני, הסטודנט יוצא עם תואר שני במדעי נתונים, בהתמחות בניתוח נתונים, הנדסת נתונים או כמדען נתונים.



זה עשוי להפתיע את הקורא ואולי למרבה הצער, שלמידת מכונה, מידול, סטטיסטיקה, תכנות ומאגרי מידע הם ידע מוקדם ללימוד מדעי הנתונים ברמת תואר ראשון למרות העובדה שהם קורסים אוניברסיטאיים מכובדים בפני עצמם, הנלמדים ב דיסציפלינות אחרות ברמת תואר ראשון או תואר שני. עם זאת, כאשר סטודנט הולך לאוניברסיטה ללמוד Data Science ברמת התואר, כל הקורסים הללו עדיין ילמדו, לצד או לפני הקורסים המתאימים, ל-Data Science.



מדעי הנתונים לתואר ראשון או התמחויותיו כמו ניתוח נתונים, הנדסת נתונים או כמדען נתונים עדיין בפיתוח; למרות שהם הגיעו לשלב שהם מיושמים בתעשיות לאחר שלמדו (באוניברסיטה). מדע נתונים הוא דיסציפלינה חדשה יחסית, בסך הכל.





זכור שתחילה עליך להיות כללי לפני שתהפוך למומחה. ההבחנות בין תוכניות מומחים עדיין אינן ברורות. ההבחנות בין התכנית הכללית לתכנית המתמחה אינן ברורות עדיין.

מכיוון שמדעי הנתונים הם דיסציפלינה חדשה יחסית, הספרים שנקבעו במסמך זה מבוססים על סיקור תוכן ולא על פדגוגיה (עד כמה הספר מלמד). והם מיועדים לתכנית לתואר ראשון (גנרלי). ישנם קורסים כלליים שונים.



הרשימה

לפרטים נוספים ורכישה אפשרית בכרטיס אשראי ניתן היפר קישור לכל אחד מהספרים. אף אחד מהספרים לא מכסה את כל הקורסים הכלליים.

מתמטיקה חיונית למדעי הנתונים: חשבון, סטטיסטיקה, תורת הסתברות ואלגברה לינארית

נכתב על ידי: אדריאן ז'אן

  • מוציא לאור: אדריאן ז'אן
  • תאריך פרסום: לאחר 30 בספטמבר 2020
  • שפה: אנגלית
  • מספר דפים: יותר מ-400

ניתן לראות את התוכן של ספר זה כקורס מתמטיקה למדעי הנתונים. למרות שלא מומלץ ללמוד מדעי נתונים בעצמו, בוגר תיכון שרוצה ללמוד מדעי נתונים בעצמו צריך להתחיל עם ספר זה.

תוכן: חשבון; סטטיסטיקה והסתברות; אלגברה ליניארית; סקלרים ווקטורים; מטריצות וטנזורים; טווח, תלות ליניארית ושינוי מרחב; מערכות משוואות ליניאריות; וקטורים וערכים עצמיים; פירוק ערך יחיד.

https://www.essentialmathfordatascience.com/

מדריך עם השכל הישר למבני נתונים ואלגוריתמים: העלה רמה של כישורי התכנות שלך / מהדורה 2

נכתב על ידי: ג'יי וונגרו

  • הוצאה: מדף ספרים פרגמטי
  • תאריך פרסום: 15 בספטמבר 2020
  • שפה: אנגלית
  • מידות: 7.5 x 1.25 x 9.25 אינץ'
  • מספר דפים: ‎508

ספר זה עוסק באלגוריתמים ומבני נתונים המשמשים ב-Data Science. בהנחה שמישהו לומד מדעי נתונים בעצמו לאחר סיום התיכון, אז זה הספר הבא לקרוא לאחר קריאת ספר המתמטיקה הקודם. התוכניות לדוגמה ניתנות ב-JavaScript, Python ו-Ruby.

תוכן: מדוע מבני נתונים חשובים; מדוע אלגוריתמים חשובים; הו כן! סימון O גדול; האצת הקוד שלך עם Big O; אופטימיזציה של קוד עם ובלי O Big; אופטימיזציה לתרחישים אופטימיים; Big O בקוד יומיומי; בדיקת מידע מהירה עם טבלאות Hash; יצירת קוד אלגנטי עם ערימות ותורים; Recursely Recurse עם Recursion; לימוד כתיבה רקורסיבית; תכנות דינמי; אלגוריתמים רקורסיביים למהירות; מבני נתונים מבוססי צמתים; להאיץ את כל הדברים עם עצי חיפוש בינאריים; שמירה על סדר העדיפויות שלך ישר עם ערימות; זה לא כואב לנסות; חיבור הכל עם גרפים; התמודדות עם אילוצי שטח; טכניקות לאופטימיזציה של קוד

מדעי נתונים חכמים יותר: להצליח עם פרויקטים של נתונים ו-AI ברמה ארגונית / 1 רחוב עֲרִיכָה

נכתב על ידי: ניל פישמן, קול סטרייקר וגריידי בוץ'

  • מוציא לאור: ווילי
  • תאריך פרסום: 14 באפריל, 2020
  • שפה: אנגלית
  • מספר דפים: ‎286

תוכן: טיפוס על סולם הבינה המלאכותית; מסגור חלק I: שיקולים עבור ארגונים המשתמשים בבינה מלאכותית; מסגור חלק ב': שיקולים לעבודה עם נתונים ובינה מלאכותית; מבט לאחור על Analytics: יותר מפטיש אחד; מבט קדימה על Analytics: לא הכל יכול להיות מסמר; התייחסות למשמעת מבצעית בסולם הבינה המלאכותית; מקסום השימוש בנתונים שלך: להיות מונחה ערך; הערכת נתונים באמצעות ניתוח סטטיסטי ואפשרות גישה משמעותית; בנייה לטווח ארוך; סוף מסע: IA עבור AI.

למידת מכונה: פרספקטיבה הסתברותית (סדרת חישוב אדפטיבי ולמידת מכונה) מהדורה מאוירת

נכתב על ידי: קווין פ.מרפי

  • מוציא לאור: The MIT Press
  • תאריך פרסום: 24 באוגוסט 2012
  • שפה: אנגלית
  • מידות: 8.25 x 1.79 x 9.27 אינץ'
  • מספר דפים: ‎1104

ספר זה טוב למתחילים. שוב, כמו כל שאר הספרים שנקבעו במסמך זה, ספר זה אינו מכסה את כל הדרוש לתכנית הגנרליסטית, אשר, למרבה הצער, עדיין לא הסתיימה (גם תוכניות המומחים עדיין לא הושלמו). המתחיל הטיפוסי כאן הוא בוגר תיכון עם עבר במתמטיקה ומדעי המחשב.

תוכן: מבוא (למידה מכונה: מה ולמה?, למידה ללא פיקוח, כמה מושגי יסוד בלמידת מכונה); הִסתַבְּרוּת; מודלים גנרטיביים לנתונים בדידים; דגמים גאוסים; סטטיסטיקה בייסיאנית; סטטיסטיקה תדירותית; רגרסיה לינארית; רגרסיה לוגיסטית; מודלים ליניאריים מוכללים והמשפחה האקספוננציאלית; מודלים גרפיים מכוונים (רשתות בייס); מודלים של תערובת ואלגוריתם EM; מודלים לינאריים סמויים; מודלים ליניאריים דלילים; גרעינים; תהליכים גאוסים; מודלים של תפקוד בסיס אדפטיבי; מרקוב ודגמי מרקוב נסתרים; דגמי חלל מדינה; מודלים גרפיים לא מכוונים (שדות אקראיים של מרקוב); הסקה מדויקת עבור מודלים גרפיים; הסקה וריאציונית; מסקנות וריאציות יותר; מסקנות מונטה קרלו; מסקנות של רשת מרקוב מונטה קרלו (MCMC); אשכולות; למידת מבנה מודל גרפי; מודלים משתנים סמויים לנתונים בדידים; למידה עמוקה.

מדע נתונים לעסקים: מה שאתה צריך לדעת על כריית נתונים וחשיבה אנליטית / מהדורה ראשונה

נכתב על ידי: טום פאוסט ופוסטר פרובוסט

  • מוציא לאור: O'Reilly Media
  • תאריך פרסום: 17 בספטמבר 2013
  • שפה: אנגלית
  • מידות: 7 x 0.9 x 9.19 אינץ'
  • מספר דפים: ‎413

תוכן: חשיבה נתונים-אנליטית; בעיות עסקיות ופתרונות מדעי נתונים; מבוא למידול חזוי: מתאם לפילוח מפוקח; התאמת דגם לנתונים; התאמת יתר והימנעות ממנה; דמיון, שכנים ואשכולות; חשיבה אנליטית החלטה I: מהו מודל טוב?; הדמיית ביצועי מודל; ראיות והסתברויות; ייצוג וכריית טקסט; חשיבה אנליטית החלטה II: לקראת הנדסה אנליטית; משימות וטכניקות אחרות של מדעי הנתונים; מדע נתונים ואסטרטגיה עסקית; סיכום.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

סטטיסטיקה מעשית עבור מדעני נתונים: 50+ מושגים חיוניים באמצעות R ו-Python / מהדורה 2

נכתב על ידי: פיטר ברוס, אנדרו ברוס ופיטר גדק

  • מוציא לאור: O'Reilly Media
  • תאריך פרסום: 2 ביוני 2020
  • שפה: אנגלית
  • מידות: 7 x 0.9 x 9.1 אינץ'
  • מספר דפים: ‎368

תוכן: ניתוח נתונים חקרני, התפלגות נתונים ודגימה, ניסויים סטטיסטיים ובדיקת מובהקות, רגרסיה וחיזוי, סיווג, למידת מכונה סטטיסטית, למידה ללא פיקוח.

ספר למה: המדע החדש של סיבה ותוצאה

נכתב על ידי: יהודה פרל, דנה מקנזי

  • הוצאה: ספר יסוד
  • תאריך פרסום: 15 במאי 2018
  • שפה: אנגלית
  • מידות: 6.3 x 1.4 x 9.4 אינץ'
  • מספר דפים: ‎432

בעוד ספרי Data Science רבים משתמשים בתעשייה העסקית הטהורה להמחשה, ספר זה משתמש בתעשייה הרפואית ובתחומים אחרים להמחשה.

תוכן: מבוא: Mind over Data; סולם הסיבתיות; מבוקרנים ועד חזירי ניסיונות: בראשית של מסקנות סיבתיות; מראיות לסיבות: הכומר בייס פוגש את מר הולמס; מבלבל ומבטל: או, להרוג את המשתנה האורב; הדיון מלא העשן: ניקוי האוויר; פרדוקסים למכביר!; מעבר להתאמה: כיבוש ההר התערבות; קונטרה-עובדות: עולמות כרייה שיכולים היו להיות; גישור: החיפוש אחר מנגנון; ביג דאטה, בינה מלאכותית והשאלות הגדולות.

בנה קריירה במדעי הנתונים

נכתב על ידי: אמילי רובינסון וג'קלין נוליס

  • מוציא לאור: מאנינג
  • תאריך פרסום: 24 במרץ 2020
  • שפה: אנגלית
  • מידות: 7.38 x 0.8 x 9.25 אינץ'
  • מספר דפים: ‎354

תוכן: תחילת העבודה עם מדעי הנתונים; מציאת משרת מדעי הנתונים שלך; התמקמות במדעי הנתונים; גדל בתפקיד מדעי הנתונים שלך.

https://www.manning.com/books/build-a-career-in-data-science

מדע נתונים עבור Dummies / מהדורה 2

נכתב על ידי: ליליאן פירסון

  • מוציא לאור: For Dummies
  • תאריך פרסום: 6 במרץ 2017
  • שפה אנגלית
  • מידות: 7.3 x 1 x 9 אינץ'
  • מספר דפים: ‎384

ספר זה מניח שלקורא כבר יש את הידע המתמטיקה והתכנות הנדרש מראש.

תוכן:  לעטוף את הראש סביב מדעי הנתונים; חקירת צינורות ותשתית הנדסת נתונים; יישום תובנות מונעות נתונים לעסקים ולתעשייה; למידת מכונה: למידה מנתונים עם המכונה שלך; מתמטיקה, הסתברות ומידול סטטיסטי; שימוש באשכולות לחלוקת נתונים; דוגמנות עם מופעים; בניית מודלים המפעילים התקני אינטרנט של הדברים; בהתאם לעקרונות של עיצוב הדמיית נתונים; שימוש ב-D3.js להדמיית נתונים; יישומים מבוססי אינטרנט לעיצוב ויזואליזציה; בחינת שיטות עבודה מומלצות בעיצוב לוח מחוונים; יצירת מפות מנתונים מרחביים; שימוש ב-Python למדעי נתונים; שימוש בקוד פתוח R למדעי הנתונים; שימוש ב-SQL במדעי הנתונים; עוסק ב-Data Science עם Excel ו-Knime; מדעי הנתונים בעיתונאות: מסמרים את חמשת ה-Ws (ו-H); התעמקות במדעי נתונים סביבתיים; מדע נתונים להגברת צמיחה במסחר אלקטרוני; שימוש במדעי הנתונים כדי לתאר ולחזות פעילות פלילית; עשרה משאבים פנומנליים לנתונים פתוחים; עשרה כלים ויישומים למדעי הנתונים בחינם.

כרייה של מערכי נתונים מסיביים / 3 מחקר ופיתוח עֲרִיכָה

נכתב על ידי: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • מוציא לאור: הוצאת אוניברסיטת קיימברידג'
  • תאריך פרסום: 13 בפברואר 2020
  • שפה אנגלית
  • מידות: 7 x 1 x 9.75 אינץ'
  • מספר דפים: ‎565

ספר זה גם מניח שלקורא כבר יש את הידע המתמטיקה והתכנות הנדרש מראש.

תוכן: כריית נתונים; MapReduce וערימת התוכנה החדשה; אלגוריתמים באמצעות MapReduce; מציאת פריטים דומים; כריית זרמי נתונים; ניתוח קישורים; ערכות פריטים תכופות; אשכולות; פרסום באינטרנט; מערכות המלצות; כריית גרפים של רשת חברתית; צמצום מימדיות; למידת מכונה בקנה מידה גדול.

סיכום

ההבחנות בין תוכניות מומחים עדיין אינן ברורות. גם ההבחנות בין התוכנית הכללית לתוכנית המומחים עדיין לא ברורות. עם זאת, לאחר קריאת רשימת הספרים הנתונה, הקורא יהיה בעמדה להעריך טוב יותר את התפקידים המיוחדים של מנתח נתונים, הנדסת נתונים ומדען נתונים, ולאחר מכן להתקדם.