עם מי לעבוד במדעי נתונים ואיפה להתחיל

כיום, דרושים מומחי Data Science כמעט בכל תחומי העסקים. זה לא רק עניין פיננסי

או חברות IT. מדעני נתונים מבוקשים בשיווק, מכירות, פיתוח מוצרים, החלטות ניהול, תחזיות תעבורה והבטחת אבטחת מערכות טכנולוגיות מורכבות.

הביקוש למומחים במדעי הנתונים שונההכישורים הולכים וגדלים מדי שנה. על פי ה- MADE Big Data Academy מקבוצת Mail.ru ופורטל הגיוס HeadHunter, בשנת 2019 היו פי 1.4 יותר משרות פנויות בתחום ניתוח הנתונים בהשוואה לשנת 2018. ומספר המשרות הפנויות בתחום למידת מכונה גדל פי 1.3.

הרווחים של מדעני הנתונים גדלים גם הם. על פי HH.ru, אפילו זוטר ברוסיה מקבל כ -120 אלף רובל, בעוד אנליסט עסקי יכול כבר לסמוך על 170 אלף רובל ויותר, ואנליסט ביג דאטה - מ -200 אלף רובל.

למי מבוקש ומדוע?

לרוב ברוסיה הם מחפשים מדעני נתוניםחברות פיננסיות ו- IT. והדרישה הנפוצה ביותר עבור מועמדים היא הכרת שפת התכנות של פייתון. זה קורה ב 45% מהמשרות במדעי הנתונים וכמעט מחצית (51%) בלימוד מכונה.

כמובן שגם מספר מדעני הנתונים הולך וגדל. לפי HH.ru, 246 מומחי ניתוח נתונים ו-47 מומחי למידת מכונה מפרסמים את קורות החיים שלהם מדי חודש.

רשימת הדרישות מהמועמדים כוללת גם:

  • ידע ב- SQL;
  • החזקת כריית נתונים (Data Mining);
  • ידע בטוח בסטטיסטיקה מתמטית;
  • יכולת לעבוד עם נתונים גדולים;
  • החזקת C ++, Git, Linux.

במקביל, כ- 65% מהמשרות הפנויות בתחום הניתוחנתונים ו- 50% מהמשרות הפנויות של מומחים בתחום למידת מכונה נמצאים במוסקבה. סנט פטרסבורג נמצאת במקום השני ברוסיה (15% ו -18% בהתאמה). כמובן שגם מחפשי העבודה מרוכזים בעיקר בשתי הבירות. אך כיום, על מנת לעבור הכשרה, אין צורך לעבור לאנשהו, אלא לעבוד במתכונת מרוחקת, במיקור חוץ, כבר הופך לפורמט חדש לארגון זרימת העבודה.

היכן ללמוד אצל מדען נתונים ומה דרוש לשם כך?

ישנן מספר גישות ללמידהמדען נתונים. אחת מהן היא קלאסית יותר, להיכנס לאוניברסיטה בתחומי IT. ניתן לעשות זאת גם בחו"ל. לדוגמא, לימודים לתואר שני במדעי נתונים באוניברסיטה אמריקאית יכולים לעלות לכם סכום מרשים מאוד: מ -30 אלף דולר ל -120 אלף דולר. אפילו קורסים מקוונים באוניברסיטאות זרות במומחיות זו עולים לפחות 9 אלף דולר. יש כאלה שלא מוכנים הוצא על ההדרכה שלך בקנה מידה כזה, כי עדיין צריך להחזיר עלויות כאלה, אבל זה לא יקרה מיד. לדוגמה, מדענית הנתונים רבקה ויקרי, העובדת בתחום זה 10 שנים, יצרה תוכנית משלה, לפיה למדה באופן עצמאי מדעי נתונים. לגישה זו יש גם חסרונות: היעדר משוב ותמיכה ממנטור או מורה, מרחק מהצוות, עבודה לבד ולבסוף, רבים חושבים שתהליך למידה זה משעמם.

אפשרות נוספת היא אימונים מקוונים ב-בתי ספר דיגיטליים מיוחדים כגון SkillFactory. תלמידים שם מלמדים לא רק סט טכניקות וטכניקות, אלא גם מלמדים ללמוד. בנוסף, לכל תלמיד יהיה מנטור המספק תמיכה וסיוע, וכל העבודה שנעשתה בתהליך הלמידה לא יכולה לשמש רק כתיק עבודות. בעודו סטודנט של SkillFactory, מדען הנתונים העתידי נכנס לקהילת התעשייה - זה לא רק עוזר למצוא עבודה, אלא גם לתקשר עם עמיתים, לחלוק חוויות. בית הספר המקוון משוכנע שזה לא מספיק רק ללמוד טכנולוגיות חדשות - אתה צריך לשלוט בגישות חדשות ובדרכי חשיבה חדשות. וקשה להתמודד עם זה לבד. לכן, כל התלמידים נותנים זה לזה משוב, מחליפים קוד, עוזרים במציאת טעויות ומשתפים בעיות ומקרים אמיתיים.

מה מדען נתונים זוטר צריך להיות מסוגל לעשות:

  • להשתמש במבנים אלגוריתמיים בסיסיים ובמבני נתונים של פייתון לתכנון אלגוריתמים;
  • דמיין נתונים באמצעות פנדות, מטפלוטליב, מוטות בים;
  • ליצור מודלים באיכות תעשייתית באמצעות למידת מכונה קלאסית ורשתות עצביות כדי לפתור בעיות מדע הנתונים;
  • להעריך את איכות המודל (דיוק / ריקול);
  • לשלב את הפתרון בייצור ובעסקים בכלל;
  • לעבוד עם מחסני נתונים מסוגים שונים;
  • לעבוד עם כלים לניתוח נתונים גדולים;
  • לקבל נתונים ממקורות אינטרנט או דרך API;
  • ליישם שיטות ניתוח מתמטי, אלגברה לינארית, סטטיסטיקה ותורת ההסתברות לעיבוד נתונים.

אם הכישורים האלה נראים לך מאוד קשים, אז אתה יכול לקחת את הקורסים של מקצוע מדעני הנתונים.

מיהו מדעני נתונים ומה עליו להיות מסוגל לעשות?

בבסיסה, מדע הנתונים הוא הבאצעד "אבולוציוני" של האנושות בעבודה עם נתונים. מתמטיקאים וסטטיסטיקאים קודמים פתרו בעיות דומות. כעת, עם כניסתו של הבינה המלאכותית, האופטימיזציה ומדעי המחשב נכנסו לשיטות ניתוח הנתונים, מה שאומר שגישה חדשה למציאת פתרונות על בסיס נתונים הפכה ליעילה בהרבה משיטות ה"אנלוגיות "הקודמות.

תפקידו של מדען נתונים מתחיל באיסוףמערכי נתונים גדולים: מובנים ולא. ואז הם מומרים לפורמט קל לקריאה. השלב הבא: הדמיה ועבודה עם סטטיסטיקה. למידה מכונה ועמוקה, ניתוח הסתברותי, מודלים ניבוי ורשתות עצביות משמשים כשיטות אנליטיות.

חמישה בסיסים עבור מדען נתונים

  • בינה מלאכותית (AI) היא תחוםמוקדש ליצירת מערכות אינטליגנטיות הפועלות ופועלות כמו אנשים. AI קשור למטרה דומה של שימוש במחשבים להבנת האינטליגנציה האנושית, אך אינו מוגבל בהכרח לשיטות סבירות ביולוגית. מערכות חכמות הקיימות כיום כוללות אזורי יישום צרים מאוד. לדוגמה, תוכניות שיכולות לנצח אדם בשחמט אינן יכולות לענות על שאלות.
  • למידת מכונה -יצירת כלי להפקת ידע מנתונים. מודלים של ML מאומנים על נתונים באופן עצמאי או בשלבים: הכשרה עם מורה על נתונים שהכין אדם וללא מורה - עבודה עם נתונים ספונטניים ורועשים.
  • למידה עמוקה -בניית רשתות עצביות רב שכבתיות באזורים בהם נדרש ניתוח מתקדם יותר או מהיר יותר ולמידת מכונה מסורתית נכשלת. "עומק" מסופק על ידי מספר שכבות נסתרות של נוירונים ברשת המבצעים חישובים מתמטיים.
  • ביג דאטה - עבודה עם ביגנפח נתונים לעתים קרובות לא מובנים. הספציפיות של הכדור היא הכלים והמערכות העומדים בעומסים גבוהים.
  • מדע נתונים - בליבת האזור היא העצמה של מערכי נתונים, הדמיה, איסוף רעיונות וקבלת החלטות על בסיס נתונים אלה. מדעני נתונים משתמשים בכמה שיטות של למידת מכונה וביג דאטה: מחשוב ענן, כלים ליצירת סביבת פיתוח וירטואלית ועוד.

כמו כל מקצוע אחר, שליטה בנתוניםהמדע מתחיל ביסודות - לימוד מתמטיקה, אלגברה לינארית וכמובן סטטיסטיקה. לצורך הבנה רצינית של מדע הנתונים, מומחה עתידי יזדקק לקורס אוניברסיטאי אמיתי בתורת ההסתברות (כולל חשבון). למרבה המזל, כיום קל למצוא חומרים כאלה באינטרנט או אפילו להירשם לסמסטר אחד באוניברסיטאות הטובות ביותר ברוסיה בפלטפורמת החינוך הפתוח. או עברו קורס מלא במדעי הנתונים ב- SkillFactory, שם הידע הבסיסי יהיה הצעד הראשון בשליטה במקצוע חדש. ידע מתמטי חשוב בעיקר על מנת לנתח את התוצאות של יישום אלגוריתמים לעיבוד נתונים. כמובן שיש מהנדסים חזקים בלימוד מכונה ללא השכלה כזו. אך לרוב מדובר במקרים נדירים.

השלב השני בהפיכתו למדעני נתונים הוא תכנות. מספיק ללמוד לפחות שפה אחת, לאחר ששלטו בכל ניואנסים של התחביר שלה. כאמור לעיל, אחת השפות המבוקשות ביותר היא פייתון.

למידת מכונה - המרכיב השלישימקצוע מדעני הנתונים, כאשר הוא כבר לא צריך לכתוב הוראות למחשבים לביצוע משימות מסוימות. ל- ML שלוש צורות עיקריות: למידה מפוקחת, למידה ללא פיקוח ולמידה מחזקת. תוכלו לקרוא עוד על כל סוג הכשרה בחומר הגדול שלנו עם פרופסור יאן לקון.

ולבסוף, השלב האחרון הוא כריית נתונים (ניתוחנתונים) והדמיית נתונים, המהווה תהליך מחקר חשוב וכולל ניתוח מודלים של נתונים מוסתרים בהתאם לאפשרויות שונות לתרגום למידע שימושי שנאסף ומתגבש במחסני נתונים כדי להקל על החלטות עסקיות שנועדו להפחית עלויות ולהגדיל את ההכנסות.

למרות העובדה שניתן להשיג חינוך במסגרות זמן קצרות למדי, מדען נתונים צריך לאשר את כישוריו באופן קבוע, לוקח קורסים מיוחדים במיוחד, משתתף בהאקתונים, בתחרויות פתוחות ובחיפוש בעבודה. אישור עצמאי על כישוריכם יהווה יתרון. לדוגמא, הפרופיל המתקדם ב- Kaggle, בעל מערכת דרגות. אתה יכול לעבור מטירונות לגדולות. עבור השתתפות מוצלחת בתחרויות, פרסום תסריטים ודיונים, אתה מקבל נקודות המגדילות את הדירוג שלך. בנוסף, האתר מציין באילו תחרויות השתתפת ומה התוצאות שלך.

החל

ראה גם:

ראה לאן רודף ההתמדה טס עכשיו

תסמינים של נגיף קורונה אצל ילדים. למה כדאי לשים לב?

אסטרונומים רואים כיצד חור שחור פולט קרני גמא מהבהבות