من الذي يعمل في علوم البيانات ومن أين تبدأ

اليوم، هناك حاجة إلى متخصصين في علوم البيانات في جميع مجالات الأعمال تقريبًا. الأمر لا يتعلق بالمال فقط

أو شركات تكنولوجيا المعلومات. علماء البيانات مطلوبون في التسويق والمبيعات وتطوير المنتجات وقرارات الإدارة والتنبؤات المرورية وضمان أمن أنظمة التكنولوجيا المعقدة.

يختلف الطلب على متخصصي علوم البياناتالمؤهلات تتزايد كل عام. وفقًا لأكاديمية البيانات الكبيرة MADE من مجموعة Mail.ru وبوابة التوظيف HeadHunter ، في عام 2019 ، كان هناك 1.4 ضعف الوظائف الشاغرة في مجال تحليل البيانات مقارنة بعام 2018. وزاد عدد الوظائف الشاغرة في مجال التعلم الآلي 1.3 مرة.

تتزايد أيضًا أرباح علماء البيانات. بحسب سمو.ru ، حتى المبتدئ في روسيا يتلقى حوالي 120 ألف روبل ، بينما يمكن لمحلل الأعمال الاعتماد بالفعل على 170 ألف روبل وأكثر ، ومحلل البيانات الضخمة - من 200 ألف روبل.

من هو المطلوب ولماذا؟

في أغلب الأحيان في روسيا يبحثون عن علماء البياناتالشركات المالية وشركات تكنولوجيا المعلومات. والشرط الأكثر شيوعًا للمتقدمين هو معرفة لغة برمجة Python. يحدث في 45٪ من الوظائف في علم البيانات وحوالي النصف (51٪) في التعلم الآلي.

وبطبيعة الحال، فإن عدد علماء البيانات آخذ في الازدياد أيضًا. وفقًا لموقع HH.ru، يقوم 246 متخصصًا في تحليل البيانات و47 متخصصًا في التعلم الآلي بنشر سيرتهم الذاتية كل شهر.

تشمل قائمة المتطلبات من المتقدمين أيضًا:

  • معرفة SQL.
  • معرفة التنقيب في البيانات (تنقيب البيانات) ؛
  • معرفة واثقة من الإحصاءات الرياضية.
  • القدرة على العمل مع البيانات الضخمة.
  • حيازة C ++ ، Git ، Linux.

في نفس الوقت حوالي 65٪ من الشواغر في مجال التحليلالبيانات و 50 ٪ من الوظائف الشاغرة للمتخصصين في مجال التعلم الآلي موجودة في موسكو. تحتل سانت بطرسبرغ المرتبة الثانية في روسيا (15٪ و 18٪ على التوالي). بالطبع ، يتركز المتقدمون أيضًا بشكل أساسي في العاصمتين. ولكن اليوم ، من أجل الخضوع للتدريب ، ليس من الضروري الانتقال إلى مكان ما ، ولكن العمل في شكل بعيد ، على الاستعانة بمصادر خارجية ، أصبح بالفعل تنسيقًا جديدًا لتنظيم عملية العمل.

أين تدرس لعالم بيانات وما هو المطلوب لذلك؟

هناك عدة طرق للتعلم فيعالم البيانات. واحد منهم هو أكثر كلاسيكية ، للدخول إلى جامعة في مجالات تكنولوجيا المعلومات. يمكن القيام بذلك في الخارج أيضًا. على سبيل المثال ، يمكن أن تكلفك الدراسة للحصول على درجة الماجستير في علوم البيانات في إحدى الجامعات الأمريكية مبلغًا رائعًا للغاية: من 30 ألف دولار إلى 120 ألف دولار. وحتى الدورات عبر الإنترنت في هذا التخصص في الجامعات الأجنبية تكلف ما لا يقل عن 9 آلاف دولار. وهناك من ليسوا مستعدين تنفق على تدريبك بهذا الحجم ، لأن هذه التكاليف لا تزال بحاجة إلى تعويض ، لكن هذا لن يحدث على الفور. على سبيل المثال ، أنشأت عالمة البيانات Rebecca Vickery ، التي تعمل في هذا المجال لمدة 10 سنوات ، برنامجها الخاص ، والذي بموجبه درست علم البيانات بشكل مستقل. هذا النهج له أيضًا عيوبه: نقص التغذية الراجعة والدعم من المرشد أو المعلم ، البعد عن الفريق ، العمل بمفرده ، وأخيراً ، يجد الكثيرون عملية التعلم هذه مملة.

خيار آخر هو التدريب عبر الإنترنت فيالمدارس الرقمية المتخصصة مثل SkillFactory. لا يتم تعليم الطلاب هناك مجموعة من التقنيات والتقنيات فحسب ، بل يتم تعليمهم أيضًا للتعلم. بالإضافة إلى ذلك ، سيكون لكل طالب موجه يقدم الدعم والمساعدة ، ولا يمكن استخدام جميع الأعمال المنجزة في عملية التعلم كمحفظة فقط. بينما لا يزال طالبًا في SkillFactory ، يتم تضمين عالم البيانات المستقبلي في مجتمع الصناعة - وهذا لا يساعد فقط في العثور على وظيفة ، ولكن أيضًا للتواصل مع الزملاء ومشاركة الخبرات. المدرسة عبر الإنترنت مقتنعة بأنه لا يكفي مجرد تعلم تقنيات جديدة - بل يجب إتقان أساليب جديدة وطرق جديدة في التفكير. ومن الصعب التعامل معها بمفردها. لذلك ، يقدم جميع الطلاب ملاحظات لبعضهم البعض ويتبادلون التعليمات البرمجية ويساعدون في العثور على الأخطاء ومشاركة المهام والحالات الحقيقية

ما يجب على عالم البيانات المبتدئ القيام به:

  • استخدام التركيبات الخوارزمية الأساسية وهياكل بيانات Python لتصميم الخوارزميات ؛
  • تصور البيانات باستخدام Pandas و Matplotlib و Seaborne ؛
  • إنشاء نماذج جودة صناعية باستخدام التعلم الآلي الكلاسيكي والشبكات العصبية لحل مشاكل علوم البيانات ؛
  • تقييم جودة النموذج (الدقة / الاسترجاع) ؛
  • دمج الحل في الإنتاج والأعمال بشكل عام ؛
  • العمل مع مستودعات البيانات بأنواعها المختلفة ؛
  • العمل بأدوات تحليل البيانات الضخمة ؛
  • تلقي البيانات من مصادر الويب أو عبر API ؛
  • تطبيق طرق التحليل الرياضي والجبر الخطي والإحصاء ونظرية الاحتمالات لمعالجة البيانات.

إذا كانت هذه المهارات تبدو صعبة للغاية بالنسبة لك، فيمكنك الالتحاق بدورات مهنة عالم البيانات.

من هو عالم البيانات وماذا يجب أن يكون قادرًا على فعله؟

في جوهرها ، علم البيانات هو التاليخطوة "تطورية" للإنسانية في العمل مع البيانات. علماء الرياضيات والإحصاء الأوائل حلوا مشاكل مماثلة. الآن ، مع ظهور الذكاء الاصطناعي ، دخل التحسين وعلوم الكمبيوتر في أساليب تحليل البيانات ، مما يعني أن النهج الجديد لإيجاد حلول تعتمد على البيانات أصبح أكثر فاعلية بكثير من الأساليب "التناظرية" السابقة.

تبدأ وظيفة عالم البيانات بالتجميعمجموعات البيانات الضخمة: منظمة وليس. ثم يتم تحويلها إلى تنسيق يسهل قراءته. المرحلة التالية: التصور والعمل مع الإحصائيات. يتم استخدام التعلم الآلي والعميق والتحليل الاحتمالي والنماذج التنبؤية والشبكات العصبية كطرق تحليلية.

خمس قواعد لعالم البيانات

  • الذكاء الاصطناعي (AI) هو مجالمكرسة لإنشاء أنظمة ذكية تعمل وتتصرف مثل الناس. يرتبط الذكاء الاصطناعي بالهدف المماثل المتمثل في استخدام أجهزة الكمبيوتر لفهم الذكاء البشري ، ولكنه لا يقتصر بالضرورة على الأساليب المعقولة بيولوجيًا. الأنظمة الذكية الموجودة اليوم لها مجالات تطبيق ضيقة جدًا. على سبيل المثال ، البرامج التي يمكنها التغلب على أي شخص في لعبة الشطرنج لا يمكنها الإجابة عن الأسئلة.
  • التعلم الالي -إنشاء أداة لاستخراج المعرفة من البيانات. يتم تدريب نماذج ML على البيانات بشكل مستقل أو على مراحل: التدريب مع المعلم على البيانات التي أعدها شخص وبدون معلم - العمل مع البيانات التلقائية الصاخبة.
  • تعلم عميق -بناء شبكات عصبية متعددة الطبقات في المناطق التي تتطلب تحليلًا أكثر تقدمًا أو أسرع ويفشل التعلم الآلي التقليدي. يتم توفير "العمق" من خلال عدد من الطبقات المخفية من الخلايا العصبية في الشبكة التي تقوم بإجراء حسابات رياضية.
  • البيانات الضخمة - العمل معحجم البيانات غير المهيكلة في كثير من الأحيان. خصوصية الكرة هي الأدوات والأنظمة التي يمكنها تحمل الأحمال العالية.
  • علم البيانات - فيجوهر المنطقة هو تمكين مجموعات البيانات ، والتصور ، وجمع الأفكار واتخاذ القرار بناءً على تلك البيانات. يستخدم محللو البيانات عددًا من تقنيات التعلم الآلي والبيانات الضخمة: الحوسبة السحابية ، وأدوات إنشاء بيئة تطوير افتراضية ، وغير ذلك الكثير.

مثل أي مهنة أخرى ، إتقان البياناتيبدأ العلم بالأساسيات - دراسة الرياضيات والجبر الخطي وبالطبع الإحصاء. من أجل فهم جاد لعلوم البيانات ، سيحتاج أخصائي المستقبل إلى دورة جامعية حقيقية في نظرية الاحتمالات (بما في ذلك حساب التفاضل والتكامل). لحسن الحظ ، يسهل اليوم العثور على مثل هذه المواد على الإنترنت أو حتى الاشتراك لفصل دراسي واحد في أفضل الجامعات في روسيا على منصة التعليم المفتوح. أو خذ دورة كاملة في علوم البيانات في SkillFactory ، حيث ستكون المعرفة الأساسية هي الخطوة الأولى في إتقان مهنة جديدة. المعرفة الرياضية مهمة في المقام الأول من أجل تحليل نتائج تطبيق خوارزميات معالجة البيانات. بالطبع ، هناك مهندسون أقوياء في التعلم الآلي بدون مثل هذا التعليم. لكن هذه حالات نادرة في الغالب.

الخطوة الثانية لتصبح عالم بيانات هي البرمجة. يكفي أن تتعلم لغة واحدة على الأقل ، بعد أن أتقنت كل الفروق الدقيقة في تركيبها. كما ذكرنا سابقًا ، تعد لغة بايثون واحدة من أكثر اللغات شيوعًا.

التعلم الآلي - المكون الثالثمهنة عالم البيانات ، عندما لم يعد بحاجة إلى كتابة تعليمات لأجهزة الكمبيوتر لأداء مهام معينة. يحتوي ML على ثلاثة أشكال رئيسية: التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف والتعلم المعزز. يمكنك قراءة المزيد حول كل نوع من أنواع التدريب في مادتنا الكبيرة مع الأستاذ جان ليكون.

وأخيرًا ، الخطوة الأخيرة هي استخراج البيانات (التحليلالبيانات) وتصور البيانات ، وهي عملية بحث مهمة وتتضمن تحليل نماذج البيانات المخفية وفقًا للخيارات المختلفة للترجمة إلى معلومات مفيدة يتم جمعها وتشكيلها في مستودعات البيانات لتسهيل قرارات الأعمال المصممة لتقليل التكاليف وزيادة الدخل.

على الرغم من حقيقة أنه يمكن الحصول على التعليم فيالأطر الزمنية القصيرة إلى حد ما ، يحتاج عالم البيانات إلى تأكيد مؤهلاته بانتظام ، واجتياز دورات متخصصة للغاية ، والمشاركة في الهاكاثون ، والمسابقات المفتوحة ، وعند البحث في العمل. سيكون التأكيد المستقل لمؤهلاتك ميزة. على سبيل المثال ، ملف التعريف المتقدم على Kaggle ، الذي يحتوي على نظام تصنيف. يمكنك أن تنتقل من مبتدئ إلى كبير معلم. للمشاركة الناجحة في المسابقات ونشر النصوص والمناقشات ، تحصل على نقاط تزيد من تقييمك. بالإضافة إلى ذلك ، يلاحظ الموقع المسابقات التي شاركت فيها وما هي نتائجك.

تطبق

انظر أيضا:

شاهد أين تطير عربة المثابرة الآن

أعراض الفيروس التاجي عند الأطفال. ما يجب الانتباه إليه؟

يرى علماء الفلك كيف يصدر الثقب الأسود أشعة جاما الوامضة