Wer soll in Data Science arbeiten und wo soll ich anfangen?

Heutzutage werden in nahezu allen Unternehmensbereichen Data-Science-Spezialisten benötigt. Es geht nicht nur ums Finanzielle

oder IT-Unternehmen. Datenwissenschaftler sind in den Bereichen Marketing, Vertrieb, Produktentwicklung, Managemententscheidungen, Verkehrsvorhersagen und Gewährleistung der Sicherheit komplexer Technologiesysteme gefragt.

Die Nachfrage nach Data Science-Spezialisten ist unterschiedlichDie Qualifikationen wachsen von Jahr zu Jahr. Laut der MADE Big Data Academy der Mail.ru Group und dem Rekrutierungsportal HeadHunter gab es 2019 im Bereich der Datenanalyse 1,4-mal mehr offene Stellen als 2018. Und die Zahl der offenen Stellen im Bereich des maschinellen Lernens hat sich um das 1,3-fache erhöht.

Auch die Einnahmen von Datenwissenschaftlern steigen. Laut HH.ru, sogar ein Junior in Russland erhält ungefähr 120.000 Rubel, während ein Geschäftsanalyst bereits mit 170.000 Rubel und mehr rechnen kann, und ein Big-Data-Analyst - von 200.000 Rubel.

Wer ist gefragt und warum?

Meistens suchen sie in Russland DatenwissenschaftlerFinanz- und IT-Unternehmen. Die häufigste Voraussetzung für Bewerber sind Kenntnisse der Programmiersprache Python. Es tritt in 45% der Jobs in der Datenwissenschaft und in fast der Hälfte (51%) des maschinellen Lernens auf.

Natürlich wächst auch die Zahl der Datenwissenschaftler. Laut HH.ru veröffentlichen jeden Monat 246 Spezialisten für Datenanalyse und 47 Spezialisten für maschinelles Lernen ihre Lebensläufe.

Die Liste der Anforderungen der Antragsteller umfasst auch:

  • Kenntnisse in SQL;
  • Besitz von Data Mining (Data Mining);
  • sichere Kenntnisse der mathematischen Statistik;
  • Fähigkeit, mit Big Data zu arbeiten;
  • Besitz von C ++, Git, Linux.

Gleichzeitig rund 65% der offenen Stellen im Bereich AnalyseDaten und 50% der offenen Stellen von Spezialisten auf dem Gebiet des maschinellen Lernens befinden sich in Moskau. St. Petersburg liegt in Russland an zweiter Stelle (15% bzw. 18%). Natürlich konzentrieren sich Arbeitssuchende auch hauptsächlich auf die beiden Hauptstädte. Um sich heute einer Schulung zu unterziehen, ist es jedoch nicht erforderlich, irgendwohin zu ziehen, sondern in einem Remote-Format zu arbeiten. Das Outsourcing wird bereits zu einem neuen Format für die Organisation des Workflows.

Wo kann man für einen Datenwissenschaftler studieren und was wird dafür benötigt?

Es gibt verschiedene Ansätze zum Lernen inDatenwissenschaftler. Eine davon ist klassischer, um eine Universität in IT-Bereichen zu besuchen. Dies kann auch im Ausland erfolgen. Zum Beispiel kann ein Studium für einen Master in Data Science an einer amerikanischen Universität einen sehr beeindruckenden Betrag kosten: von 30.000 bis 120.000 US-Dollar. Selbst Online-Kurse an ausländischen Universitäten in diesem Fachgebiet kosten mindestens 9.000 US-Dollar. Es gibt diejenigen, die noch nicht bereit sind Geben Sie Ihre Schulungen in einem solchen Umfang aus, da diese Kosten noch erstattet werden müssen. Dies wird jedoch nicht sofort geschehen. Zum Beispiel hat die Datenwissenschaftlerin Rebecca Vickery, die seit 10 Jahren auf diesem Gebiet tätig ist, ein eigenes Programm erstellt, nach dem sie unabhängig Data Science studierte. Dieser Ansatz hat auch seine Nachteile: Mangel an Feedback und Unterstützung durch einen Mentor oder Lehrer, Distanz zum Team, allein arbeiten und schließlich finden viele diesen Lernprozess langweilig.

Eine weitere Option ist das Online-Training inspezialisierte digitale Schulen wie SkillFactory. Dort lernen die Schüler nicht nur eine Reihe von Techniken und Techniken, sondern auch das Lernen. Darüber hinaus hat jeder Schüler einen Mentor, der Unterstützung und Unterstützung bietet, und alle im Lernprozess geleisteten Arbeiten können nicht nur als Portfolio verwendet werden. Während er noch ein Student von SkillFactory ist, tritt der zukünftige Datenwissenschaftler in die Industrie ein - dies hilft nicht nur, einen Job zu finden, sondern auch mit Kollegen zu kommunizieren und Erfahrungen auszutauschen. Die Online-Schule ist überzeugt, dass es nicht ausreicht, nur neue Technologien zu erlernen - Sie müssen neue Ansätze und Denkweisen beherrschen. Und es ist schwierig, alleine damit fertig zu werden. Daher geben sich alle Schüler gegenseitig Feedback, tauschen Code aus, helfen bei der Suche nach Fehlern und teilen Probleme und reale Fälle.

Was ein Junior Data Scientist tun sollte:

  • Verwenden Sie grundlegende algorithmische Konstrukte und Python-Datenstrukturen, um Algorithmen zu entwerfen.
  • Visualisieren Sie Daten mit Pandas, Matplotlib, Seaborne;
  • Erstellen industrieller Qualitätsmodelle unter Verwendung klassischer maschineller Lern- und neuronaler Netze zur Lösung von Data Science-Problemen;
  • Bewertung der Qualität des Modells (Präzision / Rückruf);
  • Integration der Lösung in Produktion und Geschäft im Allgemeinen;
  • mit Data Warehouses verschiedener Typen arbeiten;
  • mit Big-Data-Analysetools arbeiten;
  • Daten von Webquellen oder über API empfangen;
  • Anwendung von Methoden der mathematischen Analyse, linearen Algebra, Statistik und Wahrscheinlichkeitstheorie für die Datenverarbeitung.

Wenn Ihnen diese Fähigkeiten sehr schwierig erscheinen, können Sie die Kurse zum Beruf des Data Scientist belegen.

Wer ist Datenwissenschaftler und was sollte er können?

Im Kern kommt Data Science als nächstes"Evolutionärer" Schritt der Menschheit bei der Arbeit mit Daten. Frühere Mathematiker und Statistiker lösten ähnliche Probleme. Mit dem Aufkommen der künstlichen Intelligenz sind nun Optimierung und Informatik in die Methoden der Datenanalyse eingetreten, was bedeutet, dass ein neuer Ansatz zur Suche nach Lösungen auf Datenbasis viel effektiver geworden ist als die bisherigen "analogen" Methoden.

Die Arbeit eines Datenwissenschaftlers beginnt mit dem SammelnBig Data Sets: strukturiert und nicht. Dann werden sie in ein leicht lesbares Format konvertiert. Die nächste Stufe: Visualisierung und Arbeit mit Statistiken. Maschinelles und tiefes Lernen, probabilistische Analysen, Vorhersagemodelle und neuronale Netze werden als Analysemethoden verwendet.

Fünf Grundlagen für einen Datenwissenschaftler

  • Künstliche Intelligenz (KI) ist ein Bereichwidmet sich der Schaffung intelligenter Systeme, die wie Menschen funktionieren und handeln. KI hängt mit dem ähnlichen Ziel zusammen, Computer zum Verständnis der menschlichen Intelligenz zu verwenden, ist jedoch nicht unbedingt auf biologisch plausible Methoden beschränkt. Intelligente Systeme, die heute existieren, haben sehr enge Anwendungsbereiche. Zum Beispiel können Programme, die eine Person beim Schach schlagen können, keine Fragen beantworten.
  • Maschinelles Lernen -Erstellen eines Tools zum Extrahieren von Wissen aus Daten. ML-Modelle werden unabhängig oder schrittweise an Daten trainiert: Training mit einem Lehrer an Daten, die von einer Person und ohne Lehrer erstellt wurden - Arbeiten mit spontanen, verrauschten Daten.
  • Tiefes Lernen -Aufbau mehrschichtiger neuronaler Netze in Bereichen, in denen fortgeschrittenere oder schnellere Analysen erforderlich sind und traditionelles maschinelles Lernen fehlschlägt. "Tiefe" wird durch eine Reihe von verborgenen Schichten von Neuronen im Netzwerk bereitgestellt, die mathematische Berechnungen durchführen.
  • Big Data - Arbeiten mit BigVolumen oft unstrukturierter Daten. Die Besonderheit der Kugel sind die Werkzeuge und Systeme, die hohen Belastungen standhalten können.
  • Data Science - inDer Kern des Bereichs ist die Stärkung von Datensätzen, die Visualisierung, das Sammeln von Ideen und die Entscheidungsfindung auf der Grundlage dieser Daten. Datenwissenschaftler verwenden einige der Methoden des maschinellen Lernens und der Big Data: Cloud Computing, Tools zum Erstellen einer virtuellen Entwicklungsumgebung und vieles mehr.

Wie jeder andere Beruf Daten beherrschenDie Wissenschaft beginnt mit den Grundlagen - dem Studium der Mathematik, der linearen Algebra und natürlich der Statistik. Für ein ernsthaftes Verständnis der Datenwissenschaft benötigt ein zukünftiger Spezialist einen echten Universitätskurs in Wahrscheinlichkeitstheorie (einschließlich Kalkül). Glücklicherweise sind solche Materialien heute im Internet leicht zu finden oder können sich sogar für ein Semester an den besten Universitäten Russlands auf der Open Education-Plattform anmelden. Oder besuchen Sie den vollständigen Data Science-Kurs bei SkillFactory, wo Grundkenntnisse der erste Schritt zur Beherrschung eines neuen Berufs sind. Mathematische Kenntnisse sind in erster Linie wichtig, um die Ergebnisse der Anwendung von Datenverarbeitungsalgorithmen zu analysieren. Natürlich gibt es starke Ingenieure im maschinellen Lernen ohne eine solche Ausbildung. Dies sind jedoch meist seltene Fälle.

Der zweite Schritt, um Datenwissenschaftler zu werden, ist das Programmieren. Es reicht aus, mindestens eine Sprache zu lernen, nachdem alle Nuancen ihrer Syntax beherrscht wurden. Wie oben erwähnt, ist Python eine der gefragtesten Sprachen.

Maschinelles Lernen - die dritte KomponenteBeruf als Datenwissenschaftler, wenn er keine Anweisungen mehr für Computer schreiben muss, um bestimmte Aufgaben auszuführen. ML besteht aus drei Hauptformen: überwachtes Lernen, unbeaufsichtigtes Lernen und verstärkendes Lernen. Weitere Informationen zu jeder Art von Schulung finden Sie in unserem umfangreichen Material mit Professor Jan Lekun.

Und schließlich ist der letzte Schritt Data Mining (AnalyseDaten) und Datenvisualisierung, ein wichtiger Forschungsprozess, der die Analyse versteckter Datenmodelle gemäß verschiedenen Optionen zur Umsetzung in nützliche Informationen umfasst, die in Data Warehouses gesammelt und gebildet werden, um Geschäftsentscheidungen zur Kostensenkung und Einkommenssteigerung zu erleichtern.

Trotz der Tatsache, dass Bildung in erhalten werden kannIn relativ kurzer Zeit muss ein Datenwissenschaftler seine Qualifikationen regelmäßig bestätigen, indem er hochspezialisierte Kurse besucht, an Hackathons, offenen Wettbewerben teilnimmt und bei der Arbeit sucht. Eine unabhängige Bestätigung Ihrer Qualifikationen ist von Vorteil. Zum Beispiel das erweiterte Profil auf Kaggle, das ein Rangsystem hat. Sie können vom Anfänger zum Großmeister gehen. Für die erfolgreiche Teilnahme an Wettbewerben, die Veröffentlichung von Skripten und Diskussionen erhalten Sie Punkte, die Ihre Bewertung erhöhen. Darüber hinaus wird auf der Website angegeben, an welchen Wettbewerben Sie teilgenommen haben und welche Ergebnisse Sie erzielen.

Übernehmen

Siehe auch:

Sehen Sie, wohin der Perseverance Rover jetzt fliegt

Symptome des Coronavirus bei Kindern. Worauf sollten Sie achten?

Astronomen sehen, wie ein Schwarzes Loch flackernde Gammastrahlen aussendet