Ποιος πρέπει να εργαστεί στην Επιστήμη δεδομένων και από πού να ξεκινήσετε

Σήμερα, οι ειδικοί της Επιστήμης Δεδομένων χρειάζονται σχεδόν σε όλους τους τομείς της επιχείρησης. Δεν είναι μόνο οικονομικό

ή εταιρείες πληροφορικής. Οι επιστήμονες δεδομένων έχουν ζήτηση στο μάρκετινγκ, τις πωλήσεις, την ανάπτυξη προϊόντων, τις αποφάσεις διαχείρισης, τις προβλέψεις κίνησης και τη διασφάλιση της ασφάλειας σύνθετων τεχνολογικών συστημάτων.

Η ζήτηση για ειδικούς στην επιστήμη των δεδομένων είναι διαφορετικήΤα προσόντα αυξάνονται κάθε χρόνο. Σύμφωνα με το MADE Big Data Academy από το Mail.ru Group και την πύλη προσλήψεων HeadHunter, το 2019 υπήρχαν 1,4 φορές περισσότερες κενές θέσεις στον τομέα της ανάλυσης δεδομένων σε σύγκριση με το 2018. Και ο αριθμός των κενών θέσεων στον τομέα της μηχανικής μάθησης έχει αυξηθεί 1,3 φορές.

Τα κέρδη των επιστημόνων δεδομένων αυξάνονται επίσης. Σύμφωνα με την HH.ru, ακόμη και ένας νεαρός στη Ρωσία λαμβάνει περίπου 120 χιλιάδες ρούβλια, ενώ ένας αναλυτής επιχειρήσεων μπορεί ήδη να υπολογίζει σε 170 χιλιάδες ρούβλια και περισσότερα, και ένας μεγάλος αναλυτής δεδομένων - από 200 χιλιάδες ρούβλια.

Ποιος έχει ζήτηση και γιατί;

Τις περισσότερες φορές στη Ρωσία αναζητούν επιστήμονες δεδομένωνχρηματοοικονομικές εταιρείες και εταιρείες πληροφορικής. Και η πιο κοινή απαίτηση για τους αιτούντες είναι η γνώση της γλώσσας προγραμματισμού Python. Εμφανίζεται στο 45% των θέσεων εργασίας στην επιστήμη των δεδομένων και σχεδόν στις μισές (51%) στη μηχανική μάθηση.

Φυσικά, αυξάνεται και ο αριθμός των επιστημόνων δεδομένων. Σύμφωνα με το HH.ru, 246 ειδικοί στην ανάλυση δεδομένων και 47 ειδικοί μηχανικής μάθησης δημοσιεύουν τα βιογραφικά τους κάθε μήνα.

Ο κατάλογος των απαιτήσεων από τους αιτούντες περιλαμβάνει επίσης:

  • γνώση της SQL?
  • κατοχή εξόρυξης δεδομένων (Data Mining) ·
  • αυτοπεποίθηση γνώση των μαθηματικών στατιστικών ·
  • ικανότητα εργασίας με μεγάλα δεδομένα ·
  • κατοχή C ++, Git, Linux.

Ταυτόχρονα, περίπου το 65% των κενών θέσεων στον τομέα της ανάλυσηςΤα δεδομένα και το 50% των κενών θέσεων ειδικών στον τομέα της μηχανικής μάθησης βρίσκονται στη Μόσχα. Η Αγία Πετρούπολη κατατάσσεται δεύτερη στη Ρωσία (15% και 18% αντίστοιχα). Φυσικά, οι αιτούντες εργασία συγκεντρώνονται κυρίως στις δύο πρωτεύουσες. Αλλά σήμερα, για να παρακολουθήσετε εκπαίδευση, δεν είναι απαραίτητο να μετακινηθείτε κάπου, αλλά να εργαστείτε σε απομακρυσμένη μορφή, στο outsourcing, γίνεται ήδη μια νέα μορφή για την οργάνωση της ροής εργασίας.

Πού να σπουδάσετε για έναν επιστήμονα δεδομένων και τι χρειάζεται για αυτό;

Υπάρχουν αρκετές προσεγγίσεις στη μάθησηεπιστήμονας δεδομένων. Ένα από αυτά είναι πιο κλασικό, για να μπείτε σε ένα πανεπιστήμιο σε περιοχές πληροφορικής. Αυτό μπορεί επίσης να γίνει στο εξωτερικό. Για παράδειγμα, η μελέτη για μεταπτυχιακό στην Επιστήμη Δεδομένων σε ένα αμερικανικό πανεπιστήμιο μπορεί να σας κοστίσει ένα πολύ εντυπωσιακό ποσό: από 30 χιλιάδες έως 120 χιλιάδες $. Ακόμα και τα διαδικτυακά μαθήματα σε αυτήν την ειδικότητα σε ξένα πανεπιστήμια κοστίζουν τουλάχιστον 9 χιλιάδες δολάρια. Υπάρχουν εκείνοι που δεν είναι έτοιμοι ξοδεύετε για την εκπαίδευσή σας σε τέτοια κλίμακα, διότι αυτά τα κόστη πρέπει να αντισταθμιστούν, αλλά αυτό δεν θα συμβεί αμέσως. Για παράδειγμα, η επιστήμονας δεδομένων Rebecca Vickery, η οποία εργάζεται στον τομέα αυτό για 10 χρόνια, δημιούργησε το δικό της πρόγραμμα, σύμφωνα με το οποίο σπούδασε ανεξάρτητα την Επιστήμη Δεδομένων. Αυτή η προσέγγιση έχει επίσης τα μειονεκτήματά της: έλλειψη ανατροφοδότησης και υποστήριξης από έναν μέντορα ή δάσκαλο, απόσταση από την ομάδα, εργασία μόνη και, τέλος, πολλοί θεωρούν ότι αυτή η διαδικασία μάθησης είναι βαρετή.

Μια άλλη επιλογή είναι η διαδικτυακή εκπαίδευση στοεξειδικευμένες ψηφιακές σχολές όπως το SkillFactory. Οι μαθητές εκεί δεν διδάσκονται μόνο ένα σύνολο τεχνικών και τεχνικών, αλλά επίσης διδάσκονται να μαθαίνουν. Επιπλέον, κάθε μαθητής θα έχει έναν μέντορα που θα παρέχει υποστήριξη και βοήθεια, και όλη η εργασία που γίνεται στη μαθησιακή διαδικασία δεν μπορεί μόνο να χρησιμοποιηθεί ως χαρτοφυλάκιο. Ενώ εξακολουθεί να είναι μαθητής του SkillFactory, ο μελλοντικός επιστήμονας δεδομένων εισέρχεται στη βιομηχανία της κοινότητας - αυτό όχι μόνο βοηθά στην εύρεση εργασίας, αλλά και στην επικοινωνία με συναδέλφους, για να μοιραστούν εμπειρίες. Το διαδικτυακό σχολείο είναι πεπεισμένο ότι δεν αρκεί απλώς να μάθετε νέες τεχνολογίες - πρέπει να αποκτήσετε νέες προσεγγίσεις και νέους τρόπους σκέψης. Και είναι δύσκολο να το αντιμετωπίσουμε μόνο του. Επομένως, όλοι οι μαθητές αλληλοενημερώνονται, ανταλλάσσουν κώδικα, βοηθούν στην εύρεση σφαλμάτων και μοιράζονται προβλήματα και πραγματικές περιπτώσεις.

Τι πρέπει να μπορεί να κάνει ένας Junior Data Scientist:

  • χρήση βασικών αλγοριθμικών κατασκευών και δομών δεδομένων Python για το σχεδιασμό αλγορίθμων.
  • οπτικοποιήστε δεδομένα χρησιμοποιώντας Pandas, Matplotlib, Seaborne.
  • δημιουργία μοντέλων βιομηχανικής ποιότητας χρησιμοποιώντας κλασική μηχανική μάθηση και νευρωνικά δίκτυα για την επίλυση προβλημάτων Επιστήμης Δεδομένων.
  • αξιολογεί την ποιότητα του μοντέλου (ακρίβεια / ανάκληση) ·
  • ενσωμάτωση της λύσης στην παραγωγή και τις επιχειρήσεις εν γένει ·
  • συνεργαστείτε με αποθήκες δεδομένων διαφορετικών τύπων.
  • συνεργαστείτε με μεγάλα εργαλεία ανάλυσης δεδομένων.
  • λήψη δεδομένων από πηγές ιστού ή μέσω API ·
  • εφαρμόζουν μεθόδους μαθηματικής ανάλυσης, γραμμικής άλγεβρας, στατιστικών και θεωρίας πιθανότητας για την επεξεργασία δεδομένων.

Εάν αυτές οι δεξιότητες σας φαίνονται πολύ δύσκολες, τότε μπορείτε να παρακολουθήσετε τα μαθήματα Data Scientist Profession.

Ποιος είναι επιστήμονας δεδομένων και τι πρέπει να μπορεί να κάνει;

Στον πυρήνα της, η Επιστήμη δεδομένων είναι η επόμενη"Εξελικτικό" βήμα της ανθρωπότητας στην εργασία με δεδομένα. Νωρίτερα μαθηματικοί και στατιστικοί έλυσαν παρόμοια προβλήματα. Τώρα, με την έλευση της τεχνητής νοημοσύνης, η βελτιστοποίηση και η επιστήμη των υπολογιστών έχουν εισέλθει στις μεθόδους ανάλυσης δεδομένων, πράγμα που σημαίνει ότι μια νέα προσέγγιση για την εξεύρεση λύσεων με βάση τα δεδομένα έχει γίνει πολύ πιο αποτελεσματική από τις προηγούμενες "αναλογικές" μεθόδους.

Η δουλειά ενός επιστήμονα δεδομένων ξεκινά με τη συλλογήμεγάλα σύνολα δεδομένων: δομημένα και όχι. Στη συνέχεια μετατρέπονται σε μορφή που είναι ευανάγνωστη. Το επόμενο στάδιο: οπτικοποίηση και εργασία με στατιστικά. Μηχανική και βαθιά μάθηση, ανάλυση πιθανοτήτων, προγνωστικά μοντέλα και νευρωνικά δίκτυα χρησιμοποιούνται ως αναλυτικές μέθοδοι.

Πέντε βάσεις για έναν επιστήμονα δεδομένων

  • Η Τεχνητή Νοημοσύνη (AI) είναι μια περιοχήαφιερωμένο στη δημιουργία ευφυών συστημάτων που λειτουργούν και λειτουργούν όπως οι άνθρωποι. Το AI σχετίζεται με τον παρόμοιο στόχο της χρήσης υπολογιστών για την κατανόηση της ανθρώπινης νοημοσύνης, αλλά δεν περιορίζεται απαραίτητα σε βιολογικά εύλογες μεθόδους. Τα ευφυή συστήματα που υπάρχουν σήμερα έχουν πολύ στενούς τομείς εφαρμογής. Για παράδειγμα, προγράμματα που μπορούν να νικήσουν ένα άτομο στο σκάκι δεν μπορούν να απαντήσουν σε ερωτήσεις.
  • Μηχανική εκμάθηση -δημιουργία εργαλείου για την εξαγωγή γνώσεων από δεδομένα. Τα μοντέλα ML εκπαιδεύονται σε δεδομένα ανεξάρτητα ή σε στάδια: εκπαίδευση με εκπαιδευτικό σε δεδομένα που προετοιμάζονται από ένα άτομο και χωρίς δάσκαλο - εργάζονται με αυθόρμητα, θορυβώδη δεδομένα.
  • Βαθιά μάθηση -δημιουργία πολυεπίπεδων νευρωνικών δικτύων σε περιοχές όπου απαιτείται πιο προηγμένη ή ταχύτερη ανάλυση και η παραδοσιακή μηχανική μάθηση αποτυγχάνει. Το "Βάθος" παρέχεται από μια σειρά από κρυμμένα στρώματα νευρώνων στο δίκτυο που εκτελούν μαθηματικούς υπολογισμούς.
  • Big Data - συνεργασία με το μεγάλοόγκος συχνά μη δομημένων δεδομένων. Η ιδιαιτερότητα της σφαίρας είναι τα εργαλεία και τα συστήματα που μπορούν να αντέξουν σε υψηλά φορτία.
  • Επιστήμη δεδομένων - σεο πυρήνας της περιοχής είναι η ενδυνάμωση των συνόλων δεδομένων, η οπτικοποίηση, η συλλογή ιδεών και η λήψη αποφάσεων βάσει αυτών των δεδομένων. Οι αναλυτές δεδομένων χρησιμοποιούν διάφορες μεθόδους μηχανικής μάθησης και Big Data: υπολογιστικό νέφος, εργαλεία για τη δημιουργία ενός εικονικού περιβάλλοντος ανάπτυξης και πολλά άλλα.

Όπως κάθε άλλο επάγγελμα, κατέχοντας τα ΔεδομέναΗ επιστήμη ξεκινά με τα βασικά - τη μελέτη των μαθηματικών, της γραμμικής άλγεβρας και, φυσικά, των στατιστικών. Για μια σοβαρή κατανόηση της Επιστήμης Δεδομένων, ένας μελλοντικός ειδικός θα χρειαστεί ένα πραγματικό πανεπιστημιακό μάθημα στη θεωρία πιθανότητας (συμπεριλαμβανομένου του λογισμού). Ευτυχώς, σήμερα τέτοιο υλικό είναι εύκολο να βρεθεί στο Διαδίκτυο ή ακόμη και να εγγραφείτε για ένα εξάμηνο στα καλύτερα πανεπιστήμια της Ρωσίας στην πλατφόρμα Open Education. Ή ακολουθήστε το πλήρες μάθημα Επιστήμης Δεδομένων στο SkillFactory, όπου οι βασικές γνώσεις θα είναι το πρώτο βήμα στην απόκτηση ενός νέου επαγγέλματος. Η μαθηματική γνώση είναι πρωτίστως σημαντική για την ανάλυση των αποτελεσμάτων της εφαρμογής αλγορίθμων επεξεργασίας δεδομένων. Φυσικά, υπάρχουν ισχυροί μηχανικοί στη μηχανική μάθηση χωρίς τέτοια εκπαίδευση. Αλλά αυτές είναι κυρίως σπάνιες περιπτώσεις.

Το δεύτερο βήμα για να γίνει επιστήμονας δεδομένων είναι ο προγραμματισμός. Αρκεί να μάθεις τουλάχιστον μία γλώσσα, έχοντας μάθει όλες τις αποχρώσεις της σύνταξής της. Όπως αναφέρθηκε παραπάνω, μία από τις πιο απαιτούμενες γλώσσες είναι η Python.

Μηχανική μάθηση - το τρίτο συστατικόεπάγγελμα επιστημόνων δεδομένων, όταν δεν χρειάζεται πλέον να γράφει οδηγίες για τους υπολογιστές να εκτελούν συγκεκριμένες εργασίες. Το ML αποτελείται από τρεις κύριες μορφές: εποπτευόμενη μάθηση, μάθηση χωρίς επίβλεψη και μάθηση ενίσχυσης. Μπορείτε να διαβάσετε περισσότερα για κάθε τύπο εκπαίδευσης στο μεγάλο μας υλικό με τον καθηγητή Jan Lekun.

Και τέλος, το τελευταίο βήμα είναι η Εξόρυξη Δεδομένων (ανάλυσηδεδομένα) και οπτικοποίηση δεδομένων, η οποία είναι μια σημαντική ερευνητική διαδικασία και περιλαμβάνει την ανάλυση κρυφών μοντέλων δεδομένων σύμφωνα με διάφορες επιλογές για τη μετάφραση σε χρήσιμες πληροφορίες που συλλέγονται και σχηματίζονται σε αποθήκες δεδομένων για τη διευκόλυνση επιχειρηματικών αποφάσεων που έχουν σχεδιαστεί για τη μείωση του κόστους και την αύξηση του εισοδήματος.

Παρά το γεγονός ότι η εκπαίδευση μπορεί να αποκτηθεί στομάλλον σύντομα χρονικά διαστήματα, ένας επιστήμονας δεδομένων πρέπει να επιβεβαιώνει τα προσόντα του τακτικά, λαμβάνοντας ιδιαίτερα εξειδικευμένα μαθήματα, συμμετέχοντας σε hackathons, ανοιχτούς διαγωνισμούς και κατά την αναζήτηση στην εργασία. Η ανεξάρτητη επιβεβαίωση των προσόντων σας θα είναι πλεονέκτημα. Για παράδειγμα, το προηγμένο προφίλ στο Kaggle, το οποίο διαθέτει σύστημα κατάταξης. Μπορείτε να πάτε από αρχάριους σε grandmaster. Για επιτυχημένη συμμετοχή σε διαγωνισμούς, δημοσίευση σεναρίων και συζητήσεων, λαμβάνετε πόντους που αυξάνουν την βαθμολογία σας. Επιπλέον, ο ιστότοπος σημειώνει σε ποιους διαγωνισμούς συμμετείχατε και ποια είναι τα αποτελέσματά σας.

Εφαρμόστε

Δείτε επίσης:

Δείτε πού πετάει το Perseverance rover τώρα

Συμπτώματα κοροναϊού σε παιδιά. Σε τι πρέπει να προσέξετε;

Οι αστρονόμοι βλέπουν πώς μια μαύρη τρύπα εκπέμπει ακτίνες γάμμα που τρεμοπαίζουν