Oggi gli specialisti di Data Science sono necessari in quasi tutte le aree di business. Non è solo una questione finanziaria
La domanda di specialisti in scienza dei dati è diversale qualifiche crescono ogni anno. Secondo la MADE Big Data Academy di Mail.ru Group e il portale di reclutamento HeadHunter, nel 2019 ci sono stati 1,4 volte più posti vacanti nel campo dell'analisi dei dati rispetto al 2018. E il numero di posti vacanti nel campo dell'apprendimento automatico è cresciuto di 1,3 volte.
Crescono anche i guadagni dei data scientist. Secondo HH.ru, anche un giovane in Russia riceve circa 120 mila rubli, mentre un analista aziendale può già contare su 170 mila rubli e più, e un analista di big data - da 200 mila rubli.

Chi è richiesto e perché?
Molto spesso in Russia cercano data scientistsocietà finanziarie e IT. E il requisito più comune per i candidati è la conoscenza del linguaggio di programmazione Python. Si verifica nel 45% dei lavori nella scienza dei dati e in quasi la metà (51%) nell'apprendimento automatico.
Naturalmente cresce anche il numero dei data scientist. Secondo HH.ru, 246 specialisti di analisi dei dati e 47 specialisti di machine learning pubblicano i loro curriculum ogni mese.
L'elenco dei requisiti dei candidati include anche:
- conoscenza di SQL;
- possesso di data mining (Data Mining);
- conoscenza sicura della statistica matematica;
- capacità di lavorare con i big data;
- possesso di C ++, Git, Linux.
Inoltre, circa il 65% dei posti vacanti nel campo dell'analisii dati e il 50% dei posti vacanti di specialisti nel campo dell'apprendimento automatico si trovano a Mosca. San Pietroburgo è al secondo posto in Russia (rispettivamente 15% e 18%). Naturalmente, anche le persone in cerca di lavoro sono concentrate soprattutto nelle due capitali. Ma oggi, per sottoporsi alla formazione, non è necessario spostarsi da qualche parte, ma lavorare in modalità remota, in outsourcing, sta già diventando un nuovo formato per organizzare il flusso di lavoro.
Dove studiare per un data scientist e cosa è necessario per questo?
Esistono diversi approcci all'apprendimento inscienziato dei dati. Uno di questi è più classico, per entrare in un'università in aree IT. Questo può essere fatto anche all'estero. Ad esempio, studiare per un Master in Data Science presso un'università americana può costarti una cifra davvero impressionante: da $ 30mila a $ 120mila. Anche i corsi online presso università straniere in questa specialità costano almeno $ 9mila. C'è chi non è pronto spendi per la tua formazione su una tale scala, perché tali costi devono ancora essere recuperati, ma questo non accadrà immediatamente. Ad esempio, la data scientist Rebecca Vickery, che lavora in questo campo da 10 anni, ha creato il suo programma, secondo il quale ha studiato in modo indipendente Data Science. Questo approccio ha anche i suoi svantaggi: mancanza di feedback e supporto da parte di un mentore o insegnante, distanza dal team, lavoro da soli e, infine, molti trovano noioso questo processo di apprendimento.
Un'altra opzione è la formazione online inscuole digitali specializzate come SkillFactory. Agli studenti non solo viene insegnata una serie di tecniche e tecniche, ma viene anche insegnato a imparare. Inoltre, ogni studente avrà un mentore che fornisce supporto e assistenza e tutto il lavoro svolto nel processo di apprendimento non può essere utilizzato solo come portfolio. Mentre è ancora uno studente di SkillFactory, il futuro data scientist entra nella comunità del settore: questo non solo aiuta a trovare un lavoro, ma anche a comunicare con i colleghi e condividere esperienze. La scuola online è convinta che non sia sufficiente imparare solo nuove tecnologie: è necessario padroneggiare nuovi approcci e nuovi modi di pensare. Ed è difficile affrontarlo da soli. Pertanto, tutti gli studenti si scambiano feedback, si scambiano codice, aiutano a trovare errori e condividono problemi e casi reali.
Cosa dovrebbe essere in grado di fare un Junior Data Scientist:
- utilizzare costrutti algoritmici di base e strutture dati Python per progettare algoritmi;
- visualizzare i dati utilizzando Pandas, Matplotlib, Seaborne;
- creare modelli di qualità industriale utilizzando l'apprendimento automatico classico e le reti neurali per risolvere i problemi di Data Science;
- valutare la qualità del modello (precisione / richiamo);
- integrare la soluzione nella produzione e nel business in generale;
- lavorare con data warehouse di diverso tipo;
- lavorare con strumenti di analisi dei big data;
- ricevere dati da fonti web o tramite API;
- applicare metodi di analisi matematica, algebra lineare, statistica e teoria della probabilità per l'elaborazione dei dati.
Se queste competenze ti sembrano molto difficili, allora puoi seguire i corsi di Professione Data Scientist.
Chi è un data scientist e cosa dovrebbe essere in grado di fare?
Al centro, la scienza dei dati è il prossimoFase "evolutiva" dell'umanità nel lavorare con i dati. I primi matematici e statistici hanno risolto problemi simili. Ora, con l'avvento dell'intelligenza artificiale, l'ottimizzazione e l'informatica sono entrate nei metodi di analisi dei dati, il che significa che un nuovo approccio alla ricerca di soluzioni basate sui dati è diventato molto più efficace dei precedenti metodi "analogici".
Il lavoro di un data scientist inizia con la raccoltabig data set: strutturati e non. Quindi vengono convertiti in un formato di facile lettura. La fase successiva: visualizzazione e lavoro con le statistiche. Come metodi analitici vengono utilizzati machine e deep learning, analisi probabilistica, modelli predittivi e reti neurali.

Cinque basi per un data scientist
- L'intelligenza artificiale (AI) è un'areadedicato alla creazione di sistemi intelligenti che funzionano e si comportano come persone. L'intelligenza artificiale è correlata all'obiettivo simile di utilizzare i computer per comprendere l'intelligenza umana, ma non è necessariamente limitata a metodi biologicamente plausibili. I sistemi intelligenti esistenti oggi hanno aree di applicazione molto ristrette. Ad esempio, i programmi che possono battere una persona a scacchi non possono rispondere alle domande.
- Apprendimento automatico -creare uno strumento per estrarre la conoscenza dai dati. I modelli ML sono addestrati sui dati in modo indipendente o per fasi: formazione con un insegnante sui dati preparati da una persona e senza un insegnante - lavorando con dati spontanei e rumorosi.
- Apprendimento approfondito -costruire reti neurali multistrato in aree in cui è richiesta un'analisi più avanzata o più rapida e il tradizionale apprendimento automatico fallisce. La "profondità" è fornita da una serie di strati nascosti di neuroni nella rete che eseguono calcoli matematici.
- Big Data: lavorare con bigvolume di dati spesso non strutturati. La specificità della sfera sono gli strumenti e i sistemi in grado di sopportare carichi elevati.
- Scienza dei dati - inil fulcro dell'area è l'empowerment dei set di dati, la visualizzazione, la raccolta di idee e il processo decisionale basato su tali dati. I data scientist utilizzano alcuni metodi di machine learning e Big Data: cloud computing, strumenti per creare un ambiente di sviluppo virtuale e molto altro ancora.
Come qualsiasi altra professione, padroneggiare i datiLa scienza inizia dalle basi: lo studio della matematica, dell'algebra lineare e, ovviamente, della statistica. Per una comprensione seria della scienza dei dati, un futuro specialista avrà bisogno di un vero corso universitario in teoria della probabilità (incluso il calcolo). Fortunatamente, oggi tali materiali sono facili da trovare su Internet o addirittura iscriversi per un semestre nelle migliori università in Russia sulla piattaforma Open Education. Oppure segui il corso completo di Data Science presso SkillFactory, dove la conoscenza di base sarà il primo passo per padroneggiare una nuova professione. La conoscenza matematica è principalmente importante per analizzare i risultati dell'applicazione di algoritmi di elaborazione dei dati. Naturalmente, ci sono ingegneri forti nel machine learning senza tale istruzione. Ma questi sono per lo più casi rari.
Il secondo passo per diventare un data scientist è la programmazione. Basta imparare almeno una lingua, avendo padroneggiato tutte le sfumature della sua sintassi. Come accennato in precedenza, uno dei linguaggi più richiesti è Python.
Apprendimento automatico: il terzo componenteprofessione di data scientist, quando non ha più bisogno di scrivere istruzioni per i computer per eseguire determinati compiti. Il ML si compone di tre forme principali: apprendimento supervisionato, apprendimento senza supervisione e apprendimento per rinforzo. Puoi leggere di più su ogni tipo di formazione nel nostro ampio materiale con il professor Jan Lekun.
Infine, l'ultimo passaggio è il Data Mining (analisidata) e la visualizzazione dei dati, che è un processo di ricerca importante e comprende l'analisi di modelli di dati nascosti secondo varie opzioni per la traduzione in informazioni utili che vengono raccolte e formate nei data warehouse per facilitare le decisioni aziendali volte a ridurre i costi e aumentare il reddito.
Nonostante il fatto che l'istruzione possa essere ottenuta inIn tempi piuttosto brevi, un data scientist deve confermare le sue qualifiche regolarmente, frequentando corsi altamente specializzati, partecipando a hackathon, concorsi aperti e durante la ricerca sul lavoro. La conferma indipendente delle tue qualifiche sarà un vantaggio. Ad esempio, il profilo avanzato su Kaggle, che ha un sistema di classificazione. Puoi passare da novizio a grande maestro. Per la partecipazione di successo a concorsi, la pubblicazione di script e discussioni, ricevi punti che aumentano la tua valutazione. Inoltre, il sito annota a quali concorsi hai partecipato e quali sono i tuoi risultati.
applicare
Vedi anche:
Guarda dove sta volando il rover Perseverance
Sintomi di coronavirus nei bambini. A cosa dovresti prestare attenzione?
Gli astronomi vedono come un buco nero emette raggi gamma tremolanti