Quem trabalhar em ciência de dados e por onde começar

Hoje, os especialistas em Ciência de Dados são necessários em quase todas as áreas de negócios. Não se trata apenas de finanças

ou empresas de TI. Os cientistas de dados são procurados em marketing, vendas, desenvolvimento de produtos, decisões de gerenciamento, previsões de tráfego e garantia da segurança de sistemas tecnológicos complexos.

A demanda por especialistas em ciência de dados é diferenteas qualificações estão crescendo a cada ano. De acordo com a MADE Big Data Academy do Mail.ru Group e o portal de recrutamento HeadHunter, em 2019 havia 1,4 vezes mais vagas na área de análise de dados em comparação com 2018. E o número de vagas na área de aprendizado de máquina cresceu 1,3 vezes.

Os ganhos dos cientistas de dados também estão crescendo. De acordo com HH.ru, mesmo um júnior na Rússia recebe cerca de 120 mil rublos, enquanto um analista de negócios já pode contar com 170 mil rublos e mais, e um analista de big data - de 200 mil rublos.

Quem está em demanda e por quê?

Na maioria das vezes, na Rússia, eles procuram cientistas de dadosfinanceiras e de TI. E o requisito mais comum para os candidatos é o conhecimento da linguagem de programação Python. Ocorre em 45% dos empregos em ciência de dados e quase metade (51%) em aprendizado de máquina.

É claro que o número de cientistas de dados também está crescendo. De acordo com HH.ru, 246 especialistas em análise de dados e 47 especialistas em aprendizado de máquina publicam seus currículos todos os meses.

A lista de requisitos dos candidatos também inclui:

  • conhecimento de SQL;
  • posse de mineração de dados (Data Mining);
  • conhecimento seguro de estatística matemática;
  • capacidade de trabalhar com big data;
  • posse de C ++, Git, Linux.

Ao mesmo tempo, cerca de 65% das vagas na área de análisedados e 50% das vagas de especialistas na área de aprendizado de máquina estão em Moscou. São Petersburgo ocupa o segundo lugar na Rússia (15% e 18%, respectivamente). É claro que os candidatos a emprego também se concentram principalmente nas duas capitais. Mas hoje, para fazer um treinamento, não é preciso ir para algum lugar, mas trabalhar à distância, na terceirização, já está se tornando um novo formato de organização do workflow.

Onde estudar para um cientista de dados e o que é necessário para isso?

Existem várias abordagens para aprender emcientista de dados. Um deles é mais clássico, para entrar em uma universidade nas áreas de TI. Isso também pode ser feito no exterior. Por exemplo, estudar para um Mestrado em Ciência de Dados em uma universidade americana pode custar-lhe uma quantia muito impressionante: de US $ 30 mil a US $ 120 mil. Mesmo os cursos online dessa especialidade em universidades estrangeiras custam pelo menos US $ 9 mil. Há quem não esteja pronto gaste em seu treinamento em tal escala, porque tais custos ainda precisam ser recuperados, mas isso não vai acontecer imediatamente. Por exemplo, a cientista de dados Rebecca Vickery, que trabalha nessa área há 10 anos, criou seu próprio programa, segundo o qual estudou ciência de dados de forma independente. Essa abordagem também tem suas desvantagens: falta de feedback e apoio de um mentor ou professor, distância da equipe, trabalhar sozinho e, finalmente, muitos acham esse processo de aprendizagem enfadonho.

Outra opção é o treinamento online emescolas digitais especializadas, como SkillFactory. Os alunos lá não apenas aprendem um conjunto de técnicas e técnicas, mas também aprendem. Além disso, cada aluno terá um mentor que dará suporte e assistência, e todo o trabalho realizado no processo de aprendizagem não poderá ser utilizado apenas como portfólio. Enquanto ainda estudante da SkillFactory, o futuro cientista de dados entra na comunidade do setor - isso não apenas ajuda a encontrar um emprego, mas também a se comunicar com colegas e compartilhar experiências. A escola online está convencida de que não basta apenas aprender novas tecnologias - você precisa dominar novas abordagens e novas maneiras de pensar. E é difícil lidar com isso sozinho. Portanto, todos os alunos trocam feedbacks, trocam códigos, ajudam a encontrar erros e compartilham problemas e casos reais.

O que um cientista de dados júnior deve ser capaz de fazer:

  • usar construções algorítmicas básicas e estruturas de dados Python para projetar algoritmos;
  • visualizar dados usando Pandas, Matplotlib, Seaborne;
  • criar modelos de qualidade industrial usando aprendizado de máquina clássico e redes neurais para resolver problemas de ciência de dados;
  • avaliar a qualidade do modelo (precisão / recall);
  • integrar a solução na produção e nos negócios em geral;
  • trabalhar com data warehouses de diferentes tipos;
  • trabalhar com ferramentas de análise de big data;
  • receber dados de fontes da web ou via API;
  • aplicar métodos de análise matemática, álgebra linear, estatística e teoria da probabilidade para processamento de dados.

Se essas habilidades parecem muito difíceis para você, você pode fazer os cursos de Profissão de Cientista de Dados.

Quem é um cientista de dados e o que ele deve ser capaz de fazer?

Basicamente, a ciência de dados é a próximaEtapa "evolutiva" da humanidade no trabalho com dados. Os primeiros matemáticos e estatísticos resolveram problemas semelhantes. Agora, com o advento da inteligência artificial, a otimização e a ciência da computação entraram nos métodos de análise de dados, o que significa que uma nova abordagem para encontrar soluções baseadas em dados tornou-se muito mais eficaz do que os métodos "analógicos" anteriores.

O trabalho de um cientista de dados começa com a coletaconjuntos de big data: estruturados e não. Em seguida, eles são convertidos em um formato fácil de ler. A próxima etapa: visualização e trabalho com estatísticas. Aprendizado de máquina e profundo, análise probabilística, modelos preditivos e redes neurais são usados ​​como métodos analíticos.

Cinco bases para um cientista de dados

  • Inteligência Artificial (IA) é uma áreadedicado a criar sistemas inteligentes que funcionam e agem como pessoas. A IA está relacionada ao objetivo semelhante de usar computadores para entender a inteligência humana, mas não está necessariamente limitada a métodos biologicamente plausíveis. Os sistemas inteligentes existentes hoje têm áreas de aplicação muito estreitas. Por exemplo, programas que podem derrotar uma pessoa no xadrez não podem responder a perguntas.
  • Aprendizado de máquina -criando uma ferramenta para extrair conhecimento de dados. Os modelos de ML são treinados em dados de forma independente ou em etapas: treinamento com um professor em dados preparados por uma pessoa e sem um professor - trabalhando com dados espontâneos e ruidosos.
  • Aprendizagem profunda -construir redes neurais multicamadas em áreas onde análises mais avançadas ou mais rápidas são necessárias e o aprendizado de máquina tradicional falha. A "profundidade" é fornecida por várias camadas ocultas de neurônios na rede que realizam cálculos matemáticos.
  • Big Data - trabalhando com grandevolume de dados frequentemente não estruturados. A especificidade da esfera são as ferramentas e sistemas que podem suportar altas cargas.
  • Ciência de Dados - emo núcleo da área é a capacitação de conjuntos de dados, visualização, coleta de ideias e tomada de decisão com base nesses dados. Os cientistas de dados usam alguns dos métodos de aprendizado de máquina e Big Data: computação em nuvem, ferramentas para criar um ambiente de desenvolvimento virtual e muito mais.

Como qualquer outra profissão, dominar dadosA ciência começa com o básico - o estudo da matemática, álgebra linear e, claro, estatística. Para uma compreensão séria da Ciência de Dados, um futuro especialista precisará de um curso universitário real em teoria da probabilidade (incluindo cálculo). Felizmente, hoje esses materiais são fáceis de encontrar na Internet ou até mesmo se inscrever para um semestre nas melhores universidades da Rússia na plataforma de Educação Aberta. Ou faça o curso completo de Data Science na SkillFactory, onde o conhecimento básico será o primeiro passo para dominar uma nova profissão. O conhecimento matemático é principalmente importante para analisar os resultados da aplicação de algoritmos de processamento de dados. Claro, existem engenheiros fortes no aprendizado de máquina sem essa formação. Mas esses são casos raros.

A segunda etapa para se tornar um cientista de dados é a programação. Basta aprender pelo menos um idioma, tendo dominado todas as nuances de sua sintaxe. Conforme mencionado acima, uma das linguagens mais procuradas é o Python.

Aprendizado de máquina - o terceiro componenteprofissão de cientista de dados, quando ele não precisa mais escrever instruções para computadores realizarem certas tarefas. O ML consiste em três formas principais: aprendizagem supervisionada, aprendizagem não supervisionada e aprendizagem por reforço. Você pode ler mais sobre cada tipo de treinamento em nosso grande material com o professor Jan Lekun.

E, finalmente, a última etapa é Data Mining (análisedados) e visualização de dados, que é um importante processo de pesquisa e envolve a análise de modelos de dados ocultos de acordo com várias opções de tradução em informações úteis que são coletadas e formadas em data warehouses para facilitar as decisões de negócios destinadas a reduzir custos e aumentar receitas.

Apesar do fato de que a educação pode ser obtida emem prazos bastante curtos, um cientista de dados precisa confirmar suas qualificações regularmente, fazendo cursos altamente especializados, participando de hackathons, competições abertas e ao pesquisar no trabalho. A confirmação independente de suas qualificações será uma vantagem. Por exemplo, o perfil avançado no Kaggle, que possui um sistema de classificação. Você pode ir de novato a grande mestre. Pela participação com sucesso em concursos, publicação de roteiros e discussões, você recebe pontos que aumentam sua classificação. Além disso, o site informa de quais competições você participou e quais são seus resultados.

Aplicar

Veja também:

Veja para onde o rover Perseverance está voando agora

Sintomas do coronavírus em crianças. No que você deve prestar atenção?

Astrônomos veem como um buraco negro emite raios gama intermitentes