Hoy en día, se necesitan especialistas en ciencia de datos en casi todas las áreas de negocio. No se trata sólo de finanzas
La demanda de especialistas en ciencia de datos es diferentelas calificaciones aumentan cada año. Según MADE Big Data Academy de Mail.ru Group y el portal de contratación HeadHunter, en 2019 hubo 1,4 veces más vacantes en el campo del análisis de datos en comparación con 2018. Y la cantidad de vacantes en el campo del aprendizaje automático se ha multiplicado por 1,3.
Las ganancias de los científicos de datos también están creciendo. Según HH.ru, incluso un junior en Rusia recibe alrededor de 120 mil rublos, mientras que un analista de negocios ya puede contar con 170 mil rublos y más, y un analista de big data, de 200 mil rublos.

¿Quién tiene demanda y por qué?
La mayoría de las veces en Rusia buscan científicos de datos.empresas financieras y de TI. Y el requisito más común para los solicitantes es el conocimiento del lenguaje de programación Python. Ocurre en el 45% de los trabajos en ciencia de datos y casi la mitad (51%) en aprendizaje automático.
Por supuesto, el número de científicos de datos también está creciendo. Según HH.ru, 246 especialistas en análisis de datos y 47 especialistas en aprendizaje automático publican sus currículums cada mes.
La lista de requisitos de los solicitantes también incluye:
- conocimiento de SQL;
- posesión de minería de datos (Data Mining);
- conocimiento seguro de la estadística matemática;
- capacidad para trabajar con big data;
- posesión de C ++, Git, Linux.
Al mismo tiempo, alrededor del 65% de las vacantes en el campo de análisisLos datos y el 50% de las vacantes de especialistas en el campo del aprendizaje automático se encuentran en Moscú. San Petersburgo ocupa el segundo lugar en Rusia (15% y 18%, respectivamente). Por supuesto, los buscadores de empleo también se concentran principalmente en las dos capitales. Pero hoy en día, para recibir formación no es necesario desplazarse a ningún lado, sino que trabajar en formato remoto, en la subcontratación, ya se está convirtiendo en un nuevo formato de organización del flujo de trabajo.
¿Dónde estudiar para un científico de datos y qué se necesita para esto?
Hay varios enfoques para aprender encientífico de datos. Uno de ellos es uno más clásico, ingresar a una universidad en áreas de TI. Esto también se puede hacer en el extranjero. Por ejemplo, estudiar una Maestría en Data Science en una universidad estadounidense puede costarle una cantidad muy impresionante: de $ 30 mil a $ 120 mil. Incluso los cursos en línea en universidades extranjeras en esta especialidad cuestan al menos $ 9 mil. Hay quienes no están preparados gaste en su capacitación a tal escala, porque esos costos aún deben recuperarse, pero esto no sucederá de inmediato. Por ejemplo, la científica de datos Rebecca Vickery, que ha estado trabajando en este campo durante 10 años, ha creado su propio programa, según el cual estudió de forma independiente Ciencia de Datos. Este enfoque también tiene sus inconvenientes: falta de retroalimentación y apoyo de un mentor o maestro, distancia del equipo, trabajar solo y, finalmente, muchos encuentran este proceso de aprendizaje aburrido.
Otra opción es la formación online enescuelas digitales especializadas como SkillFactory. A los estudiantes no solo se les enseña un conjunto de técnicas y técnicas, sino que también se les enseña a aprender. Además, cada alumno contará con un mentor que le brindará apoyo y asistencia, y todo el trabajo realizado en el proceso de aprendizaje no solo podrá ser utilizado como portafolio. Mientras todavía es estudiante de SkillFactory, el futuro científico de datos ingresa a la comunidad de la industria; esto no solo ayuda a encontrar un trabajo, sino también a comunicarse con colegas y compartir experiencias. La escuela en línea está convencida de que no es suficiente aprender nuevas tecnologías, es necesario dominar nuevos enfoques y nuevas formas de pensar. Y es difícil afrontarlo solo. Por lo tanto, todos los estudiantes se retroalimentan, intercambian código, ayudan a encontrar errores y comparten problemas y casos reales.
Lo que debería poder hacer un científico de datos junior:
- utilizar construcciones algorítmicas básicas y estructuras de datos de Python para diseñar algoritmos;
- visualizar datos usando Pandas, Matplotlib, Seaborne;
- crear modelos de calidad industrial utilizando el aprendizaje automático clásico y las redes neuronales para resolver problemas de ciencia de datos;
- evaluar la calidad del modelo (precisión / recuperación);
- integrar la solución en la producción y el negocio en general;
- trabajar con almacenes de datos de diferentes tipos;
- trabajar con herramientas de análisis de big data;
- recibir datos de fuentes web o mediante API;
- Aplicar métodos de análisis matemático, álgebra lineal, estadística y teoría de la probabilidad para el procesamiento de datos.
Si estas habilidades le parecen muy difíciles, puede realizar los cursos de Profesión de científico de datos.
¿Quién es un científico de datos y qué debería poder hacer?
En esencia, la ciencia de datos es la siguientePaso "evolutivo" de la humanidad al trabajar con datos. Los matemáticos y estadísticos anteriores resolvieron problemas similares. Ahora, con el advenimiento de la inteligencia artificial, la optimización y la informática han entrado en los métodos de análisis de datos, lo que significa que un nuevo enfoque para encontrar soluciones basadas en datos se ha vuelto mucho más efectivo que los métodos "analógicos" anteriores.
El trabajo de un científico de datos comienza con la recopilacióngrandes conjuntos de datos: estructurados y no. Luego se convierten a un formato fácil de leer. La siguiente etapa: visualización y trabajo con estadísticas. El aprendizaje automático y profundo, el análisis probabilístico, los modelos predictivos y las redes neuronales se utilizan como métodos analíticos.

Cinco bases para un científico de datos
- La inteligencia artificial (IA) es un áreadedicada a la creación de sistemas inteligentes que funcionan y actúan como personas. La IA está relacionada con el objetivo similar de usar computadoras para comprender la inteligencia humana, pero no se limita necesariamente a métodos biológicamente plausibles. Los sistemas inteligentes que existen en la actualidad tienen áreas de aplicación muy reducidas. Por ejemplo, los programas que pueden vencer a una persona en el ajedrez no pueden responder preguntas.
- Aprendizaje automático -creando una herramienta para extraer conocimiento de los datos. Los modelos de aprendizaje automático se entrenan con datos de forma independiente o por etapas: formación con un profesor sobre datos preparados por una persona y sin un profesor, trabajando con datos espontáneos y ruidosos.
- Aprendizaje profundo -la construcción de redes neuronales multicapa en áreas donde se requiere un análisis más avanzado o más rápido y el aprendizaje automático tradicional falla. La "profundidad" la proporcionan varias capas ocultas de neuronas en la red que realizan cálculos matemáticos.
- Big Data: trabajar con grandesvolumen de datos a menudo no estructurados. La especificidad de la esfera son las herramientas y sistemas que pueden soportar cargas elevadas.
- Ciencia de datos - enel núcleo del área es el empoderamiento de los conjuntos de datos, la visualización, la recopilación de ideas y la toma de decisiones basadas en esos datos. Los analistas de datos utilizan una serie de métodos de aprendizaje automático y Big Data: computación en la nube, herramientas para crear un entorno de desarrollo virtual y mucho más.
Como cualquier otra profesión, dominar los datosLa ciencia comienza con lo básico: el estudio de las matemáticas, el álgebra lineal y, por supuesto, la estadística. Para una comprensión seria de la ciencia de datos, un futuro especialista necesitará un curso universitario real en teoría de la probabilidad (incluido el cálculo). Afortunadamente, hoy en día, estos materiales son fáciles de encontrar en Internet o incluso registrarse durante un semestre en las mejores universidades de Rusia en la plataforma de Educación Abierta. O tome el curso completo de ciencia de datos en SkillFactory, donde el conocimiento básico será el primer paso para dominar una nueva profesión. El conocimiento matemático es fundamentalmente importante para analizar los resultados de la aplicación de algoritmos de procesamiento de datos. Por supuesto, hay ingenieros sólidos en aprendizaje automático sin esa educación. Pero estos son en su mayoría casos raros.
El segundo paso para convertirse en científico de datos es la programación. Basta con aprender al menos un idioma, habiendo dominado todos los matices de su sintaxis. Como se mencionó anteriormente, uno de los lenguajes más populares es Python.
Aprendizaje automático: el tercer componenteprofesión de científico de datos, cuando ya no necesita escribir instrucciones para que las computadoras realicen ciertas tareas. ML consta de tres formas principales: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje reforzado. Puede leer más sobre cada tipo de formación en nuestro amplio material con el profesor Jan Lekun.
Y finalmente, el último paso es Data Mining (análisisdata) y visualización de datos, que es un proceso de investigación importante e implica el análisis de modelos de datos ocultos de acuerdo con varias opciones para traducir en información útil que se recopila y forma en almacenes de datos para facilitar las decisiones comerciales diseñadas para reducir costos y aumentar los ingresos.
A pesar de que la educación se puede obtener enEn períodos de tiempo bastante cortos, un científico de datos debe confirmar sus calificaciones con regularidad, aprobar cursos altamente especializados, participar en hackatones, concursos abiertos y cuando realiza búsquedas en el trabajo. La confirmación independiente de sus calificaciones será una ventaja. Por ejemplo, el perfil avanzado de Kaggle, que tiene un sistema de clasificación. Puedes pasar de novato a gran maestro. Por una participación exitosa en concursos, la publicación de guiones y discusiones, obtienes puntos que aumentan tu calificación. Además, el sitio indica en qué competencias participó y cuáles son sus resultados.
Aplicar
Ver tambien
Vea dónde está volando el rover Perseverance ahora
Síntomas de coronavirus en niños. ¿A qué debes prestar atención?
Los astrónomos ven cómo un agujero negro emite rayos gamma parpadeantes