L’apprentissage des femmes: des filles Datascentistes parlent d’apprentissage automatique, de croissance de carrière et de tendances

Les Data Scientists sont des experts en données analytiques possédant les compétences techniques pour résoudre des problèmes complexes.

tâches. Ils aiment les mathématiques, sont presque des informaticiens, adorent les statistiques et, plus important encore, les données et leur analyse. En Russie, selon Headhunter, le salaire d'un spécialiste de l'informatique et de l'apprentissage automatique peut atteindre 300 000 roubles. Il est clair que ces spécialistes sont très populaires et très bien payés sur le marché.

Alexandra Murzina, ingénieure en apprentissage automatique, groupe des technologies de pointe, technologies positives

Un des techniciens les plus prometteurs deL'apprentissage automatique est maintenant renforcé. C'est sur elle, en passant, que repose le système DeepMind, qui a été primé dans StarCraft II. Une telle approche d’apprentissage, puis d’utilisation, ressemble plus à une IA. Un tel système est immergé dans un environnement qui lui donne des réponses aux actions. Cette méthode est très similaire à la façon dont nous étudions avec vous, mais il nous faut parfois des années pour le faire, et il est ici possible d'accélérer considérablement le processus grâce à la modélisation et à la puissance de l'ordinateur.

Par exemple, un tel système apprendra rapidement "bienconduire une voiture. Bien entendu, il restera des problèmes liés aux situations exceptionnelles et au fonctionnement du système dans leurs conditions (en raison de la limitation des tâches qu'il résout). À l'automne 2017, les réseaux de neurones capsulaires ne faisaient pas moins de bruit: ils parlaient alors d'une révolution dans le monde de l'apprentissage en profondeur. Aujourd'hui, ils les ont presque oubliés en public. En pratique, les architectures de busing et de réseaux de neurones, qui sont déjà devenues la norme pour résoudre certains problèmes, sont toujours très populaires. Telles que, par exemple, la détection d'objets dans des images ou la classification d'images.

Théoriquement, l'IA en tant que technologie viendra plus vite dansLes domaines dans lesquels le travail d’une personne consiste principalement en des actions de routine ou dans des domaines dans lesquels des décisions doivent être prises rapidement sur la base d’un grand nombre de données. Autrement dit, les nouvelles sensationnelles sur le remplacement de 600 traders par deux cents programmeurs peuvent facilement devenir un événement ordinaire dans le domaine de l'automatisation. S'agissant du secteur de la cybersécurité, une telle automatisation est susceptible, par exemple, dans le domaine de l'analyse de virus ou de la détection d'attaques. À propos, notre équipe travaille sur une technologie qui permet à l’apprentissage automatique de détecter les attaques sur les applications Web en quelques secondes.

En pratique, il est possible de prédire les industries dans lesquelles l'IAil sera très demandé et dans un avenir proche est difficile, car son utilisation est associée à de nombreuses nuances sociales et juridiques. Dites, pilote automatique: il est technologiquement possible de transférer des vols standard vers le pilote automatique, mais combien de passagers confient leur vie à un avion sans une personne assise à la barre? Ou, disons, médecine il y a beaucoup de développements fondés sur l'utilisation de l'IA en relation avec cette industrie, mais du point de vue de la base législative, ils ne peuvent pas être pleinement utilisés et restent aujourd'hui au niveau conceptuel.

Oui, dans la direction de beaucoup de bruit: Cependant, de nombreux experts préfèrent parler immédiatement de la résolution de problèmes spécifiques, en économisant du temps et de l'argent, en fonction de l'utilisation de la technologie. En réalité, ces idées se heurtent à la question du personnel: s’il ya quelques années, il n’y avait que des discussions sur la pénurie de programmeurs, alors rien n’a changé. qui peut comprendre et résoudre le problème, y compris les méthodes d’apprentissage automatique.

Le sentiment d'une surabondance sur le marchéL'apprentissage automatique est plus trompeur que réel. Oui, de nombreuses personnes pensent pouvoir explorer rapidement ce domaine après avoir suivi quelques cours. En conséquence, le marché est sursaturé en spécialistes chevronnés. Cependant, l’apprentissage automatique est dans la plupart des cas un outil pour résoudre efficacement une tâche spécifique (enfin, seulement si vous ne le faites pas pour lui-même) et pour choisir le bon outil, vous devez posséder une expertise approfondie dans un domaine particulier (dans notre cas, la sécurité de l’information) .

L'histoire de l'apprentissage machine aujourd'hui est plusCela ressemble à la situation de l'antagoniste «marteau d'or» populaire dans l'environnement de développement, dans lequel tout problème est tenté pour être résolu à l'aide d'un marteau unique (bien que doré). Les spécialistes en apprentissage automatique qui ont suivi plusieurs cours appliquent leur expérience dans une centaine de cas sur cent, sans pouvoir comprendre quand une autre boîte à outils est nécessaire - une supplémentaire. Nombre de ces spécialistes fraîchement préparés ne sont pas des développeurs et ne peuvent pas aller au-delà du cadre de Jupyter Notebook (un outil populaire dans ML) ou manquent de connaissances suffisantes dans d'autres domaines, ce qui ne leur permet pas d'utiliser avec succès la technologie dans un domaine particulier pour résoudre des problèmes spécifiques.

Alena Arykina, Data Scientist Sberbank PJSC

Dans l'apprentissage automatique, il y a une partie créative,en fonction des données et de la connaissance du terrain, de l'intuition du développeur et bien plus encore. Et il y a des choses automatiques, où vous devez trouver de meilleurs paramètres et réécrire un code connu depuis longtemps. Dans la deuxième partie, comme dans tout processus "mécanique", les utilisateurs ont tendance à tout optimiser, y compris par apprentissage automatique. Si d'anciens mathématiciens passaient de l '«apprentissage manuel» à l'automatique, sur la base de bibliothèques telles que keras, des exemples d'optimisation de ce type peuvent aujourd'hui servir de bibliothèques pour gérer l'état des jeux de données, le traitement d'images et de textes, voire la détection automatique de caractéristiques d'éléments. Les algorithmes peuvent être simples (couper les fins de mots) ou complexes (construire des réseaux de neurones spéciaux - des auto-encodeurs qui compressent les données à n’importe quelle taille), mais un ensemble de tels outils de formation détermine le plus souvent la qualité du modèle final, et donc les compétences d’un datassentiste.

L'apprentissage automatique finira par arriver plus tarddomaines où il sera ralenti par la législation ou la méfiance humaine: médicaments ou voiture avec pilote automatique. Nous constatons déjà d’énormes progrès dans ces domaines - ils sont utilisés dans d’autres pays. Mais je suis sûr que pour les mettre en œuvre avec nous et les rendre accessibles aux citoyens ordinaires, nous devrons gagner plus d'une guerre bureaucratique.

La science des données est vraiment très intéressante. À chaque seconde, mon ami spécialiste en informatique a au moins déjà lu des informations sur l'apprentissage automatique. Bon gré mal gré, vous commencez à vous inquiéter: n'y aura-t-il pas trop d'informaticiens? En outre, ils essaient maintenant d'utiliser l'apprentissage automatique dans tout projet informatique et pour toute tâche, sans vraiment imaginer pourquoi de tels algorithmes sont nécessaires, mais à la mode. HYIP passera et le nombre de postes vacants diminuera. D'autre part, la question est de savoir si ceux qui aiment vraiment Data Science resteront dans le métier et ne poursuivront pas la mode.

Tatyana Savelyeva, responsable du groupe de données non structurées, Yandex.Taxi, auteur du canal de télégramme tldr_arxiv

Je n'aime pas vraiment le mot «AI», parce queil est trop général et ambitieux et conduit souvent les gens à surestimer le niveau de technologie. Vous savez, il y a une telle blague: «Comment distinguer ML de l'IA? ML est fait en Python et l'IA dans PowerPoint. ”

La première tendance de Data Science est en augmentationla popularité du sujet: les entreprises sont de plus en plus conscientes que ce sera difficile sans le traitement d'une grande quantité d'informations utiles dans le futur. Il y a une tendance dans l'automatisation de l'apprentissage automatique: il y a 10 ans, vous deviez écrire toutes les méthodes pour travailler vous-même. Il existe maintenant de nombreuses bibliothèques prêtes à l'emploi.

Mais avec la convivialité croissante des méthodesLes outils réels changent de plus en plus vite - vous devez garder le doigt sur le pouls. Les réseaux de neurones ont tendance à être utilisés: les conférences industrielles publient de plus en plus d'articles sur ce type d'algorithme.

Donc, l'apprentissage machine est la dernièreviendra dans des zones où il existe peu ou pas de données - par exemple, il est ainsi difficile de prédire le lieu de la chute de l’astéroïde ou le moment de la collision de la Lune avec la Terre. Il semble que l'apprentissage machine soit difficile à mettre en œuvre dans les institutions bureaucratiques - agences gouvernementales, institutions médicales.

En tout état de cause, à un moment donné, le marchéapparaître dans un grand nombre de candidats à des postes vacants - spécialistes débutants ou stagiaires - à mesure que les connaissances nécessaires pour trouver un emploi correspondant à ce poste deviennent de plus en plus accessibles. Mais la demande de spécialistes expérimentés ayant déjà mis en œuvre des projets de maîtrise de l’environnement augmentera car il faut beaucoup de temps et d’efforts pour acquérir cette expérience et le nombre de tâches d’apprentissage automatique augmente plus rapidement que le nombre de personnes ayant réussi à acquérir cette expérience.

Emily Drahl, Data Analysis Analytics, Mechanica AI, responsable du Data Mining en action

Dans l'apprentissage automatique l'un des plusBright Trends est la transition de son utilisation comme technologie d'assistance à une automatisation complète basée sur celle-ci. Cela se manifeste le plus clairement dans l'automatisation de la production industrielle, de l'agriculture et de l'agroalimentaire, ainsi que dans le développement des concepts de ville intelligente et de maison intelligente.

Maintenant des applications d'apprentissage automatiqueCela est dû au niveau actuel de développement de la pile technologique, au niveau de notre compréhension du domaine et à un certain nombre de problèmes éthiques non résolus. Ma principale application personnelle est la médecine, la psychologie et la pédagogie. Ici, il ne s'agit pas principalement de services auxiliaires (systèmes de recommandation pour le diagnostic de maladies ou de systèmes interactifs), mais de l'automatisation complète des processus via l'IA et le ML.

Je pense que l'industrie informatique d'aujourd'hui est différente parce queLes technologies se développent de manière très dynamique et si vous arrêtez de suivre le rythme de ces changements, vous courez un risque très tangible de devenir un spécialiste non réclamé. C'est l'un des rares domaines où les diplômés universitaires sans expérience peuvent rivaliser avec des professionnels expérimentés.

Grâce au marché dynamique, travaillez pour ceux quiReste au courant des tendances, le sera toujours. Mais pour ceux qui ne sont pas prêts à apprendre toute leur vie, la difficile question reste à résoudre: comment rester pertinents. Ici, l'expérience, les perspectives professionnelles et la connaissance de domaines d'activité connexes (ou pas!) Seront utiles.

Le domaine de l'éducation est en train de changer.conceptuellement et, si je puis dire, s'adresse non seulement aux écoliers et aux étudiants, mais également aux spécialistes adultes ayant une expérience professionnelle. au moins sur la position initiale dans le domaine de l'analyse des données. C'est l'un des objectifs que se fixent les cours en ligne.

Si nous parlons des universités, la plupart d'entre ellesrencontre un certain nombre de difficultés pour enseigner des disciplines techniques pertinentes: les technologies changent très rapidement, vous devez attirer des praticiens et ils ne sont pas toujours prêts à travailler dans le format que l’université implique. C’est ainsi que viennent les sociétés informatiques de premier plan qui créent des écoles, ouvrent des départements dans des universités, organisent des stages pratiques et des stages, et forment les diplômés de l’entreprise au tout début de leur travail. En fin de compte, la mission de l'université que je vois personnellement n'est pas seulement et pas tellement de libérer un spécialiste prêt à l'emploi sur le marché, mais qu'un enseignement supérieur doit donner à une personne un certain niveau de culture, d'intellectuel et d'émotivité, dont dépend davantage sa vie professionnelle plutôt que la connaissance de technologies spécifiques.

Anna Voevodskaya, experte en apprentissage automatique chez Jet Infosystems

Il me semble que maintenant ils appliquent de plus en plus.apprentissage par renforcement. La décision d'apprendre, en interaction avec l'environnement, en utilisant des récompenses, des actions et des observations. AlphaGo est l’un des exemples les plus célèbres d’apprentissage par renforcement. De plus, de telles méthodes d’entraînement sont utilisées pour simuler les mouvements d’une personne (les dernières compétitions du NIPS étaient au sujet de RL), de machines et d’autres.

L'apprentissage automatique est la magie à son meilleur.sens. Une mathématique assez complexe est appliquée à vos données, une analyse approfondie est effectuée et une prévision très précise est donnée juste pour vous. Et tout le monde veut cette magie: elle rapporte de l’argent et elle est utile à l’image, c’est génial.

Quant à la surabondance du marché, je suis dans cetteJe ne crois pas Les bons spécialistes sont toujours difficiles à trouver. Par exemple, Java n'est pas apparu il y a deux ans, mais senior est toujours difficile à trouver dans cette région. Et une bonne base de données ressemble généralement à une licorne: il connaît et aime les maths, et kodit, et comprend les métriques commerciales et explique bien tout. Si nous avons une offre excédentaire de telles personnes à un moment donné dans le monde, ce sera bien. Mais c'est une sorte d'utopie.