Comment la vision par ordinateur gagnera les files d'attente et les rayons vides dans les supermarchés - Valery Babushkin, X5 Retail Group

«Il est facile de croître de 20% si vous avez ouvert une fois et demie plus de magasins»

- Dans ton discours tu

a déclaré que les revenus de X5 Retail Group ont atteint 1 milliard 286 milliards de roubles en 2017, et que la réduction des coûts, même pour une petite part, conduit à des profits énormes. Comment X5 se développe-t-il?

- Le chiffre d’affaires chez X5 va continuer à augmenter. En général, le marché cherche à se consolider dans le commerce de détail. À l'heure actuelle, trois grands détaillants occupent environ 20% du marché et nous voyons dans les pays à capitalisme développé que cette part sera d'environ 70 à 75%.

Chaque jour en moyenne, X5 ouvre six nouveauxboutiques. Pendant que nous parlons, X5 ouvre un nouveau magasin (rires). En effet, les choses vont bien, contrairement à certains autres acteurs du marché. Si vous regardez les données ouvertes, l'une d'entre elles, avec une augmentation de 12%, le chiffre d'affaires n'a augmenté que de 84%. C'est facile à calculer: ils commencent à travailler de manière négative. Il existe un tel indicateur, LFL - Like for like, une comparaison des mêmes magasins par an. À X5 dessus, bien que petit, mais un plus. C'est-à-dire qu'il n'est pas difficile d'augmenter de 20% si vous avez ouvert une fois et demie plus de magasins, mais il s'agit en fait d'une croissance négative. Si vous grandissez en raison du fait que les anciens magasins fonctionnent mieux et que les nouveaux ouvrent, alors c'est très positif.

- Que pensez-vous, quelle part des mérites de votre équipe en cela?

- Bien que pas très grand, parce que l'équipeformé il n'y a pas si longtemps. Soyons francs: la croissance de X5 en 2017 est peu probable du fait que nous utilisons l'analyse de données avec l'aide de l'équipe créée en 2018.

Le directeur de notre direction est Anton Mironenkov, l'homme qui a participé à la création de la société X5. Il était engagé dans la fusion de "Crossroads" et "Pyaterochka", à la suite de laquelle le X5 est apparu.

Nous considérons que l’orientation Big Data est stratégique. L’avenir du commerce de détail dépend de la rapidité avec laquelle les détaillants apprennent à monétiser, à utiliser les données générées chaque jour en quantités suffisantes pour optimiser les processus et améliorer l’expérience client. Par conséquent, nous avons décidé de répartir tout cela dans une direction distincte et de mieux cibler le processus pour qu'il se développe plus rapidement.

Anton Mironenkov, chef de la direction Big Data X5

Au sein de cette direction, nous avons notre propre pouvoir,Cluster, développeurs, testeurs, analystes, projets, produits - tout ce dont vous avez besoin. Nous avons déjà fait certaines choses et il s’agit d’un très grand progrès pour une période de moins d’un an. Nous comprenons bien que nous donnerons un bénéfice assez important à la société, mais encore une fois, ces résultats ne seront visibles qu’après un an.

Toutes les informations contenues dans le chèque - si vous avez acheté de la vodka, vous avez plus de 18 ans.

- Si je viens au "Carrefour" et fais un achat, qu'est-ce que tout cela prendra pour analyse?

- Vérifiez. Vos produits vous caractérisent plutôt bien. Si vous achetez des couches, vous avez probablement un petit enfant. Si vous avez de la vodka, vous avez plus de 18 ans. Une personne peut acheter des jetons, et ce sera avec une certaine probabilité un adolescent de 16 ans. Et si vous avez acheté un agenda, vous ou votre famille avez un enfant âgé de 7 à 17 ans. C'est beaucoup d'informations.

Imagine: vous venez au magasin, regardez certains produits et comprenez que le magasin est cher, bon marché ou à prix moyen. Dans Pyaterochka, il y a de 4 000 à 8 000 produits uniques. Il est peu probable que vous utilisiez un cahier pour écrire les prix de l'ensemble des produits, puis que vous examiniez les prix moyens des produits dans la ville et tiriez une conclusion. Il suffit de regarder les cinq à dix produits. Et donc quels produits vous regardez, nous sommes également engagés.

Les produits que les gens regardent changent également avecpar le temps. Un exemple simple: il y a 20 ans, il n'y avait pas de produits liés aux communications mobiles. Maintenant, vous pouvez, pas dans tous les magasins, mais acheter une carte SIM. En Russie, il y a 20 ans, les temps étaient généralement un peu plus difficiles qu'aujourd'hui et la consommation était complètement différente.

- Comment créer des profils de clients pour leur proposer des réductions?

- Il existe deux produits: le profil du client et la fidélité. Un profil de client est une telle tâche lorsque vous ne disposez pas de balisage et utilisez des approches différentes. Nous utilisons différentes méthodes de classification: commencer à partir de statistiques standard, calculer certaines vitesses Z, des écarts importants par rapport à la médiane, se terminer par Word2vec, superposer des vérifications et «traduire» une personne dans le type de vecteur moyenné par TF-IDF sur Word2vec.

Z-scores, Z-score - évaluation statistique, qui exprimela distance (mesurée en tant qu'écart type) d'un niveau donné de la valeur moyenne sur l'ensemble de données. En particulier, le Z-score est un indicateur de sortie de la solvabilité de l'entreprise et du risque de faillite de celle-ci.

Déviations robustes par rapport à l'anglais. robuste, «robuste» est la stabilité des estimations en ce qui concerne les émissions dans les données. Considéré par rapport à la médiane.

Word2vec - Un outil qui vous permet de représenter des mots sous forme de vecteurs.

TF-IDF - Le terme en statistique, indiquant le degré d'importance du mot dans le corps des textes.

Si vous avez un modèle qui faitSi vous proposez une proposition personnelle, supposons que le clustering réussisse si, après l’ajout d’attributs, la qualité des modèles s’améliore. Ici, vous pouvez calculer l'effet économique et une sorte de métrique.

- Dans quelle partie des magasins vos produits sont-ils utilisés?

- En tout. Nous avons testé la réduction personnalisée pour un demi-million d'utilisateurs afin de comprendre son effet dans les 14 000 magasins X5. Nous recueillons des rapports en ligne dans tous ces magasins. Nous avons une promotion de produit, qui est présente dans tous les magasins. Nous avons une matrice d'assortiment, nous avons une prévision de la demande. Ils veillent à ce qu'il y ait un poulet dans le magasin et que le poulet ne s'éteigne pas.

Maintenant, nous commençons à faire de la vision par ordinateur,ne sera pas dans tous les magasins au début. Commençons par les plus gros - il est logique de ne tester que ceux-ci. La tâche est assez simple, les avantages sont évidents. Il y a un produit, il peut être absent sur l'étagère, mais il peut se trouver dans l'entrepôt, et à ce moment, les produits ne sont pas achetés. C'est très mauvais. Le magasin l'a acheté, mais ne peut pas vendre. Au mieux, l'utilisateur n'achètera pas le produit et, au pire, il se retournera et partira, car il n'a pas besoin de se rendre à l'endroit où il achètera deux produits sur trois et, pour le troisième, il ira dans un autre magasin. Il viendra immédiatement au magasin où vous pourrez tout acheter. Et cela est résolu avec l'aide de la vision par ordinateur. La caméra est posée, elle découvre qu'il vous reste un petit produit. Une notification est envoyée à la personne responsable, elle se rend à l'entrepôt pour ce produit.

La deuxième tâche est le tour. Nous savons que nous avons une file d'attente dans le magasin. Soit vous faites la queue, insatisfait et perdez du temps que personne n’aime, ou vous allez au magasin, regardez la file, faites demi-tour et sortez. Si la file d'attente est due au manque de personnel, rien ne peut être fait pour y remédier. Et si le problème est que la vendeuse conditionnelle est assise dans l'arrière-boutique, se repose et boit du thé, et le directeur l'appelle. Le magasin est déjà en ligne et jusqu'à ce qu'il atteigne l'ordinateur, l'allume, commence à tirer le caissier, le temps passera. La regardant toujours, elle est nerveuse, les gens aussi. Ce caissier doit sortir avant que la file d’attente ne soit formée, de sorte qu’au moment de la sortie, les gens se soient déjà rendus au caissier. Il est assez facile à résoudre en utilisant la vision par ordinateur.

Nous allons le tester à environ 150magasins, et probablement à Moscou. Premièrement, nous sommes nous-mêmes à Moscou et, deuxièmement, il y a plus de trafic ici. Il devient alors clair comment améliorer l'expérience utilisateur et quelle est l'utilisation du X5.

"Je n'aime vraiment pas le mot scientifique de données."

- Développes-tu ton management?

- Bien sûr, les gestionnaires voient que nous donnons des résultats. Personne ne vous permet d'élargir l'équipe deux fois si vous ne travaillez pas bien. En soi, ce fait parle de notre efficacité.

- Vous avez dit que vous avez 32 personnes qui travaillent, combien allez-vous recruter?

- Toujours quelque part 20-30. Nous allons maintenant utiliser la technologie de la vision par ordinateur et de la parole dans le cadre de ma gestion. Il y aura deux nouveaux départements, c’est-à-dire plus dix personnes; à mon avis, 10 à 15 autres sont convenues pour l’année prochaine. Il y a ce qu'on appelle les taux de projet. Nous nous attendons à ce qu’il y ait entre 30 et 36 ans et plus, quelque part plus de 60 personnes. Ce sont en particulier les personnes impliquées dans l'analyse de données et l'apprentissage automatique.

- Qui invitez-vous à travailler?

- Je n'aime vraiment pas le mot "data scientist"car il ne porte aucune information. Vous pouvez vous rendre dans dix entreprises pour lesquelles vous recherchez un expert en informatique, et ce seront dix postes complètement différents. J'aime le mot analyste. Les noms de mes départements parlent d’eux-mêmes: il existe un département d’apprentissage automatique, un département d’analyse des données, un groupe de recherche et développement, c’est-à-dire des services de recherche, un département de vision par ordinateur, un département de technologie de la parole et un groupe d’analyse hors produit pour résoudre les problèmes qui se posent en dehors d’une gamme de produits existante. .

Je recherche des personnes pouvant programmerPython, connaître la théorie des probabilités et la statistique mathématique, si j’ai besoin d’une modélisation, des compétences en apprentissage automatique sont nécessaires. Mais le plus important est la capacité d'une personne à penser et à analyser. J'arrive de plus en plus à l'idée que la pensée analytique et critique est très difficile à enseigner. Si la vision du monde existe déjà entre 20 et 25 ans, il est peu probable que celle-ci change.

- Avez-vous compris cela en X5?

- Ce n'est pas que le X5 m'ait amené à ça. Je regarde aussi les gens, je communique, je vois comment ils fonctionnent. Comme vous le savez, la meilleure interview est une période d’essai. Et à un moment donné, vous voyez que ce n'est tout simplement pas pour cette personne. C'est-à-dire qu'il semble qu'il ait obtenu son diplôme de mekhmat, il n'est apparemment pas idiot, mais pas lui. Il n'y a pas de bonne attitude, ne voit pas les choses. C'était dans le livre de Daniel Kaneman «Thinking, Fast and Slow», où il décrivait ce qui correspond à la pensée critique. Cela inclut une vision pessimiste du monde, et il s’agit plus d’une qualité innée que celle acquise, malheureusement ou heureusement.

- Si un analyste arrive et qu'après une période d'essai, vous comprenez qu'il convient, à quoi une personne peut-elle s'attendre?

- En informatique, il y a des gradations - junior, moyen,Sénor et stagiaire. Ci-dessus est rarement rencontré - c'est un personnel ou un présentateur. Je pense qu'il y a une inflation dans les postes de direction: nous en avons beaucoup, mais en réalité, ils sont rarement en deçà du niveau intermédiaire.

Si vous prenez le salaire moyen sur le marché, juniorreçoit quelque 120 000 à 150 000 roubles avant impôts par mois, jusqu'à 250 000. Les personnes âgées environ 400 000 roubles. Barre du haut: J'ai personnellement réservé l'offre au développeur principal, soit plus de 600 000 roubles.

“La science des données est vraiment une sorte de“ cerise sur un gâteau ””

- Comment as-tu commencé l'apprentissage automatique?

- L'université n'avait pas de machinel'apprentissage Étant donné que j'ai obtenu mon diplôme d'études secondaires en 2012, à peu près à la même époque, il y a eu une autre augmentation dans les domaines qui y sont liés. Je n'ai pas eu le temps. Il est diplômé de deux universités, la dernière - est l’Université des sciences appliquées de Karlsruhe, magistrat en mécatronique. Auparavant, il a étudié à l'Institut de génie chimique de Moscou, qui s'appelle désormais l'Institut polytechnique de Moscou. Je n'ai pas appris la machine à apprendre là-bas.

Drôle de chose: Les personnes qui terminent la science des données sont interviewées et il semble que leur niveau soit plus faible et inférieur à celui des gars qui ont terminé la physique, l’ingénierie, l’informatique, puis que l’apprentissage automatique a «gâché». C’est peut-être un léger changement, car les gars qui l’ont appris étaient eux-mêmes forts au départ, ont appris quelque chose de nouveau et sont venus. Et la science des données est vraiment une sorte de "cerise sur un gâteau", et s'il n'y a pas de "gâteau" lui-même, mais s'il y a une "cerise", alors ce n'est pas si intéressant.

- Comment as-tu appris ça?

- Il y a un vieil adage qui dit qu'il y en a deux sur la Courseracours sérieux, même un demi. C’est le cours de Hinton sur l’apprentissage automatique et les réseaux de neurones (le cours n’est plus disponible sur Coursera, mais vous pouvez le visionner sur YouTube - «High-Tech») ainsi que sur le cours de Daphne Koller sur les modèles probabilistes non graphiques.

Le cours de Koller est des conférences enregistrées sur vidéo,qu'elle lit aux étudiants diplômés à Stanford. Par conséquent, l'appeler pas tout à fait sérieux ne change pas le langage. Le cours de Hinton dure 16 semaines et celui de Koller en trois cours de cinq à six semaines. Et j'ai rassemblé la force dans un poing, j'ai traversé le premier parcours et réalisé que les deuxième et troisième n'étaient pas prêts à passer.

Mais Coursera n'est pas le seul moyen. Je lis beaucoup de livres. A propos, j’ai terminé le livre de statistiques de Bradley Efron (statisticien américain, lauréat de la médaille d’honneur des États-Unis - la plus haute distinction décernée à un scientifique américain - "Hi-Tech"). Auparavant, le livre de Jena Godfellow (spécialiste américain de l’apprentissage automatique, travaille dans Google Brain - "High Tech") sur l’apprentissage en profondeur. C'est un processus d'apprentissage continu. Coursera n’est que l’une des ressources, Kaggle (une communauté d’experts en informatique où des compétitions sont régulièrement organisées - «High-tech»), en est un autre, mais l’essentiel est la lecture, la lecture, la lecture et la vérification. Si vous lisez et ne comprenez pas, c'est mauvais. Si vous comprenez comment cela fonctionne, vous pouvez faire n'importe quoi.

C'est comme avec la table de multiplication. Imaginez qu'une personne ne comprenne pas la table de multiplication, mais qu'elle l'ait apprise par cœur. On lui demande: "Six à six?" - "36". - "Sept sur huit?" - "56". - "Bien, d'accord, la dernière question, 10 heures sur 11?" Eh bien c'est tout. Je rencontre souvent de telles personnes. 10 à 11 est beaucoup plus facile à calculer, mais ce n’est pas dans le tableau, vous devez comprendre le principe. Si vous comprenez les principes, alors tout est beaucoup plus facile.

Tout le reste dépend de la personne. Il semble que nous apprenons quelque chose nous-mêmes. Nous venons d'aider et ne pas interférer avec d'autres personnes. Tout cela est une question d'autodiscipline.

- Parlez-nous de votre cours sur la science des données à la HSE.

- Ceci est un cours gratuit, il est dans la normeprogrammes, sur ce que je raconte des choses simples de base qui pour beaucoup de gens - la révélation. Par exemple, quelles sont les métriques, pourquoi existent-elles, en quoi diffèrent-elles les unes des autres, dans quels cas est-il nécessaire, comment tester votre idée de ce qu'est un test A / B. C’est ce que j’ai fait ressortir: il est important que les gens sachent ce dont ils ont vraiment besoin dans leur travail.

- Comment voyez-vous l'avenir du commerce de détail dans cinq à dix ans?

- Si nous parlons de vente au détail de produits alimentaires, alorsle format hypermarché va mourir. Cela se voit maintenant aux États-Unis, où de grands centres commerciaux y meurent, et en Russie également. Auparavant, quel était le modèle de consommation? Nous venons au centre commercial, au cinéma, au food court, nous achèterons autre chose. Maintenant, nous venons à la maison, ivi, Okko, Netflix, Yandex.Alimentation, Club de livraison, livraison depuis un restaurant, shopping en ligne. Nous devons aller vers la personnalisation.

- Qu'est-ce que cela signifiera pour le consommateur?

- L'homme utilise quoi? Qu'il peut se permettre et cela lui convient. En conséquence, il est nécessaire de réduire les coûts, de conserver la même qualité ou de l’augmenter. C’est là que la personnalisation vient à l’esprit.

- Une personne achète ce qu'elle peut se permettre. Maintenant, les revenus réels de la population diminuent, les coûts diminuent.

- Dans cette situation, stockez les formats économiquesse sentir mieux et grandir. Il existe deux manières de résoudre de nombreux problèmes pour les détaillants. Automatisation ou embaucher dix autres. À court terme, la deuxième voie est une stratégie gagnante, car l'intégration coûte cher, pendant longtemps, quelque chose se passe mal, vous pouvez perdre la prime. Maintenant, imaginez que vous dirigiez un département avec une très grosse prime et que vous puissiez la perdre. Vous travaillerez dans l'entreprise dans deux ans, lorsque le résultat de cette automatisation sera connu ou non, et ils vous en féliciteront - ce n'est pas clair. Et le prix que vous pouvez maintenant être. Nous embauchons donc dix personnes supplémentaires. Mais cela conduit à une grosse perte à long terme.