Wie Computer Vision für Warteschlangen und leere Regale in Supermärkten sorgen kann - Valery Babushkin, X5 Retail Group

"Es ist leicht, um 20% zu wachsen, wenn Sie anderthalb Mal mehr Geschäfte eröffnet haben"

- In deiner Rede du

sagte, dass der Umsatz der X5 Retail Group im Jahr 2017 1,286 Billionen Rubel erreichte und die Senkung der Kosten selbst für einen kleinen Anteil zu großen Gewinnen führt. Wie erweitert sich X5?

- Der Umsatz bei X5 wird weiter wachsen. Im Allgemeinen versucht der Markt, sich im Einzelhandel zu konsolidieren. Derzeit haben wir drei führende Einzelhändler, die ungefähr 20% des Marktes besetzen, und wir sehen in den Ländern des entwickelten Kapitalismus, dass dieser Anteil bei 70-75% liegen wird.

Im Durchschnitt öffnet X5 jeden Tag sechs neueGeschäfte. Während wir reden, eröffnet X5 einen neuen Laden (lacht). In der Tat laufen die Dinge im Gegensatz zu einigen anderen Marktteilnehmern gut. Betrachtet man die offenen Daten, eine davon mit einer Zunahme der Fläche von 12%, stieg der Umsatz nur um 84%. Es ist leicht zu berechnen: Sie beginnen negativ zu arbeiten. Es gibt einen solchen Indikator, LFL - Like Like, ein Vergleich der gleichen Geschäfte pro Jahr. Bei X5 drauf, zwar klein, aber ein Plus. Das heißt, es ist nicht schwer, um 20% zu wachsen, wenn Sie anderthalb Mal mehr Geschäfte eröffnet haben. Dies ist jedoch ein negatives Wachstum. Wenn Sie aufgrund der Tatsache, dass alte Geschäfte besser funktionieren und neue Geschäfte eröffnen, erwachsen werden, ist dies durchaus positiv.

- Was denkst du, welchen Anteil hat dein Team dabei?

- Obwohl nicht sehr groß, weil das Teamvor nicht allzu langer Zeit gebildet. Um ehrlich zu sein, das Wachstum von X5 im Jahr 2017 ist unwahrscheinlich, da wir die Datenanalyse mit Hilfe des 2018 gegründeten Teams verwenden.

Der Leiter unserer Direktion ist Anton Mironenkov, der Mann, der an der Gründung des Unternehmens X5 beteiligt war. Er war an der Fusion von "Crossroads" und "Pyaterochka" beteiligt, woraufhin der X5 erschien.

Wir betrachten die Richtung der Big Data als strategisch. Die Zukunft des Handels hängt davon ab, wie schnell Einzelhändler lernen, Geld zu verdienen, die Daten, die wir täglich in ausreichend großen Mengen generieren, zur Optimierung von Prozessen und zur Verbesserung des Kundenerlebnisses verwenden. Deshalb haben wir uns entschieden, all dies in eine separate Richtung zu ordnen und einen stärkeren Fokus zu geben, damit es sich schneller entwickelt.

Anton Mironenkov, Leiter der Big Data-Direktion X5

Innerhalb dieser Direktion haben wir unsere eigene Macht,Cluster, Entwickler, Tester, Analysten, Projekte, Produkte - alles was Sie brauchen. Wir haben bereits einige Dinge getan, und dies ist ein sehr großer Fortschritt für einen Zeitraum von weniger als einem Jahr. Wir sind uns klar darüber im Klaren, dass wir dem Unternehmen einen ziemlich großen Gewinn bringen werden, aber diese Ergebnisse werden erst nach einem Jahr sichtbar.

Alle Informationen im Scheck - wenn Sie Wodka gekauft haben, sind Sie über 18 Jahre alt.

- Wenn ich zum "Crossroads" komme und einen Kauf tätige, was werden Sie dann für eine Analyse brauchen?

- Überprüfen Sie. Ihre Produkte charakterisieren Sie ziemlich gut. Wenn Sie Windeln kaufen, haben Sie wahrscheinlich ein kleines Kind. Wenn Wodka, dann sind Sie über 18 Jahre alt. Eine Person kann Chips kaufen, und es wird mit einer gewissen Wahrscheinlichkeit ein Teenager von 16 Jahren sein. Wenn Sie ein Tagebuch gekauft haben, haben Sie oder Ihre Familie ein Kind im Alter von sieben bis 17 Jahren. Dies ist eine Menge Informationen.

Stellen Sie sich vor: Sie kommen in den Laden, schauen sich einige Produkte an und verstehen, dass der Laden teuer, billig oder mittlerer Preis ist. In Pyaterochka gibt es 4 bis 8 Tausend einzigartige Produkte. Es ist unwahrscheinlich, dass Sie mit einem Notizbuch die Preise für die gesamte Warengruppe aufschreiben und dann die Durchschnittspreise der Waren in der Stadt betrachten und eine Schlussfolgerung ziehen. Schauen Sie sich einfach die fünf bis zehn Produkte an. Also, welche Produkte Sie sich anschauen, sind wir auch engagiert.

Produkte, die sich die Menschen anschauen, ändern sich auch mitvon der Zeit Ein einfaches Beispiel: Vor 20 Jahren gab es keine Produkte für die mobile Kommunikation. Nun kann man nicht in allen Filialen eine SIM-Karte kaufen. Vor 20 Jahren gab es in Russland in der Regel Zeiten, in denen es schwieriger war als jetzt, und der Konsum war völlig anders.

- Wie ist die Erstellung von Kundenprofilen, um Rabatte anzubieten?

- Es gibt zwei Produkte: Kundenprofil und Loyalität. Ein Kundenprofil ist eine solche Aufgabe, wenn Sie keine Markierungen haben und andere Ansätze verwenden. Wir verwenden unterschiedliche Ansätze für das Clustering: Ausgehend von Standardstatistiken berechnen wir einige Z-Geschwindigkeiten, robuste Abweichungen vom Medianwert und enden mit Word2vec, überlagern die Prüfungen und „übersetzen“ eine Person in den durch TF-IDF gemittelten Vektortyp über Word2vec.

Z-Scores, Z-Score - statistische Auswertung, die ausdrücktder Abstand (gemessen als Standardabweichung) eines bestimmten Pegels vom Mittelwert über dem Datensatz. Der Z-Score ist insbesondere ein Outputindikator für die Kreditwürdigkeit des Unternehmens und das Insolvenzrisiko.

Robuste Abweichungen vom Englischen. robust, „robust“ ist die Stabilität der Schätzungen in Bezug auf die Emissionen in den Daten. Betrachtet relativ zum Median.

Word2vec - Ein Werkzeug, mit dem Sie Wörter in Form von Vektoren darstellen können.

TF-IDF - Der Begriff in der Statistik, der den Bedeutungsgrad des Wortes im Textkörper angibt.

Wenn Sie irgendein Modell haben, das machtWenn Sie einen persönlichen Vorschlag machen, gehen wir davon aus, dass das Clustering erfolgreich ist, wenn sich die Qualität der Modelle nach dem Hinzufügen der Attribute verbessert. Hier können Sie den wirtschaftlichen Effekt und eine Art Metrik berechnen.

- In welchem ​​Teil der Filialen werden Ihre Produkte verwendet?

- In allem. Wir haben den personalisierten Rabatt für eine halbe Million Benutzer getestet, um die Auswirkungen in allen 14 Tausend X5-Stores zu verstehen. In all diesen Geschäften sammeln wir Online-Berichte. Wir haben ein Produkt-Promo, das in allen Geschäften vertreten ist. Wir haben eine Sortimentsmatrix, wir haben eine Nachfrageprognose. Sie sorgen dafür, dass es im Laden erstens ein Huhn gibt und zweitens stirbt das Huhn nicht aus.

Jetzt beginnen wir damit, Computer Vision zu machenwird zuerst nicht in allen Filialen sein. Fangen wir mit den größten an - es ist sinnvoll, nur bei ihnen zu testen. Die Aufgabe ist ziemlich einfach, die Vorteile sind klar. Es gibt ein Produkt, es kann auf dem Regal fehlen, aber es kann im Lager liegen, und zu diesem Zeitpunkt werden die Waren nicht gekauft. Das ist sehr schlecht. Der Laden hat es gekauft, kann aber nicht verkaufen. Im besten Fall wird der Benutzer das Produkt nicht kaufen, und im schlimmsten Fall wird er sich umdrehen und gehen, da er nicht dazu kommen muss, wo er zwei Produkte von drei kaufen wird, und für das dritte wird er in ein anderes Geschäft gehen. Er wird sofort in den Laden kommen, wo Sie alles kaufen können. Und dies wird mit Hilfe von Computer Vision gelöst. Die Kamera ist aufgestellt, sie entdeckt, dass Sie noch ein kleines Produkt haben. Eine Benachrichtigung kommt an den Verantwortlichen, er geht für dieses Produkt ins Lager.

Die zweite Aufgabe ist die Wende. Wir wissen, dass wir im Laden eine Schlange haben. Entweder Sie stehen in einer Schlange, sind unzufrieden und vergeuden Zeit, die niemand mag, oder Sie gehen in den Laden, schauen sich die Schlange an, drehen sich um und gehen. Wenn der Grund für die Warteschlange darin liegt, dass der Staat unterbesetzt ist, kann nichts dagegen unternommen werden. Und wenn das Problem ist, dass die bedingte Verkäuferin im Hinterzimmer sitzt, Tee ruht und Tee trinkt und der Direktor sie anruft. Der Laden ist bereits in einer Reihe, und bis er erreicht ist, sitzt er am Computer, schaltet ihn ein, beginnt den Kassierer zu ziehen, die Zeit vergeht. Sie sieht sie immer noch an, sie ist nervös, auch die Leute. Dieser Kassierer muss ausgehen, bevor die Warteschlange gebildet wird, so dass die Personen zum Zeitpunkt des Austritts bereits zum Kassierer gegangen sind. Es ist ziemlich einfach, mit Computer Vision zu lösen.

Wir werden es bei etwa 150 testenLäden und am wahrscheinlichsten in Moskau. Erstens sind wir selbst in Moskau und zweitens gibt es hier mehr Verkehr. Dann wird klar, wie das Benutzererlebnis verbessert werden kann und wie der X5 verwendet wird.

"Ich mag das Wort Datenwissenschaftler wirklich nicht."

- Erweitern Sie Ihr Management?

- Natürlich sehen die Manager, dass wir Ergebnisse liefern. Niemand erlaubt es Ihnen, das Team zweimal zu erweitern, wenn Sie nicht gut arbeiten. Allein diese Tatsache spricht von unserer Wirksamkeit.

- Sie sagten, dass Sie 32 Leute haben, wie viele werden Sie einstellen?

- Immer noch irgendwo 20-30. Wir werden jetzt als Teil meines Managements die Computer Vision- und Sprachtechnologie einsetzen. Es wird zwei neue Abteilungen geben, das sind plus zehn Personen, meiner Meinung nach sind weitere 10-15 für nächstes Jahr vereinbart. Es gibt sogenannte Projektraten. Wir erwarten, dass es 30–36 plus ist, irgendwo über 60 Personen. Dies sind insbesondere die Personen, die sich mit Datenanalyse und maschinellem Lernen beschäftigen.

- Wen laden Sie ein zu arbeiten?

- Ich mag das Wort "Data Scientist" wirklich nichtweil es keine Informationen enthält. Sie können zu zehn Unternehmen kommen, in denen Sie nach einem Datenwissenschaftler suchen, und dies sind zehn völlig unterschiedliche Positionen. Ich mag den Wortanalytiker. Meine Abteilungsnamen sprechen für sich: Es gibt eine Abteilung für maschinelles Lernen, eine Datenanalyse, eine F & E-Gruppe, dh Forschung, eine Computer-Vision-Abteilung, eine Sprachtechnologie-Abteilung und eine Out-of-Product-Analytics-Gruppe, um Probleme zu lösen, die außerhalb einer bestehenden Produktlinie auftreten. .

Ich suche Leute, die sich programmieren könnenPython, Wahrscheinlichkeitstheorie und mathematische Statistik kennen, wenn ich Modellierung brauche, dann sind maschinelle Lernfähigkeiten erforderlich. Aber am wichtigsten ist die Fähigkeit einer Person zu denken und zu analysieren. Ich komme immer mehr auf die Idee, dass analytisches Denken und kritisch etwas sehr Lehren ist. Wenn es in 20 bis 25 Jahren bereits ein Weltbild gibt, wird sich dies wahrscheinlich nicht ändern.

- Hast du das in X5 verstanden?

- Nicht dass der X5 mich dazu gebracht hat. Ich schaue auch Leute an, kommuniziere, sehe, wie sie funktionieren. Wie Sie wissen, ist das beste Interview eine Probezeit. Und irgendwann sieht man, dass dies einfach nichts für diese Person ist. Das heißt, es scheint, dass er das Mekhmat abgeschlossen hat, es scheint, dass er kein Dummkopf ist, aber nicht er. Es gibt keine richtige Einstellung, sehe keine Dinge. In Daniel Kanemans Buch "Thinking, Fast and Slow" beschreibt er, was kritischem Denken entspricht. Dies beinhaltet eine pessimistische Sicht der Welt und ist eher eine angeborene Qualität als die erworbene, leider oder glücklicherweise.

- Wenn ein Analytiker nach einer Probezeit eintrifft, wissen Sie, dass er geeignet ist. Was kann eine Person erwarten?

- Standardmäßig gibt es in der IT Abstufungen - junior, middle,Senor und Praktikant Oben ist selten anzutreffen - es ist ein Mitarbeiter oder Moderator. Meines Erachtens gibt es eine Inflation in einer leitenden Position: Wir haben viele von ihnen, aber in der Tat verfehlen sie selten die mittlere Mitte.

Wenn Sie das durchschnittliche Gehalt auf dem Markt nehmen, JuniorEr erhält zwischen 120-150 Tausend Rubel vor Steuern pro Monat, Mitte - bis zu 250 Tausend, Senioren etwa 400 Tausend Rubel. Oberste Bar: Ich habe das Angebot persönlich an den Hauptentwickler gehalten, es waren mehr als 600 Tausend Rubel.

"Data Science ist wirklich eine Art" Kirsche auf einem Kuchen "

- Wie haben Sie mit maschinellem Lernen angefangen?

- Die Universität hatte keine Maschinelernen. Da ich 2012 etwa zur gleichen Zeit mein Abitur abschloss, kam es zu einem weiteren Anstieg der Dinge, die damit zusammenhängen. Hatte keine Zeit Sein Studium absolvierte er an zwei Universitäten, zuletzt die Karlsruher Hochschule für Mechatronik. Zuvor studierte er am Moskauer Institut für chemische Verfahrenstechnik, jetzt heißt das Moscow Polytechnic Institute. Ich habe dort kein maschinelles Lernen gelernt.

Lustige Sache: Jetzt werden diejenigen, die Datenwissenschaft abschließen, interviewt, und es scheint, dass ihr Niveau schwächer und niedriger ist als das derjenigen, die Physik, Ingenieurswesen, Informatik und dann das maschinelle Lernen abgeschlossen haben. Vielleicht ist dies eine leichte Verschiebung, denn die Jungs, die es selbst gelernt haben, waren anfangs stark, haben etwas Neues gelernt und sind gekommen. Und Data Science ist wirklich eine Art "Kirsche auf einem Kuchen", und wenn es selbst keinen "Kuchen" gibt, aber es gibt eine "Kirsche", dann ist dies nicht so interessant.

- Wie hast du das gelernt?

- Es gibt ein altes Sprichwort, dass es zwei auf der Coursera gibternst, natürlich eine halbe. Dies ist der Kurs von Hinton für maschinelles Lernen und neuronale Netze (der Kurs ist auf Coursera nicht mehr verfügbar, aber Sie können ihn auf YouTube - „High-Tech“ anschauen) und Daphne Kollers Kurs über probabilistische nichtgrafische Modelle.

Der Koller-Kurs ist eine Video-Vorlesung,was sie liest, um Studenten in Stanford zu studieren. Ihn als nicht ganz ernst zu bezeichnen, ändert daher nicht die Sprache. Hintons Kurs dauert 16 Wochen und Koller hat drei Kurse von fünf bis sechs Wochen. Und ich sammelte die Kraft in einer Faust, durchlief den ersten Kurs und erkannte, dass der zweite und der dritte nicht bereit sind zu bestehen.

Aber Coursera ist nicht das einzige Mittel. Ich habe viele Bücher gelesen. Jetzt habe ich übrigens das Bradley Efron-Buch zur Statistik fertiggestellt (amerikanischer Statistiker, Preisträger der National Ehrenmedaille der USA - der höchste Staatspreis für amerikanische Wissenschaftler - "Hi-Tech"). Zuvor arbeitet das Buch von Jena Godfellow (amerikanischer Spezialist für maschinelles Lernen, Google Brain - "High Tech") über tiefes Lernen. Dies ist ein kontinuierlicher Lernprozess. Coursera ist nur eine der Ressourcen, Kaggle (eine Online-Community von Informatikexperten, in der regelmäßig Wettbewerbe veranstaltet werden - „High-Tech“) -, eine andere, aber die Hauptsache ist Lesen, Lesen, Lesen und Prüfen. Wenn Sie gelesen haben und nicht verstanden haben, ist das schlecht. Wenn Sie verstehen, wie das funktioniert, können Sie alles tun.

Es ist wie bei der Multiplikationstabelle. Stellen Sie sich vor, eine Person verstehe die Multiplikationstabelle nicht, habe sie aber auswendig gelernt. Er wird gefragt: "Sechs bis Sechs?" - "36". - "Sieben auf Acht?" - "56". - "Nun, nun, die letzte Frage, 10 von 11?" - Der Mann sagt: "Ich weiß nicht, das war nicht in der Multiplikationstabelle". Nun, das ist es. Ich treffe mich oft mit solchen Leuten. 10 bis 11 ist viel einfacher zu berechnen, aber das steht nicht in der Tabelle, Sie müssen das Prinzip verstehen. Wenn Sie die Prinzipien verstehen, ist alles viel einfacher.

Alles andere hängt von der Person ab. Es scheint, dass wir alles selbst lernen. Wir helfen nur und stören nicht mit anderen Menschen. All dies ist eine Frage der Selbstdisziplin.

- Erzählen Sie uns von Ihrem Kurs in Data Science an der HSE.

- Dies ist ein kostenloser Kurs, der innerhalb des Standards liegtProgramme, darauf erzähle ich grundlegende einfache Dinge, die für viele Menschen Offenbarung sind. Was sind zum Beispiel die Metriken, warum gibt es sie überhaupt, wie unterscheiden sie sich voneinander, in welchen Fällen ist es erforderlich, wie Sie Ihre Vorstellung von einem A / B-Test testen. Das habe ich für mich abgeleitet, was für die Menschen wichtig ist und was sie wirklich für ihre Arbeit brauchen.

- Wie sehen Sie die Zukunft des Handels in fünf bis zehn Jahren?

- Wenn wir über den Lebensmitteleinzelhandel sprechen, danndas SB-Warenhausformat wird absterben. Das zeigt sich jetzt in den Staaten, wie große Einkaufszentren dort sterben, und übrigens auch in Russland. Was war bisher das Konsummuster? Wir kommen zum Einkaufszentrum, zum Kino, zum Food Court, wir kaufen etwas anderes. Jetzt kommen wir nach Hause, Ivi, Okko, Netflix, Yandex, Essen, Delivery Club, Lieferung aus einem Restaurant, Online-Shopping. Wir müssen zur Personalisierung gehen.

- Was bedeutet das für den Verbraucher?

- Was benutzt der Mensch? Das kann er sich leisten und das ist für ihn günstig. Dementsprechend ist es notwendig, die Kosten zu senken, die gleiche Qualität zu behalten oder zu erhöhen. Dies ist, wo Personalisierung in den Sinn kommt.

- Eine Person kauft, was sie sich leisten kann. Jetzt sinken die Realeinkommen der Bevölkerung, die Kosten sinken.

- Speichern Sie in dieser Situation Sparformatefühle mich besser und wachse. Es gibt zwei Möglichkeiten, viele Probleme für Einzelhändler zu lösen. Entweder Automatisierung oder zehn weitere mieten. Kurzfristig ist der zweite Weg eine Gewinnstrategie, denn Integration ist lange Zeit teuer, etwas geht schief und Sie können die Prämie verlieren. Nun stellen Sie sich vor, Sie sind der Direktor einer Abteilung mit einer sehr hohen Prämie, und Sie können sie verlieren. Sie werden in zwei Jahren im Unternehmen arbeiten, wenn das Ergebnis dieser Automatisierung bekannt sein wird oder nicht, und sie werden Sie dafür loben - das ist nicht klar. Und den Preis kannst du jetzt sein. Deshalb stellen wir zehn weitere Leute ein. Dies führt jedoch auf lange Sicht zu einem großen Verlust.