Miten tietokoneen visio voittaa jonot ja tyhjät hyllyt supermarketeissa - Valery Babushkin, X5 Retail Group

”On helppo kasvaa 20%, jos olet avannut puolitoista kertaa enemmän kauppoja”

- Puheessanne

sanoi, että X5 Retail Groupin liikevaihto oli 1,286 biljoonaa ruplaa vuonna 2017, ja kustannusten pienentäminen jopa pienellä osuudella johtaa suuriin voittoihin. Miten X5 laajenee?

- X5: n liikevaihto kasvaa edelleen. Yleensä markkinat pyrkivät vahvistamaan vähittäiskaupassa. Tällä hetkellä meillä on kolme johtavaa vähittäiskauppaa, jotka käyttävät noin 20% markkinoista, ja näemme kehittyneen kapitalismin maissa, että tämä osuus on noin 70–75%.

Joka päivä keskimäärin X5 avaa kuusi uuttakauppoja. Kun puhumme, X5 avaa uuden myymälän (nauraa). Itse asiassa asiat ovat hyvin, toisin kuin muut markkinatoimijat. Jos tarkastelet avoimia tietoja, yksi niistä, 12 prosentin kasvun myötä, kasvoi liikevaihdolla vain 84%. On helppo laskea: ne alkavat työskennellä negatiivisesti. On olemassa tällainen indikaattori, LFL - kuten samankaltainen, samojen myymälöiden vertailu vuodessa. X5: ssä, vaikka pieni, mutta plus. Toisin sanoen, ei ole vaikea kasvaa 20%, jos olet avannut puolitoista kertaa enemmän kauppoja, mutta tämä on tosiasiallisesti negatiivinen kasvu. Jos kasvaa, koska vanhat myymälät toimivat paremmin ja uusia avoimia, tämä on varsin myönteistä.

- Mitä mieltä olette, mikä osuus joukkosi ansioista tässä?

- Vaikka se ei ole kovin suuri, koska joukkuemuodostunut niin kauan sitten. Aiomme olla rehellisiä, X5: n kasvu vuonna 2017 on epätodennäköistä, koska käytämme tiedon analysointia 2018-luvulla perustetun ryhmän avulla.

Johtajamme johtaja on Anton Mironenkov, mies, joka osallistui X5-yhtiön perustamiseen. Hän osallistui "Crossroadsin" ja "Pyaterochkan" fuusioon, jonka jälkeen X5 ilmestyi.

Pidämme suurta tietosuhdetta strategisena. Vähittäiskaupan tulevaisuus liittyy siihen, kuinka nopeasti vähittäismyyjät oppivat ansaitsemaan rahaa, käyttävät niitä tietoja, joita tuotamme riittävän suurina päivinä, prosessien optimoimiseksi ja asiakaskokemuksen parantamiseksi. Siksi päätimme jakaa kaiken tämän erikseen ja antaa enemmän painopistettä, jotta se kehittyy nopeammin.

Anton Mironenkov, Big Data Directorate X5: n johtaja

Tässä osastossa meillä on oma valta,Klusteri, kehittäjät, testaajat, analyytikot, projektit, tuotteet - kaikki mitä tarvitset. Olemme jo tehneet joitakin asioita, ja tämä on erittäin suuri edistysaskel alle vuoden ajan. Ymmärrämme selvästi, että annamme yritykselle melko suuren voiton, mutta taas nämä tulokset näkyvät vasta vuoden kuluttua.

Kaikki tarkastuksessa olevat tiedot - jos ostit vodkan, olet yli 18-vuotias.

- Jos tulen "risteykseen" ja ostan, mitä tämä kaikki otatte analyysia varten?

- Tarkista. Tuotteesi luonnehtivat sinua melko hyvin. Jos ostat vaippoja, sinulla on todennäköisesti pieni lapsi. Jos vodka, olet yli 18-vuotias. Henkilö voi ostaa pelimerkkejä, ja se on tietyllä todennäköisyydellä 16-vuotiaana. Ja jos olet ostanut päiväkirjan, niin joko sinä tai perheellesi on seitsemän- ja 17-vuotias lapsi. Tämä on paljon tietoa.

kuvitella: tulet myymälään, katso joitakin tuotteita ja ymmärrät, että myymälä on kallis, halpa tai keskihintainen. Pyaterochkassa on 4–8 tuhatta ainutlaatuista tuotetta. On epätodennäköistä, että käytte kannettavaa tietokonetta ja kirjaat hinnat koko tavararyhmälle ja katsot sitten kaupungin keskimääräisiä hintoja ja tehdään johtopäätökset. Katsokaa vain viidestä kymmeneen tuotteeseen. Ja mitä tuotteita katsot, olemme myös mukana.

Tuotteet, joita ihmiset katsovat, muuttuvat myösaika. Yksinkertainen esimerkki: 20 vuotta sitten ei ollut matkaviestintään liittyviä tuotteita. Nyt voit, ei kaikissa myymälöissä, vaan ostaa SIM-kortin. 20 vuotta sitten Venäjällä oli yleensä kertaa hieman vaikeampaa kuin nyt, ja kulutus oli täysin erilainen.

- Miten asiakasprofiilien luominen tarjoaa heille alennuksia?

- On olemassa kaksi tuotetta: asiakasprofiili ja uskollisuus. Asiakasprofiili on tällainen tehtävä, kun sinulla ei ole merkintää ja käytät erilaisia ​​lähestymistapoja. Käytämme erilaisia ​​lähestymistapoja klusterointiin - laskemalla tavanomaisista tilastoista, lasketaan joitakin Z-nopeuksia, voimakkaita poikkeamia mediaanista ja päättymällä Word2veciin, tarkistamalla ja "kääntämällä" henkilö tyypin vektoriin TF-IDF: n keskiarvona Word2vecin kautta.

Z-pisteet, Z-pisteet - tilastollinen arviointi, joka ilmaiseetietyn tason etäisyys (mitattuna standardipoikkeamana) keskiarvosta tietosarjan yli. Erityisesti Z-pistemäärä on yrityksen luottokelpoisuuden ja sen konkurssin riski.

Vankka poikkeama englannista. vankka, ”vankka” on tietojen päästöjen arvioiden vakaus. Pidetään suhteessa mediaaniin.

Word2vec - Työkalu, jonka avulla voit edustaa sanoja vektorien muodossa.

TF-IDF - Tilastossa oleva termi, joka ilmaisee sanan merkityksen tekstikehyksessä.

Jos sinulla on jokin malli, joka tekeeOletetaan, että klusterointi onnistuu, jos ominaisuuksien lisäämisen jälkeen mallien laatu paranee. Täällä voit laskea taloudellisen vaikutuksen ja jonkinlaisen mittarin.

- Missä osissa kauppoja käytetään tuotteissasi?

- Kaiken. Testasimme henkilökohtaisen alennuksen puoli miljoonaa käyttäjää ymmärtääkseen sen vaikutuksen kaikissa 14 tuhannessa X5-myymälässä. Keräämme online-raportteja kaikista näistä kaupoista. Meillä on tuote-promo, joka on läsnä kaikissa myymälöissä. Meillä on valikoima matriisi, meillä on kysyntäennuste. He varmistavat, että myymälässä on ensinnäkin kanaa ja toiseksi kana ei kuole.

Nyt alamme tehdä tietokonevision, seei ole kaikissa myymälöissä ensin. Aloitetaan suurimmilla - on järkevää testata vain niitä. Tehtävä on melko yksinkertainen, siitä saadut edut ovat selvät. On olemassa tuote, se voi olla poissa hyllystä, mutta se voi olla varastossa, eikä tuolloin tavaroita osteta. Tämä on erittäin huono. Kauppa osti sen, mutta ei voi myydä. Parhaimmillaan käyttäjä ei osta tuotetta, ja pahimmillaan hän kääntyy ympäri ja lähtee, koska hänen ei tarvitse mennä sinne, missä hän ostaa kaksi tuotetta kolmesta, ja kolmanneksi hän menee toiseen myymälään. Hän tulee heti myymälään, jossa voit ostaa kaiken. Ja tämä ratkaistaan ​​tietokonevision avulla. Kamera laitetaan, hän huomaa, että sinulla on pieni tuote jäljellä. Ilmoitus tulee tästä vastuussa olevalle henkilölle, hän menee tämän tuotteen varastoon.

Toinen tehtävä on vuoro. Tiedämme, että myymälässä on jono. Joko olet linjassa, tyytymätön ja tuhlaa aikaa, jota kukaan ei tykkää, tai mene myymälään, katso jonoon, käänny ympäri ja lähde. Jos jonon syy on se, että valtio ei ole riittävästi työssä, mitään ei voida tehdä. Ja jos ongelma on, että ehdollinen myyjä istuu takahuoneessa, lepää ja juo teetä, ja ohjaaja kutsuu häntä. Myymälä on jo linjassa, ja kunnes se saavuttaa, istuu tietokoneella, käynnistää sen, alkaa vetää kassasta, aika kuluu. Silti katsellen häntä on hermostunut, ihmiset. Tämän kassan täytyy mennä ulos ennen jonon muodostamista, jotta poistumisen aikaan ihmiset ovat jo menneet kassaan. Se on melko helppo ratkaista tietokonevision avulla.

Testaa sen noin 150: ssämyymälöissä ja todennäköisesti Moskovassa. Ensinnäkin olemme itse Moskovassa, ja toiseksi, siellä on enemmän liikennettä. Sitten käy selväksi, miten tehdä parempi käyttäjäkokemus ja mikä on X5: n käyttö.

"En todellakaan pidä sanatietojen tutkijaa."

- Laajennatko hallintoasi?

- Tietenkin johtajat näkevät, että annamme tuloksia. Kukaan ei voi laajentaa tiimiä kahdesti, jos et toimi hyvin. Itse asiassa tämä seikka kertoo tehokkuudestamme.

- Sanoit, että sinulla on 32 työntekijää, kuinka paljon sinä rekrytoit?

- Vielä jonnekin 20-30. Käytämme nyt tietokonenäköä ja puhetekniikkaa osana johtamista. Tulee olemaan kaksi uutta osastoa, toisin sanoen tämä on kymmenen ihmistä, mielestäni ensi vuonna sovitaan vielä 10-15. On olemassa ns. Projektinopeuksia. Odotamme sen olevan 30–36 plus, jonnekin yli 60 henkilöä. Nämä ovat nimenomaan ihmisiä, jotka harjoittavat tietojen analysointia ja koneen oppimista.

- Kuka sinä kutsutte töihin?

- En todellakaan pidä sanasta "data scientist"koska sillä ei ole mitään tietoa. Voit tulla kymmeneen yritykseen, joissa etsit tietotieteilijää, ja nämä ovat kymmenen täysin eri asemaa. Pidän sanasta analyytikko. Osastoni nimet puhuvat puolestaan: on olemassa koneen oppimisen osasto, tietojenkäsittelyosasto, T & K-ryhmä, eli tutkimus, tietokonenäköosasto, puheteknologiaosasto ja tuote-analyysiryhmä, joka ratkaisee jonkin nykyisen tuoteryhmän ulkopuolella olevat ongelmat. .

Etsin ihmisiä, jotka voivat ohjelmoidaPython, tiedä todennäköisyysteoria ja matemaattiset tilastot, jos tarvitsen mallinnusta, sitten tarvitaan koneen oppimistaitoja. Tärkeintä on kuitenkin henkilön kyky ajatella ja analysoida. Olen yhä enemmän ajatellut, että analyyttinen ajattelu ja kriittinen on jotain, jota on hyvin vaikea opettaa. Jos 20–25 vuotta on jo jonkin verran maailmankuvaa, se ei todennäköisesti muutu.

- Tiesitkö tämän X5: ssä?

- Ei X5 johti minut tähän. Katson myös ihmisiä, kommunikoida, miten he toimivat. Kuten tiedätte, paras haastattelu on koeaika. Ja joskus näet, että tämä ei yksinkertaisesti ole tämän henkilön kannalta. Eli näyttää siltä, ​​että hän valmistui mekhmatista, näyttää siltä, ​​ettei hän ole tyhmä, mutta ei hän. Ei ole oikeaa asennetta, näe asioita. Se oli Daniel Kanemanin teoksessa "Thinking, Fast and Slow", jossa hän kuvasi, mikä vastaa kriittistä ajattelua. Tähän sisältyy pessimistinen näkemys maailmasta, ja se on enemmän luontaista laatua kuin se, joka on valitettavasti tai onneksi saatu.

- Jos analyytikko saapuu ja koeajan jälkeen ymmärrät, että hän on sopiva, mitä ihminen voi odottaa?

- Normaalisti IT: ssä on asteikot - juniori, keski,Senor ja harjoittelija. Edellä on harvoin esiintynyt - se on henkilökunta tai juontaja. Uskon, että on olemassa korkean tason inflaatio: meillä on paljon niitä, mutta itse asiassa ne harvoin jäävät keskimmäisen keskelle.

Jos otat markkinoiden keskipalkan, juniorisaa noin 120–150 tuhatta ruplaa ennen veroja kuukaudessa, keskellä - jopa 250 000. Seniorit noin 400 tuhatta ruplaa. Yläpalkki: Henkilökohtaisesti pidin tarjouksen käsissämme johtajalla, se oli yli 600 tuhatta ruplaa.

”Tietotiede on todellakin jonkinlainen” kirsikka kakussa ””

- Miten aloitit koneoppimisen?

- Yliopistolla ei ollut konettakoulutusta. Koska olen valmistunut lukiosta vuonna 2012, noin samaan aikaan, siihen liittyvä asia lisääntyi jälleen. Ei ollut aikaa. Hän valmistui kahdesta yliopistosta, joista viimeinen on Karlsruhen ammattikorkeakoulu, mekatroniikan maisteri. Tätä ennen hän opiskeli Moskovan kemian tekniikan instituutissa, nyt sitä kutsutaan Moskovan ammattikorkeakouluksi. En oppinut koneoppimista siellä.

Hauska asia: Nyt ne, jotka suorittavat tietojenkäsittelytieteen, haastatellaan, ja näyttää siltä, ​​että niiden taso on heikompi ja alhaisempi kuin fysiikan, tekniikan, tietojenkäsittelytieteen suorittaneiden ja sitten koneen oppimisen "haava". Ehkä tämä on pieni muutos, koska itse oppineet kaverit olivat aluksi vahvoja, oppineet jotain uutta ja tulivat. Ja tietojenkäsittely on todellakin jonkinlainen "kirsikka kakulla", ja jos itse "ei ole" kakkua, mutta on "kirsikka", niin tämä ei ole niin kiinnostavaa.

- Miten opit tämän?

- On olemassa vanha sanonta, että Courserassa on kaksivakava kurssi, jopa puoli. Tämä on Hintonin koneen oppimisen ja hermoverkkojen kurssi (kurssi ei ole enää saatavilla Courseralla, mutta voit katsella sitä YouTubessa - "High-Tech") ja Daphne Kollerin kurssin todennäköisyydellisistä ei-graafisista malleista.

Kollerin kurssi on videotallenteita,hän lukee Stanfordin jatko-opiskelijoille. Siksi kutsumalla häntä ei ole täysin vakava, ei käänny kieltä. Hintonin kurssi kestää 16 viikkoa, ja Kollerilla on kolme viiden ja kuuden viikon kursseja. Ja minä keräsin voiman nyrkkiin, menin läpi ensimmäisen kurssin ja tajusin, että toinen ja kolmas eivät ole valmiita ohittamaan.

Mutta Coursera ei ole ainoa keino. Luin paljon kirjoja. Muuten, olen lopettanut Bradley Efronin tilastokirjan (amerikkalainen tilastotieteilijä, Yhdysvaltain kansallisen kunniamerkin palkinnon saaja - Yhdysvaltain korkeimman valtion palkinnon saaja "Hi-Tech"). Sitä ennen Jena Godfellowin (amerikkalainen koneopiskelija, Google Brain - "High Tech") syvä oppiminen. Tämä on jatkuva oppimisprosessi. Coursera on vain yksi resursseista, Kaggle (tietotekniikan asiantuntijoiden online-yhteisö, jossa järjestetään säännöllisesti kilpailuja - "High-tech") - on toinen, mutta tärkeintä on lukea, lukea, lukea ja tarkistaa. Jos luet ja ei ymmärrä, tämä on huono. Jos ymmärrät, miten tämä toimii, voit tehdä mitä tahansa.

Se on kuin kertotaulukossa. Kuvittele, että henkilö ei ymmärrä kertotaulukkoa, mutta on oppinut sen sydämestä. Häneltä kysytään: "Kuusi-kuusi?" - "36". - "Seitsemän kahdeksan?" - "56". - "No, hyvin, viimeinen kysymys, 10: 11?" - Mies sanoo: "En tiedä, tämä ei ollut kertolaskussa". No niin. Tapaan usein tällaisten ihmisten kanssa. 10–11 on paljon helpompi laskea, mutta tämä ei ole taulukossa, sinun täytyy ymmärtää periaate. Jos ymmärrät periaatteet, niin kaikki on paljon helpompaa.

Kaikki muu riippuu henkilöstä. Näyttää siltä, ​​että opimme itsellemme mitään. Me vain autamme ja eivät häiritse muita ihmisiä. Kaikki tämä on itsekuria.

- Kerro meille tietojenkäsittelytieteestä HSE: ssä.

- Tämä on vapaa kurssi, se on standardin sisälläohjelmat, kerron siitä yksinkertaisia ​​yksinkertaisia ​​asioita, joita monille ihmisille - ilmestys. Esimerkiksi, mitkä ovat mittarit, miksi ne ovat lainkaan, miten ne eroavat toisistaan, missä tapauksissa se on tarpeen, miten testata ajatuksesi siitä, mitä A / B-testi on. Tämä on se, mitä minä esitin itselleni, että on tärkeää, että ihmiset tietävät ja mitä he todella tarvitsevat työstään.

- Miten näet vähittäiskaupan tulevaisuuden viidestä kymmeneen vuoteen?

- Jos sitten puhumme elintarvikkeiden vähittäiskaupastahypermarket-muoto kuolee. Tämä näkyy nyt valtioissa, kuinka suuret kauppakeskukset kuolevat siellä, ja myös Venäjällä. Aikaisemmin mikä oli kulutuksen malli? Tulemme kauppakeskukseen, elokuvateatteriin, ruokakentälle, ostamme jotain muuta. Nyt tulemme kotiin, ivi, Okko, Netflix, Yandex, ruoka, toimitusklubi, toimitus ravintolasta, verkkokauppa. Meidän on mentävä kohti henkilökohtaisuutta.

- Mitä se tarkoittaa kuluttajalle?

- Mies käyttää mitä? Että hän voi varaa ja joka on hänelle kätevä. Näin ollen on tarpeen vähentää kustannuksia, säilyttää sama laatu tai lisätä sitä. Täällä tulee mieleen henkilökohtaisuutta.

- Henkilö ostaa sen, mitä hän varaa. Nyt väestön reaalitulot laskevat, kustannukset laskevat.

- Tässä tilanteessa tallentaa talouttatuntea paremmin ja kasvaa. On kaksi tapaa ratkaista monia ongelmia jälleenmyyjille. Automaatio tai palkata kymmenen enemmän. Lyhyellä aikavälillä toinen reitti on voittava strategia, koska integraatio on kallista, jo pitkään jotakin menee pieleen, voit menettää palkkion. Kuvittele nyt, että olet osaston johtaja, jolla on erittäin suuri palkkio, ja voit menettää sen. Työskentelet yhtiössä kahden vuoden kuluttua, kun tämän automaation tulos on tiedossa tai ei, ja he ylistävät sinua niistä - ei ole selvää. Ja voitte nyt palkinnon. Siksi palkkaamme vielä kymmenen ihmistä. Mutta tämä johtaa suuriin menetyksiin pitkällä aikavälillä.