Miten tietokoneen visio voittaa jonot ja tyhjät hyllyt supermarketeissa - Valery Babushkin, X5 Retail Group

”On helppo kasvaa 20%, jos olet avannut puolitoista kertaa enemmän kauppoja”

– Puhuessasi sinä

sanoi, että X5 Retail Groupin liikevaihto oli 1 286 biljoonaa ruplaa vuonna 2017, ja kustannusten leikkaaminen jopa pienellä murto-osalla johtaa valtaviin voittoihin. Miten X5 laajenee?

— X5:n liikevaihto jatkaa kasvuaan.Yleisesti ottaen markkinat ovat siirtymässä vähittäiskaupan keskittymiseen. Tällä hetkellä kolmella johtavalla jälleenmyyjällämme on noin 20 % markkinoista, ja näemme kehittyneissä kapitalistisissa maissa tämän osuuden olevan noin 70–75 %.

Joka päivä keskimäärin X5 avaa kuusi uuttakauppoja. Kun puhumme, X5 avaa uuden myymälän (nauraa). Itse asiassa asiat ovat hyvin, toisin kuin muut markkinatoimijat. Jos tarkastelet avoimia tietoja, yksi niistä, 12 prosentin kasvun myötä, kasvoi liikevaihdolla vain 84%. On helppo laskea: ne alkavat työskennellä negatiivisesti. On olemassa tällainen indikaattori, LFL - kuten samankaltainen, samojen myymälöiden vertailu vuodessa. X5: ssä, vaikka pieni, mutta plus. Toisin sanoen, ei ole vaikea kasvaa 20%, jos olet avannut puolitoista kertaa enemmän kauppoja, mutta tämä on tosiasiallisesti negatiivinen kasvu. Jos kasvaa, koska vanhat myymälät toimivat paremmin ja uusia avoimia, tämä on varsin myönteistä.

- Mitä mieltä olette, mikä osuus joukkosi ansioista tässä?

– Se ei ole vielä kovin suuri, koska joukkuemuodostui ei niin kauan sitten. Olkaamme rehellisiä, X5:n kasvu vuonna 2017 ei todennäköisesti johdu data-analytiikan soveltamisesta vuonna 2018 perustetun tiimin avulla.

Osastomme johtaja on Anton Mironenkov, mies, joka osallistui X5-yrityksen luomiseen. Hän oli mukana Perekrestokin ja Pyaterochkan fuusiossa, jonka jälkeen X5 ilmestyi. 

Otamme huomioon big datan suunnanstrateginen. Vähittäiskaupan tulevaisuus riippuu siitä, kuinka nopeasti vähittäiskauppiaat oppivat kaupallistamaan ja käyttämään päivittäin suuria määriä tuottamaamme dataa prosessien optimointiin ja asiakaskokemuksen parantamiseen. Siksi päätimme erottaa tämän kaiken omaan suuntaan ja keskittyä siihen enemmän, jotta se kehittyy nopeammin.

Anton Mironenkov, Big Data Directorate X5: n johtaja

Tässä osastossa meillä on omat valmiutemme,klusteri, kehittäjät, testaajat, analyytikot, projektit, tuotteet - kaikki mitä tarvitset. Olemme jo tehneet joitain asioita, ja tämä on paljon edistystä alle vuoteen. Ymmärrämme selvästi, että annamme yritykselle melko suuren voiton, mutta taas nämä tulokset näkyvät vasta vuoden kuluttua.

Kaikki tarkastuksessa olevat tiedot - jos ostit vodkan, olet yli 18-vuotias.

- Jos tulen "risteykseen" ja ostan, mitä tämä kaikki otatte analyysia varten?

- Tarkista. Tuotteesi luonnehtivat sinua melko hyvin. Jos ostat vaippoja, sinulla on todennäköisesti pieni lapsi. Jos vodka, olet yli 18-vuotias. Henkilö voi ostaa pelimerkkejä, ja se on tietyllä todennäköisyydellä 16-vuotiaana. Ja jos olet ostanut päiväkirjan, niin joko sinä tai perheellesi on seitsemän- ja 17-vuotias lapsi. Tämä on paljon tietoa.

kuvitella: tulet myymälään, katso joitakin tuotteita ja ymmärrät, että myymälä on kallis, halpa tai keskihintainen. Pyaterochkassa on 4–8 tuhatta ainutlaatuista tuotetta. On epätodennäköistä, että käytte kannettavaa tietokonetta ja kirjaat hinnat koko tavararyhmälle ja katsot sitten kaupungin keskimääräisiä hintoja ja tehdään johtopäätökset. Katsokaa vain viidestä kymmeneen tuotteeseen. Ja mitä tuotteita katsot, olemme myös mukana.

Tuotteet, joita ihmiset katsovat, muuttuvat myösaika. Yksinkertainen esimerkki: 20 vuotta sitten ei ollut matkaviestintään liittyviä tuotteita. Nyt voit, ei kaikissa myymälöissä, vaan ostaa SIM-kortin. 20 vuotta sitten Venäjällä oli yleensä kertaa hieman vaikeampaa kuin nyt, ja kulutus oli täysin erilainen.

- Miten asiakasprofiilien luominen tarjoaa heille alennuksia?

- On olemassa kaksi tuotetta: asiakasprofiili ja uskollisuus. Asiakasprofiili on tällainen tehtävä, kun sinulla ei ole merkintää ja käytät erilaisia ​​lähestymistapoja. Käytämme erilaisia ​​lähestymistapoja klusterointiin - laskemalla tavanomaisista tilastoista, lasketaan joitakin Z-nopeuksia, voimakkaita poikkeamia mediaanista ja päättymällä Word2veciin, tarkistamalla ja "kääntämällä" henkilö tyypin vektoriin TF-IDF: n keskiarvona Word2vecin kautta.

Z-pisteet, Z-pisteet- tilastollinen arvio, joka ilmaiseeTietyn tason etäisyys (mitattu standardipoikkeamana) tietojoukon keskiarvosta. Erityisesti Z-pistemäärä on tulosindikaattori yrityksen luottokelpoisuudesta ja konkurssiriskistä.

Vankka poikkeama englannista. vankka, ”vankka” on tietojen päästöjen arvioiden vakaus. Pidetään suhteessa mediaaniin.

Word2vecon työkalu, jonka avulla voit esittää sanoja vektoreina.

TF-IDF- tilastollinen termi, joka ilmaisee sanan tärkeysasteen tekstikorpuksessa.

Jos sinulla on jokin malli, joka tekeeOletetaan, että klusterointi onnistuu, jos ominaisuuksien lisäämisen jälkeen mallien laatu paranee. Täällä voit laskea taloudellisen vaikutuksen ja jonkinlaisen mittarin.

- Missä osissa kauppoja käytetään tuotteissasi?

- Kaikkiaan.Testasimme henkilökohtaista alennusta puolella miljoonalla käyttäjällä ymmärtääksemme sen vaikutuksen kaikissa 14 tuhannessa X5-myymälässä. Keräämme interaktiivisia raportteja kaikista näistä myymälöistä. Meillä on kampanjatuote, joka on saatavilla kaikissa myymälöissä. Meillä on valikoimamatriisi, meillä on kysyntäennuste. He varmistavat, että ensinnäkin kaupassa on kanaa ja toiseksi, että kana ei ole mätä.

Aloitetaan nyt tietokonenäön tekeminenei ole aluksi saatavilla kaikissa myymälöissä. Aloitetaan suurimmista - on järkevää testata vain niissä. Tehtävä on melko yksinkertainen, hyödyt ovat selvät. Tuote on olemassa, se ei välttämättä ole hyllyssä, mutta se voi olla varastossa, ja sillä hetkellä tuotetta ei osteta. Tämä on erittäin huono. Kauppa osti sen, mutta ei voi myydä sitä. Parhaassa tapauksessa käyttäjä ei osta tuotetta, ja pahimmassa tapauksessa hän kääntyy ja lähtee, koska hänen ei tarvitse tulla sinne, missä hän ostaa kaksi kolmesta tuotteesta ja mennä toiseen kauppaan kolmas. Hän tulee suoraan kauppaan, josta hän voi ostaa kaiken. Ja tämä on ratkaistu tietokonenäön avulla. Kamera asetetaan paikalleen ja se havaitsee, että sinulla on vähän tuotetta jäljellä. Tästä vastuussa olevalle henkilölle tulee ilmoitus, hän menee varastoon ostamaan tämän tuotteen.

Toinen tehtävä on vuoro. Tiedämme, että myymälässä on jono. Joko olet linjassa, tyytymätön ja tuhlaa aikaa, jota kukaan ei tykkää, tai mene myymälään, katso jonoon, käänny ympäri ja lähde. Jos jonon syy on se, että valtio ei ole riittävästi työssä, mitään ei voida tehdä. Ja jos ongelma on, että ehdollinen myyjä istuu takahuoneessa, lepää ja juo teetä, ja ohjaaja kutsuu häntä. Myymälä on jo linjassa, ja kunnes se saavuttaa, istuu tietokoneella, käynnistää sen, alkaa vetää kassasta, aika kuluu. Silti katsellen häntä on hermostunut, ihmiset. Tämän kassan täytyy mennä ulos ennen jonon muodostamista, jotta poistumisen aikaan ihmiset ovat jo menneet kassaan. Se on melko helppo ratkaista tietokonevision avulla.

Testaamme sitä noin 150 kohdallamyymälöissä ja todennäköisesti Moskovassa. Ensinnäkin olemme itse Moskovassa, ja toiseksi täällä on enemmän liikennettä. Sitten käy selväksi, miten käyttökokemusta voidaan parantaa ja mitä hyötyä X5:stä on.

"En todellakaan pidä sanatietojen tutkijaa."

- Laajennatko hallintoasi?

- Tietenkin johtajat näkevät, että annamme tuloksia. Kukaan ei voi laajentaa tiimiä kahdesti, jos et toimi hyvin. Itse asiassa tämä seikka kertoo tehokkuudestamme.

- Sanoit, että sinulla on 32 työntekijää, kuinka paljon sinä rekrytoit?

- Vielä jonnekin 20-30. Käytämme nyt tietokonenäköä ja puhetekniikkaa osana johtamista. Tulee olemaan kaksi uutta osastoa, toisin sanoen tämä on kymmenen ihmistä, mielestäni ensi vuonna sovitaan vielä 10-15. On olemassa ns. Projektinopeuksia. Odotamme sen olevan 30–36 plus, jonnekin yli 60 henkilöä. Nämä ovat nimenomaan ihmisiä, jotka harjoittavat tietojen analysointia ja koneen oppimista.

- Kuka sinä kutsutte töihin?

- En todellakaan pidä sanasta "tietotieteilijä"koska se ei sisällä mitään tietoa. Voit tulla kymmeneen yritykseen, joissa he etsivät datatieteilijää, ja nämä ovat kymmenen täysin erilaista tehtävää. Pidän sanasta "analyytikko". Osastojeni nimet puhuvat puolestaan: näiden ongelmien ratkaisemiseksi on koneoppimisosasto, data-analyysiosasto, T&K-ryhmä eli tutkimus, tietokonenäköosasto, puhetekniikan osasto ja ei-tuoteanalytiikkaryhmä jotka ovat olemassa olevan tuotesuunnan ulkopuolella.

Etsin ihmisiä, jotka voivat ohjelmoidaPython, tiedä todennäköisyysteoria ja matemaattiset tilastot, jos tarvitsen mallinnusta, sitten tarvitaan koneen oppimistaitoja. Tärkeintä on kuitenkin henkilön kyky ajatella ja analysoida. Olen yhä enemmän ajatellut, että analyyttinen ajattelu ja kriittinen on jotain, jota on hyvin vaikea opettaa. Jos 20–25 vuotta on jo jonkin verran maailmankuvaa, se ei todennäköisesti muutu.

- Tiesitkö tämän X5: ssä?

- Ei X5 johti minut tähän. Katson myös ihmisiä, kommunikoida, miten he toimivat. Kuten tiedätte, paras haastattelu on koeaika. Ja joskus näet, että tämä ei yksinkertaisesti ole tämän henkilön kannalta. Eli näyttää siltä, ​​että hän valmistui mekhmatista, näyttää siltä, ​​ettei hän ole tyhmä, mutta ei hän. Ei ole oikeaa asennetta, näe asioita. Se oli Daniel Kanemanin teoksessa "Thinking, Fast and Slow", jossa hän kuvasi, mikä vastaa kriittistä ajattelua. Tähän sisältyy pessimistinen näkemys maailmasta, ja se on enemmän luontaista laatua kuin se, joka on valitettavasti tai onneksi saatu.

- Jos analyytikko saapuu ja koeajan jälkeen ymmärrät, että hän on sopiva, mitä ihminen voi odottaa?

- Normaalisti IT-alalla on asteikkoja - junior, keski,seniori ja harjoittelija. Sitä löytyy harvoin yllä - tämä on henkilökunta tai johtaja. Uskon, että johtoasemassa on inflaatio: meillä niitä on paljon, mutta itse asiassa he harvoin saavuttavat keskimääräistä keskipaikkaa.

Jos otat markkinoiden keskipalkan, juniorisaa noin 120–150 tuhatta ruplaa ennen veroja kuukaudessa, keskellä - jopa 250 000. Seniorit noin 400 tuhatta ruplaa. Yläpalkki: Henkilökohtaisesti pidin tarjouksen käsissämme johtajalla, se oli yli 600 tuhatta ruplaa.

”Tietotiede on todellakin jonkinlainen” kirsikka kakussa ””

– Miten aloitit koneoppimisen?

– Yliopistossa ei ollut tietojenkäsittelytiedettä ollenkaan.koulutusta. Koska valmistuin yliopistosta vuonna 2012, samaan aikaan tapahtui toinen nousu siihen liittyvissä asioissa. Ei ollut aikaa. Valmistunut kahdesta yliopistosta, joista viimeinen oli Karlsruhen ammattikorkeakoulu, mekatroniikan maisteri. Sitä ennen hän opiskeli Moskovan kemiantekniikan instituutissa, jota nykyään kutsutaan Moskovan ammattikorkeakouluksi. En ollut mukana koneoppimisessa siellä enkä sielläkään.

Hauska asia: Nyt ne, jotka suorittavat tietojenkäsittelytieteen, haastatellaan, ja näyttää siltä, ​​että niiden taso on heikompi ja alhaisempi kuin fysiikan, tekniikan, tietojenkäsittelytieteen suorittaneiden ja sitten koneen oppimisen "haava". Ehkä tämä on pieni muutos, koska itse oppineet kaverit olivat aluksi vahvoja, oppineet jotain uutta ja tulivat. Ja tietojenkäsittely on todellakin jonkinlainen "kirsikka kakulla", ja jos itse "ei ole" kakkua, mutta on "kirsikka", niin tämä ei ole niin kiinnostavaa.

- Miten opit tämän?

— Vanha sanonta sanoo, että Courseralla on kaksivakava kurssi, jopa puolitoista. Tämä on Hintonin koneoppimista ja hermoverkkoja käsittelevä kurssi (kurssi ei ole enää saatavilla Courserassa, mutta se on katsottavissa YouTubessa - Hi-Tech) ja Daphne Kollerin kurssi todennäköisyyspohjaisista ei-graafisista malleista.

Kollerin kurssi on videotallenteita,hän lukee Stanfordin jatko-opiskelijoille. Siksi kutsumalla häntä ei ole täysin vakava, ei käänny kieltä. Hintonin kurssi kestää 16 viikkoa, ja Kollerilla on kolme viiden ja kuuden viikon kursseja. Ja minä keräsin voiman nyrkkiin, menin läpi ensimmäisen kurssin ja tajusin, että toinen ja kolmas eivät ole valmiita ohittamaan.

Mutta Coursera ei ole ainoa vaihtoehto.Luen paljon kirjoja. Muuten, olen nyt saanut valmiiksi Bradley Efronin tilastokirjan (amerikkalainen tilastotieteilijä, Yhdysvaltain kansallisen kunniamitalin voittaja - korkein amerikkalaisten tiedemiesten valtion palkinto - "High-Tech"). Sitä ennen oli Ian Godfellow'n (amerikkalainen koneoppimisen asiantuntija, Google Brain - Hi-Tech) kirja syväoppimisesta. Se on jatkuva oppimisprosessi. Coursera on vain yksi resurssi, Kaggle (verkkotietotekniikan yhteisö, joka isännöi säännöllisesti kilpailuja - "High-Tech") on toinen, mutta tärkeintä on lukea, lukea, lukea ja tarkistaa. Jos luet sen etkä ymmärrä sitä, se on huono. Jos ymmärrät kuinka se toimii, voit tehdä mitä tahansa.

Se on kuin kertotaulukko.Kuvittele, että henkilö ei ymmärrä kertotaulukkoa, mutta on oppinut sen ulkoa. He kysyvät häneltä: "Kuusi kertaa kuusi?" - "36". - "Seitsemän kahdeksalla?" - "56". - "Okei, viimeinen kysymys, 10-11?" - Mies sanoo: "En tiedä, se ei ollut kertotaulukossa." Se siitä. Näitä ihmisiä tapaan usein. 10 x 11 on paljon helpompi laskea, mutta tämä ei ole taulukossa, sinun on ymmärrettävä periaate. Jos ymmärrät periaatteet, kaikki on paljon helpompaa.

Kaikki muu riippuu henkilöstä. Näyttää siltä, ​​että opimme itsellemme mitään. Me vain autamme ja eivät häiritse muita ihmisiä. Kaikki tämä on itsekuria.

— Kerro meille datatieteen kurssistasi HSE:ssä.

- Tämä on vapaa kurssi, se on standardin sisälläohjelmat, kerron siitä yksinkertaisia ​​yksinkertaisia ​​asioita, joita monille ihmisille - ilmestys. Esimerkiksi, mitkä ovat mittarit, miksi ne ovat lainkaan, miten ne eroavat toisistaan, missä tapauksissa se on tarpeen, miten testata ajatuksesi siitä, mitä A / B-testi on. Tämä on se, mitä minä esitin itselleni, että on tärkeää, että ihmiset tietävät ja mitä he todella tarvitsevat työstään.

- Miten näet vähittäiskaupan tulevaisuuden viidestä kymmeneen vuoteen?

– Jos puhumme elintarvikkeiden vähittäiskaupasta, niinHypermarket-muoto kuolee pois. Tämä näkyy nyt Yhdysvalloissa, kuinka suuret kauppakeskukset kuolevat siellä, ja muuten myös Venäjällä. Millainen kulutusmalli oli ennen? Menemme ostoskeskukseen, elokuvateatteriin, ruokasaliin ja ostamme jotain muuta. Nyt tullaan kotiin, ivi, Okko, Netflix, Yandex.Eda, Delivery Club, toimitus ravintolasta, verkkokaupat. Meidän on siirryttävä kohti personointia.

- Mitä se tarkoittaa kuluttajalle?

- Mies käyttää mitä? Että hän voi varaa ja joka on hänelle kätevä. Näin ollen on tarpeen vähentää kustannuksia, säilyttää sama laatu tai lisätä sitä. Täällä tulee mieleen henkilökohtaisuutta.

- Henkilö ostaa sen, mitä hän varaa. Nyt väestön reaalitulot laskevat, kustannukset laskevat.

— Tällaisessa tilanteessa myymälätalouden formaatitvoi paremmin ja kasvaa. On kaksi tapaa ratkaista monia jälleenmyyjien ongelmia. Joko automaatio tai palkkaa kymmenen henkilöä lisää. Lyhyellä aikavälillä toinen tapa on voittava strategia, koska integrointi on kallista, aikaa vievää ja jos jokin menee pieleen, voit menettää bonuksesi. Kuvittele nyt, että olet osaston johtaja, jolla on erittäin suuri bonus, ja saatat menettää sen. On epäselvää, työskenteletkö yrityksessä kahden vuoden kuluttua, kun tämän automaation tulokset tulevat tiedoksi, vai et, ja niistä kehutaan. Ja sinulla voi jo olla bonus. Siksi palkkaamme kymmenen henkilöä lisää. Mutta tämä johtaa suureen tappioon pitkällä aikavälillä.