كيف ستفوز رؤية الكمبيوتر في طوابير ورفوف فارغة في محلات السوبر ماركت - Valery Babushkin ، X5 Retail Group

"من السهل أن تنمو بنسبة 20٪ إذا فتحت متاجر أكثر من مرة ونصف"

- في خطابك أنت

قال إن إيرادات X5 Retail Group وصلت إلى 1.286 تريليون روبل في عام 2017 ، وخفض التكاليف حتى بالنسبة لحصة صغيرة يؤدي إلى أرباح ضخمة. كيف يتم توسيع X5؟

- حجم التداول في X5 سيستمر في النمو. بشكل عام ، يسعى السوق إلى الاندماج في تجارة التجزئة. حاليًا ، لدينا ثلاثة متاجر تجزئة رائدة تحتل حوالي 20٪ من السوق ، ونرى في بلدان الرأسمالية المتقدمة أن هذه الحصة ستتراوح بين 70 و 75٪.

كل يوم في المتوسط ​​X5 يفتح ستة جديدةالمحلات التجارية. بينما نتحدث ، يفتح X5 متجرًا جديدًا (يضحك). في الواقع ، الأمور تسير على ما يرام ، على عكس بعض اللاعبين الآخرين في السوق. إذا نظرت إلى البيانات المفتوحة ، واحدة منها ، مع زيادة في مساحة 12 ٪ ، زاد حجم التداول بنسبة 84 ٪ فقط. من السهل حسابها: فهي تبدأ في العمل بطريقة سلبية. هناك مثل هذا المؤشر ، LFL - مثل لمثل ، مقارنة بين المتاجر نفسها في السنة. في X5 على ذلك ، على الرغم من أنها صغيرة ، ولكن زائد. وهذا يعني أنه من السهل أن تنمو بنسبة 20٪ إذا فتحت متاجر أكثر من مرة ونصف ، لكن هذا نمو سلبي في الواقع. إذا كبرت نظرًا لحقيقة أن المتاجر القديمة تعمل بشكل أفضل وتفتح متاجر جديدة ، فهذا أمر إيجابي للغاية.

- ما رأيك ، ما هي حصة فريقك في هذا؟

- في حين ليست كبيرة جدا ، لأن الفريقتشكلت منذ وقت ليس ببعيد. لنكن صريحين ، فإن نمو X5 في عام 2017 غير مرجح نظرًا لحقيقة أننا نستخدم تحليل البيانات بمساعدة الفريق الذي تم إنشاؤه في عام 2018.

رئيس مدينتنا هو أنطون ميرونكوف ، الرجل الذي شارك في إنشاء شركة X5. كان يشارك في دمج "مفترق طرق" و "Pyaterochka" ، وبعد ذلك ظهرت X5.

نحن نعتبر اتجاه البيانات الضخمة إستراتيجية. يرتبط مستقبل صناعة البيع بالتجزئة بالسرعة التي يتعلم بها تجار التجزئة تسييل واستخدام البيانات التي ننتجها بكميات كبيرة بما فيه الكفاية كل يوم لتحسين العمليات وتحسين تجربة العملاء. لذلك ، قررنا تخصيص كل هذا في اتجاه منفصل وإعطاء تركيز أكبر بحيث يتطور بشكل أسرع.

أنطون ميرونينكوف ، رئيس إدارة البيانات الضخمة X5

داخل هذه المديرية ، لدينا قوتنا الخاصة ،الكتلة ، المطورين ، المختبرين ، المحللين ، المشاريع ، المنتجات - كل ما تحتاجه. لقد قمنا بالفعل ببعض الأشياء ، وهذا تقدم كبير جدًا لمدة تقل عن عام. نحن ندرك بوضوح أننا سنعطي الشركة ربحًا كبيرًا إلى حد ما ، ولكن مرة أخرى ، لن تكون هذه النتائج مرئية إلا بعد مرور عام.

جميع المعلومات في الشيك - إذا كنت قد اشتريت الفودكا ، فأنت أكبر من 18 عامًا.

- إذا جئت إلى "مفترق الطرق" وأجرت عملية شراء ، فما الذي ستأخذه للتحليل؟

- تحقق. منتجاتك تميزك بشكل جيد. إذا اشتريت حفاضات ، فربما يكون لديك طفل صغير. إذا الفودكا ، فأنت أكبر من 18 عامًا. يمكن لأي شخص شراء الرقائق ، وسيكون هناك احتمال معيّن مراهق يبلغ من العمر 16 عامًا. وإذا كنت قد اشتريت مذكرات ، فحينئذٍ يكون لدى أنت أو عائلتك طفل من سن السابعة إلى السابعة عشرة. هذا كثير من المعلومات.

تخيل: أتيت إلى المتجر ونظرت إلى بعض المنتجات وأدركت أن المتجر باهظ الثمن أو رخيص الثمن أو متوسط ​​السعر. يوجد في Pyaterochka من 4 إلى 8 آلاف منتج فريد. من غير المحتمل أن تذهب مع دفتر ملاحظات وتكتب أسعار مجموعة البضائع بأكملها ، ثم تنظر في متوسط ​​أسعار السلع في المدينة وتوصل إلى نتيجة. مجرد إلقاء نظرة على المنتجات خمسة إلى عشرة. وهكذا ما هي المنتجات التي تنظر إليها ، نحن نشارك أيضًا.

تتغير المنتجات التي ينظر إليها الأشخاص أيضًابمرور الوقت مثال بسيط: قبل 20 عامًا ، لم تكن هناك منتجات متعلقة باتصالات المحمول. يمكنك الآن ، ليس في جميع المتاجر ، ولكن شراء بطاقة SIM. منذ 20 عامًا في روسيا ، كانت الأوقات عمومًا أصعب قليلاً مما هي عليه الآن ، وكان الاستهلاك مختلفًا تمامًا.

- كيف يتم إنشاء ملفات تعريف العملاء لنقدم لهم خصومات؟

- هناك نوعان من المنتجات: ملف تعريف العملاء والولاء. يعد ملف تعريف العميل مهمة كهذه عندما لا يكون لديك بعض العلامات ويستخدم طرقًا مختلفة. نحن نستخدم طرقًا مختلفة للتجميع - بدءًا من الإحصاءات القياسية ، ونحسب بعض سرعات Z ، والانحرافات القوية عن الوسيط ، وننتهي مع Word2vec ، ونُفِّذ على الفحوصات ، و "ترجمة" الشخص إلى نوع المتجه الذي يتم حسابه عبر TF-IDF عبر Word2vec.

درجات Z ، درجة Z - التقييم الإحصائي الذي يعبر عنهالمسافة (تقاس على النحو الانحراف المعياري) لمستوى معين من القيمة المتوسطة على مجموعة البيانات. على وجه الخصوص ، فإن علامة Z هي مؤشر إخراج للجدارة الائتمانية للشركة ومخاطر إفلاسها.

انحرافات قوية عن اللغة الإنجليزية. قوي ، "قوي" هو استقرار التقديرات فيما يتعلق بالانبعاثات في البيانات. تعتبر نسبة إلى الوسيط.

Word2vec - أداة تسمح لك بتمثيل الكلمات في شكل متجهات.

TF-الجيش الإسرائيلي - المصطلح في الإحصاء ، يدل على درجة أهمية الكلمة في نصوص النصوص.

إذا كان لديك أي نموذج يجعلاقتراحًا شخصيًا ، فلنفترض أن التكتل ناجح إذا تحسنت جودة النماذج بعد إضافة الخصائص. هنا يمكنك حساب التأثير الاقتصادي ، ونوع من المتري.

- في أي جزء من المتاجر تستخدم منتجاتك؟

- في الكل. اختبرنا الخصم الشخصي لنصف مليون مستخدم لفهم تأثيره في جميع متاجر X5 X 14. نحن نجمع تقارير عبر الإنترنت من جميع هذه المتاجر. لدينا عرض ترويجي للمنتج موجود في جميع المتاجر. لدينا مصفوفة متنوعة ، لدينا تنبؤ بالطلب. إنهم يتأكدون من وجود دجاجة في المتجر أولاً ، وثانياً ، لا يموت الدجاج.

الآن نبدأ في القيام برؤية الكمبيوتر ، ذلكلن يكون في جميع المتاجر في البداية. لنبدأ بأكبرها - من المنطقي اختبارها فقط. المهمة بسيطة للغاية ، والفوائد منها واضحة. يوجد منتج ، قد يكون غائبًا على الرف ، ولكنه قد يكون موجودًا في المستودع ، وفي هذه اللحظة لا يتم شراء البضائع. هذا سيء جدا المتجر اشترى ، ولكن لا يمكن بيعها. في أحسن الأحوال ، لن يشتري المستخدم المنتج ، وفي أسوأ الأحوال ، سوف يستدير ويغادر ، لأنه لا يحتاج إلى المجيء إلى المكان الذي سيشتري منه منتجين من ثلاثة ، والثالث سوف يذهب إلى متجر آخر. سوف يأتي على الفور إلى المتجر حيث يمكنك شراء كل شيء. ويتم حل هذا بمساعدة رؤية الكمبيوتر. تكتشف الكاميرا أن لديك القليل من المنتجات المتبقية. يأتي إشعار إلى الشخص المسؤول عن ذلك ، ويذهب إلى المستودع لهذا المنتج.

المهمة الثانية هي الدور. نحن نعلم أن لدينا قائمة انتظار في المتجر. إما أن تكون واقفاً في صف ، غير راضٍ ومضيعة للوقت لا يحبه أحد ، أو يذهب إلى المتجر ، ينظر إلى قائمة الانتظار ، يستدير ويترك. إذا كان سبب قائمة الانتظار هو أن الدولة تعاني من نقص الموظفين ، فلا يمكن فعل شيء حيال ذلك. وإذا كانت المشكلة هي أن البائعة المشروطة تجلس في الغرفة الخلفية وتستريح وتشرب الشاي ، فإن المخرج يتصل بها. المتجر في طابور بالفعل ، وحتى يصل ، يجلس على الكمبيوتر ، يقوم بتشغيله ، يبدأ في سحب الصراف ، سيمضي الوقت. لا تزال تنظر إليها ، فهي عصبية ، والناس أيضا. يجب أن يخرج أمين الصندوق هذا قبل تشكيل قائمة الانتظار ، بحيث بحلول وقت الخروج ، كان الناس قد ذهبوا بالفعل إلى أمين الصندوق. من السهل حلها باستخدام رؤية الكمبيوتر.

سنختبرها في حوالي 150المخازن ، وعلى الأرجح في موسكو. أولاً ، نحن أنفسنا في موسكو ، وثانيا ، هناك المزيد من الحركة هنا. ثم يصبح من الواضح كيفية جعل تجربة المستخدم أفضل وما هو استخدام X5.

"أنا حقا لا أحب كلمة عالم البيانات."

- هل توسيع إدارتك؟

- بالطبع ، يرى المديرون أننا نعطي نتائج. لا أحد يسمح لك بتوسيع الفريق مرتين إذا كنت لا تعمل بشكل جيد. في حد ذاته ، هذه الحقيقة تتحدث عن فعاليتنا.

- قلت إن لديك 32 شخصًا يعملون ، كم منهم سوف تجندهم؟

- لا يزال في مكان ما 20-30. سنستخدم الآن تقنية رؤية الكمبيوتر والكلام كجزء من إدارتي. سيكون هناك قسمان جديدان ، وهذا هو ، بالإضافة إلى عشرة أشخاص ، في رأيي ، يتم الاتفاق على 10-15 أخرى للعام المقبل. هناك ما يسمى معدلات المشروع. نتوقع أن يكون عددهم أكبر من 30 إلى 36 شخصًا ، في مكان ما يزيد عن 60 شخصًا. هؤلاء هم على وجه التحديد الأشخاص الذين يشاركون في تحليل البيانات والتعلم الآلي.

- من الذي تدعوه للعمل؟

- أنا حقا لا أحب كلمة "عالم البيانات"لأنه لا يحمل أي معلومات. يمكنك أن تأتي إلى عشر شركات تبحث فيها عن عالم بيانات ، وستكون هذه عشر وظائف مختلفة تمامًا. أنا أحب محلل الكلمة. تتحدث أسماء الإدارات الخاصة بي عن نفسها: يوجد قسم للتعلم الآلي ، وقسم لتحليل البيانات ، ومجموعة R&D ، أي البحث ، وقسم رؤية الكمبيوتر ، وقسم تكنولوجيا الكلام ، ومجموعة تحليلات خارج المنتج لحل المشكلات التي تصل إلى خارج خط الإنتاج الحالي. .

أنا أبحث عن الأشخاص الذين يمكن أن البرنامج فيبيثون ، تعرف على نظرية الاحتمالات والإحصاءات الرياضية ، إذا كنت بحاجة إلى النمذجة ، عندئذ تكون مهارات التعلم الآلي مطلوبة. ولكن الشيء الأكثر أهمية هو قدرة الشخص على التفكير والتحليل. جئت على نحو متزايد إلى فكرة أن التفكير التحليلي والنقد أمر يصعب تدريسه. إذا كان هناك بالفعل 20-25 سنة بعض النظرة للعالم ، فمن غير المرجح أن يتغير.

- هل فهمت هذا في X5؟

- ليس أن X5 قادني إلى هذا. أنا أيضا أنظر إلى الناس ، والتواصل ، ونرى كيف تعمل. كما تعلمون ، فإن أفضل مقابلة هي فترة تجريبية. وفي مرحلة ما ترى أن هذا ببساطة ليس لهذا الشخص. بمعنى أنه يبدو أنه تخرج من مخيم ، ويبدو أنه ليس أحمقًا ، لكنه ليس كذلك. لا يوجد موقف صحيح ، لا ترى الأشياء. كان في كتاب دانييل كانيمان "التفكير ، السريع والبطيء" ، حيث وصف ما يتوافق مع التفكير النقدي. يتضمن ذلك نظرة متشائمة للعالم ، وهي ذات جودة فطرية أكثر من تلك المكتسبة ، لسوء الحظ أو لحسن الحظ.

- إذا وصل المحلل ، وبعد فترة تجريبية ، فأنت تفهم أنه مناسب ، فما الذي يمكن أن يتوقعه الشخص؟

- بشكل قياسي في تكنولوجيا المعلومات هناك تدرجات - المبتدئين والمتوسطة ،سينور والمتدرب. نادراً ما يتم مصادفة أعلاه - إنه موظف أو مقدم. أعتقد أن هناك تضخم في منصب رفيع المستوى: لدينا الكثير منهم ، لكن في الواقع نادراً ما ينقصهم الوسط المتوسط.

إذا كنت تأخذ متوسط ​​الراتب في السوق ، صغاريتلقى في مكان ما بين 120-150 ألف روبل قبل الضرائب شهريا ، متوسطة تصل إلى 250 ألف. كبار السن حوالي 400 ألف روبل. Top bar: لقد قمت شخصيا بعقد العرض بين يدي على المطور الرئيسي ، وكان أكثر من 600 ألف روبل.

"علم البيانات هو في الحقيقة نوع من" الكرز على الكعكة "

- كيف بدأت تعلم الآلة؟

- لم يكن لدى الجامعة آلةالتدريب. لأنني تخرجت من المدرسة الثانوية في عام 2012 ، وفي الوقت نفسه تقريبًا ، كان هناك ارتفاع آخر في الأمور المتعلقة بها. لم يكن لديك الوقت. تخرج من جامعتين ، آخرهما جامعة العلوم التطبيقية في كارلسروه ، وهي هيئة قضائية في الميكاترونيك. وقبل ذلك ، درس في معهد موسكو للهندسة الكيميائية ، والآن يطلق عليه معهد موسكو للفنون التطبيقية. لم أتعلم التعلم الآلي هناك.

شيء مضحك: يتم الآن إجراء مقابلات مع أولئك الذين يكملون علم البيانات ، ويبدو أن مستواهم أضعف وأقل من مستوى أولئك الأشخاص الذين أكملوا الفيزياء والهندسة وعلوم الكمبيوتر ، ثم "الجرح" على ذلك. ربما كان هذا تحولًا طفيفًا ، لأن الرجال الذين تعلموا أنهم كانوا أقوياء في البداية ، تعلموا شيئًا جديدًا وجاءوا. وعلم البيانات هو في الحقيقة نوع من "الكرز على الكعكة" ، وإذا لم يكن هناك "كيك" في حد ذاته ، ولكن هناك "كرز" ، فهذا ليس مثيرًا للاهتمام.

- كيف تعلمت هذا؟

- هناك قول مأثور بأن هناك اثنين على كورسيرامسار جدي ، حتى نصف. هذه هي دورة هينتون حول التعلم الآلي والشبكات العصبية (لم تعد الدورة متاحة في كورسيرا ، ولكن يمكنك مشاهدتها على YouTube - "التكنولوجيا الفائقة") ودورة دافني كولر على النماذج الاحتمالية غير الرسومية.

دورة Koller عبارة عن محاضرات مسجلة على شريط فيديو ،التي قرأتها لطلاب الدراسات العليا في ستانفورد. لذلك ، دعوته ليس جادًا تمامًا لا يدير اللغة. تستمر دورة هنتون 16 أسبوعًا ، ولكولر ثلاث دورات من خمسة إلى ستة أسابيع. جمعت القوة في قبضة ، مررت بالدورة الأولى وأدركت أن الدورتين الثانية والثالثة غير جاهزتين.

لكن كورسيرا ليست هي الوسيلة الوحيدة. قرأت الكثير من الكتب. الآن ، بالمناسبة ، أنهيت كتاب برادلي إيفرون حول الإحصاء (الإحصائي الأمريكي ، الحائز على الميدالية الوطنية الشرف للولايات المتحدة الأمريكية - أعلى جائزة ولاية للعلماء الأمريكيين - "التكنولوجيا الفائقة"). قبل ذلك ، يعمل كتاب جينا غودفيلو (أخصائي تعلم الآلة الأمريكي ، في Google Brain - "التكنولوجيا العالية") على التعلم العميق. هذه هي عملية التعلم المستمر. كورسيرا ليست سوى واحدة من الموارد ، Kaggle (مجتمع عبر الإنترنت من خبراء علوم الكمبيوتر حيث تقام المسابقات بانتظام - "التكنولوجيا الفائقة") - هو الآخر ، ولكن الشيء الرئيسي هو القراءة والقراءة والقراءة والتحقق. إذا قرأت ولم تفهم ، فهذا أمر سيء. إذا فهمت كيف يعمل هذا ، يمكنك أن تفعل أي شيء.

هو مثل مع جدول الضرب. تخيل أن الشخص لا يفهم جدول الضرب ، لكنه تعلمه عن ظهر قلب. سئل: "ستة إلى ستة؟" - "36". - "سبعة على ثمانية؟" - "56". - "حسنًا ، حسنًا ، السؤال الأخير ، 10 × 11؟" - يقول الرجل: "لا أعرف ، لم يكن هذا في جدول الضرب". حسنا ، هذا كل شيء. كثيرا ما أقابل هؤلاء الناس. 10 إلى 11 أسهل في الحساب ، ولكن هذا ليس في الجدول ، تحتاج إلى فهم المبدأ. إذا فهمت المبادئ ، فكل شيء أسهل بكثير.

كل شيء آخر يعتمد على الشخص. يبدو أننا نتعلم أي شيء بأنفسنا. نحن نساعد فقط ولا نتدخل مع أشخاص آخرين. كل هذا هو مسألة الانضباط الذاتي.

- أخبرنا عن دورتك في علوم البيانات في HSE.

- هذا بالطبع مجاني ، إنه ضمن المعيارالبرامج ، على ذلك أقول الأشياء البسيطة الأساسية التي لكثير من الناس - الوحي. على سبيل المثال ، ما هي المقاييس ، ولماذا توجد على الإطلاق ، وكيف تختلف عن بعضها البعض ، وما هي الحالات الضرورية ، وكيفية اختبار فكرتك عن اختبار A / B. هذا ما أوضحته لنفسي أنه من المهم أن يعرف الناس وما يحتاجونه حقًا في عملهم.

- كيف ترى مستقبل البيع بالتجزئة في خمس إلى عشر سنوات؟

- إذا كنا نتحدث عن بيع المواد الغذائية ، إذنسوف يموت تنسيق هايبر ماركت. يمكن ملاحظة ذلك الآن في الولايات المتحدة ، وكيف تموت مراكز التسوق الكبيرة هناك ، وفي روسيا أيضًا. سابقا ، ما كان نمط الاستهلاك؟ نأتي إلى مركز التسوق ، إلى السينما ، إلى قاعة الطعام ، وسوف نشتري شيئا آخر. نأتي الآن إلى المنزل ، IVI ، Okko ، Netflix ، Yandex ، الطعام ، نادي التوصيل ، التوصيل من مطعم ، التسوق عبر الإنترنت. يجب أن نذهب نحو التخصيص.

- ماذا يعني بالنسبة للمستهلك؟

- رجل يستخدم ماذا؟ انه يستطيع تحمل وهذا هو مناسب له. وفقًا لذلك ، من الضروري خفض التكاليف أو الحفاظ على نفس الجودة أو زيادتها. هذا هو المكان الذي يتبادر إلى الذهن التخصيص.

- شخص يشتري ما يستطيع تحمله. الآن الدخول الحقيقية للسكان تتناقص ، التكاليف آخذة في الانخفاض.

- في هذه الحالة ، تخزين تنسيقات الاقتصادأشعر بتحسن وتنمو. هناك طريقتان لحل العديد من المشاكل لتجار التجزئة. إما الأتمتة أو استئجار عشرة آخرين. على المدى القصير ، المسار الثاني هو استراتيجية رابحة ، لأن التكامل باهظ الثمن ، ولوقت طويل ، هناك خطأ ما ، يمكنك أن تفقد قسط التأمين. الآن تخيل أنك مدير قسم بعلاوة كبيرة للغاية ، ويمكنك أن تخسره. ستعمل في الشركة في غضون عامين ، عندما تصبح نتيجة هذه الأتمتة معروفة أو لا ، وسيشيدون بها ، فهذا غير واضح. والجائزة التي يمكنك الآن أن تكون. لذلك ، نحن نوظف عشرة أشخاص آخرين. ولكن هذا يؤدي إلى خسارة كبيرة على المدى الطويل.