معلمك: كيف تتعلم الخوارزميات بدون مساعدة بشرية وتجعل الطائرات بدون طيار أفضل

المركبات غير المأهولة والتوائم الرقمية والتحكم الآلي في الاتصالات ليست كذلك

تنبؤات كتاب الخيال العلمي، وبالفعلالمستقبل القريب. يتم تقريبه من قبل العلماء الذين يشاركون في الذكاء الاصطناعي التطبيقي والأبحاث في مجال التعلم المعزز. تحدثت شركة Hi-Tech عن مستقبل التكنولوجيا مع أوليغ سفيدشينكو وألكسندر جريشين وأليكسي شبيلمان، الفائزين بجائزة سيجالوفيتش السنوية.

كيف يتعلم الذكاء الاصطناعي بدون معلم

تعزيز التعلم،RL) أن الذكاء الاصطناعي نفسه يتفاعل مع بيئة معينة - على سبيل المثال ، لوحة لعبة Go أو العالم الخارجي إذا كان الروبوت يتحرك على طولها. يحتاج الجهاز إلى تحديد الأنماط الشائعة والتركيز عليها عند أداء المهام. وعند التعلم مع "مدرس" ، فأنت بحاجة إلى شخص يجب أن يشير إلى الإجراء الصحيح الذي سيتدرب عليه الذكاء الاصطناعي.

"يتمثل جوهر RL في أن الآلة أو ، كما نقول ،وكيل ، يتعلم في طريقة الممارسة المستمرة "، يلاحظ أوليغ سفيدشينكو ، الحائز على جائزة ياندكس للعلوم. - يتم وضع الذكاء الاصطناعي في ظروف معينة و "الكلام" - الفعل. هذا مشابه للموقف عندما يذهب الفأر بحثًا عن الجبن في متاهة. بعد أن قام الحيوان بالدوران في الاتجاه الخاطئ ، يصطدم بالجدار ، ويعود ، ويحاول مرة أخرى ، وهكذا. في حالة التعلم المعزز ، تكافأ الخطوات الصحيحة. كلما كان الإجراء صحيحًا ، زاد عدد النقاط التي سيتلقاها الذكاء الاصطناعي. إذا تبين أن الاختيار غير صحيح ، يفقد الوكيل نقاطًا. أثناء التدريب ، تتذكر الآلة أي مجموعة من الإجراءات كانت أكثر ربحية ، وفي المرة القادمة ستستخدمها ".

البحث المستقل عن حل يسمح للوكيلعاجلا أم آجلا تجاوز الرجل. تم توضيح ذلك ، على سبيل المثال ، من خلال خوارزمية MuZero الخاصة بـ DeepMind ، والتي تعلمت لعب العشرات من ألعاب الفيديو Atari القديمة والشطرنج وألعاب الطاولة من نوع Go. لإنشائه ، استخدموا التطورات السابقة للشركة: على سبيل المثال ، AlphaGo ، بفضله كان من الممكن التغلب على بطل Go Lee Sedol ، و AlphaZero ، والذي يستخدم في لعبة الشطرنج. تستخرج الخوارزمية المحسّنة مزيدًا من المعلومات من بيانات أقل - والآن تحتاج إلى نصف خطوات التدريب.

يمكن لخوارزميات التعلم المعززمفيد في مجموعة متنوعة من الصناعات. على سبيل المثال ، في الطب - لتنظيم العلاج الديناميكي الشخصي ، في صناعة الترفيه - للاختبار التلقائي لألعاب الكمبيوتر ، أو في الطيران - للتحكم الذاتي في منطاد الستراتوسفير.

في أي المجالات سيساعد الذكاء الاصطناعي الناس

رقمنة البيع بالتجزئة: متاجر مؤتمتة بالكامل

يتم تنفيذ أول تعلم آلي في الصناعاتحيث يتم تصحيح أخطاء عملية جمع كميات كبيرة من البيانات ورقمنتها. على سبيل المثال ، في مجال البيع بالتجزئة ، تمر جميع المعلومات عبر سجلات النقد ، مما يعني أن الذكاء الاصطناعي لديه شيء ما للعمل به. وفقًا لـ Alexey Shpilman ، فإن استخدام خوارزميات الذكاء الاصطناعي سيجعل من الممكن إنشاء متاجر آلية في كل مكان ، حيث ستتم جميع العمليات دون تدخل بشري.

تم اختبار هذا التنسيق مرة أخرى في عام 2016.شركة أمازون. يأخذ المشتري العربة ، ويلتقط البضائع الموجودة فيها ويغادرها فقط - يتم خصم أموال الشراء من البطاقة تلقائيًا. في روسيا ، تم تطوير مشروع مماثل بواسطة Azbuka Vkusa.

"يأخذ المشتري العربة ، ويلتقط البضائع الموجودة فيها ويغادرها فقط - يتم خصم أموال الشراء من البطاقة تلقائيًا"

إدارة الاتصالات: تحديد أخطاء الشبكة 

بفضل التعلم المعززيمكن أن تحدث الاختراقات التكنولوجية في إدارة الشبكات المختلفة - الاتصالات السلكية واللاسلكية وشبكات التدفئة وصناعة الطاقة الكهربائية. من السهل جدًا تحويل العديد من العمليات هنا إلى الروبوتات ، نظرًا لعدم وجود تفاعل كبير مع الأشخاص.

سوف تؤدي الأتمتة إلى إنشاء الأنظمة التيسوف تتخذ قرارات أكثر استنارة وتحسين استهلاك الطاقة. على سبيل المثال، بناءً على خوارزميات RL، يتم تطوير وحدة تحكم HVAC (اختصار للتدفئة والتهوية وتكييف الهواء - التدفئة والتهوية وتكييف الهواء) - وهو نظام للتحكم في درجة حرارة الغرفة والتهوية. سيساعد استخدام هذه التكنولوجيا في الشركات على توفير استهلاك الطاقة وتقليل انبعاثات الكربون.

المركبات غير المأهولة: تكنولوجيا الاختبار والتشريع

مجال آخر ينتظر بفضل الاختراقالتعلم المعزز - النقل. اليوم ، يمكن العثور على المركبات غير المأهولة وروبوتات التوصيل في الشوارع. على الرغم من التقدم التكنولوجي في الصناعة ، يتوقع محللو McKinsey أن الطائرات بدون طيار لن تصبح سائدة حتى عام 2030 على أقرب تقدير. التنفيذ معقد بسبب الحاجة إلى تطوير اللوائح. في سنغافورة والولايات المتحدة ، يجري النقل الآلي بالفعل على قدم وساق على طول الطرق السريعة ، وقد ظهر مؤخرًا إذن لاختبار سيارة أجرة بدون طيار في روسيا.

"تتحسن الأتمتة دائمًا تقريبًاالأمن، لكن الناس يرحبون بإدخال مثل هذه التقنيات بالخوف،" هذا ما يؤكده أوليغ سفيدشينكو. — إذا استبدلت جميع وسائل النقل بسيارات تيسلا بدون طيار، فسوف ينخفض ​​عدد الحوادث على الطرق عدة مرات. لكن كل حادث سيثير العديد من الأسئلة. لا يمكننا أن نقول على وجه اليقين، كما في حالة الشخص، ما الذي تسبب في الحادث. والناس يخافون من هذا المجهول”.

"هناك مجال آخر ينتظر حدوث تقدم كبير بفضل التعلم المعزز وهو النقل"

كيف ستكون التوائم الرقمية مفيدة للبشرية

وقد جعلت خوارزميات التعلم المعزز ذلك ممكناإنشاء توائم رقمية - نماذج أولية افتراضية للأشياء والعمليات وحتى الأشخاص التي تحتوي على نفس الخصائص والخصائص مثل النسخ الأصلية. تستخدم المؤسسات الصناعية هذه التكنولوجيا، على سبيل المثال، للتحقق مما إذا كانت جميع العمليات قد تم تعديلها بشكل صحيح قبل إطلاق ناقل جديد. بالطبع، يمكنك إدخال القابس على الفور في المنفذ، ولكن في حالة حدوث فشل، فسوف يستغرق الأمر وقتًا وموارد لإصلاحه. ولذلك، يتم تشغيل الناقل لأول مرة على جهاز الكمبيوتر. 

كل شيء أفضل بكثير مع التوائم الرقمية البشريةأكثر صعوبة ، لأن الكائن الحي هو نظام أكثر تعقيدًا. ومع ذلك ، يواصل العلماء إتقان التكنولوجيا ، وإنشاء نسخ افتراضية لكل من الأعضاء الفردية والكائن الحي بأكمله. على سبيل المثال ، يستخدم مستشفى بوسطن توأمًا رقميًا للقلب للتخطيط للعمليات الجراحية. في المستقبل ، سيسمح هذا باختبار طرق العلاج على مريض افتراضي ، والتنبؤ بالأمراض ، وقد يُزعم أنه ثورة في الطب.

"تطوير الذكاء الاصطناعي ، بما في ذلك RL ، يمكن أن يؤدي إلىيقترح أليكسي شبيلمان حقيقة أن الناس سيبدأون في فهم أنفسهم بشكل أفضل. "الإنسان نظام مغلق ، لأننا نستخدم عقولنا لمعرفة الذات. لكن هل هذه الأداة كافية لنا؟ حتى في علم النفس ، هناك حاجة إلى شخصين للتفكير ، ونحن منغلقون على أنفسنا. على الصعيد العالمي ، في سياق الكون ، لا تزال البشرية وحيدة ، مما يعني أنه ليس لدينا من نتحدث إليه من أجل تعلم شيء جديد عن أنفسنا والنظر من الخارج. ربما ، بفضل التعلم المعزز ، سننشئ نوعًا من الكيان خارج أنفسنا. لن يقتصر الأمر على عقولنا ووعينا وسيكون قادرًا على إعطاء الشخص إجابات ومعاني جديدة ".

لماذا لا يزال تطبيق RL على نطاق واسع محدودًا

على الرغم من التقدم الذي أحرزه العلماء، فإن التطبيق العملي لـ RL لا يزال محدودًا. يستغرق النظام وقتًا طويلاً للتعلم ويرتكب الكثير من الأخطاء، لذا فإن تنفيذ الخوارزمية في كل مكان أمر صعب وغير مربح.

"يحتاج الوكيل إلى مزيد من التكرارات ، وبالتالي فإن العمليةيستغرق التعلم وقتًا طويلاً ، - يوضح ألكسندر جريشن - علاوة على ذلك ، لا يكفي أن يقوم الذكاء الاصطناعي بأداء أفضل إجراء. إنه يحتاج إلى استكشاف البيئة ، حيث قد تكون مكافأة كبيرة مخفية وراء الحركات غير الجذابة حاليًا. يتلخص منطق التعلم المعزز برمته في حقيقة أن الذكاء الاصطناعي يتعلم التضحية بالفوائد قصيرة المدى من أجل النجاح على المدى الطويل. للقيام بذلك ، عليك التفكير مسبقًا وحساب السيناريوهات المحتملة لتطور الأحداث. على سبيل المثال ، عندما يتخلى الوكيل عن الفارس للقبض على الملكة ، سيكون العلماء سعداء للغاية ".

مهمة العلماء هي ضمان نمو الذكاء الاصطناعيوتيرة التعلم وتحسين القدرة على التحليل. ولكن هناك مشكلة عادية تمنع التقدم السريع: فهناك نقص في العاملين في مختبرات البحث والتطوير وشركات تكنولوجيا المعلومات. تقوم الجامعات بإنشاء مختبرات ومراكز أبحاث، ويقوم عمالقة التكنولوجيا بافتتاح دورات متخصصة.

"البحث في التعلم الآلي الآنكثيرًا في الطلب. يقول أليكسي شبيلمان: "إن الصناعة تتطور بسرعة ، والنقص في الموظفين يتزايد كل يوم". "يتمتع المتخصصون بفرصة كبيرة للمشاركة في العمليات التي ستغير العالم بشكل لا يمكن التعرف عليه. الكثير من العمل المثير للاهتمام. نحن الآن في بداية الطريق ، لكننا حققنا بالفعل نتائج جيدة. هل يمكنك تخيل الآفاق التي ستفتح للبشرية من خلال استخدام RL؟

قراءة المزيد:

طار المسبار الفضائي على بعد 200 كيلومتر من عطارد. انظروا الى ما رآه

كشف العلماء كيف تؤثر الفيتامينات على الإصابة بالسرطان

تُصدر خوذة قراءة الأفكار الصينية ناقوس الخطر عندما يرى الشخص محتوى إباحيًا