يتعلم الذكاء الاصطناعي بشكل أكثر كفاءة عن طريق استبدال التسميات الرقمية بصوت بشري

لقد وجد الباحثون أنه عند مقارنة الشبكات العصبية ذات تسميات التدريب المختلفة، فإنها تؤدي أداءً أفضل.

ستكون تلك المسجلة بصوت الإنسان بدلاً من المدخلات الثنائية البسيطة.

اللغة الثنائية مضغوطة ودقيقة لنقل المعلومات. في المقابل ، فإن اللغة البشرية المنطوقة هي أكثر نغمية ومماثلة. نظرًا لأن الأرقام طريقة فعالة لرقمنة البيانات ، نادرًا ما يستخدم المبرمجون أنواعًا أخرى من المدخلات عند تصميم شبكة عصبية.

واحدة من التمارين الأكثر شيوعا لاختبار طريقة جديدة للتعلم الآلي: تعليم الذكاء الاصطناعي كيفية التعرف على الأشياء أو الحيوانات في الصورة. أجرى مؤلفو العمل الجديد تجربة: قاموا بإنشاء شبكتين عصبيتين جديدتين كان من المفترض أن تتعرفا على عشرة أنواع مختلفة من الكائنات في مجموعة مكونة من 50 ألف صورة فوتوغرافية.

تم تدريب أول نظام للذكاء الاصطناعي بالطريقة التقليدية: حيث تم تحميله بجدول بيانات يضم آلاف الصفوف، كل منها يتوافق مع صورة تدريب واحدة. 

وقام المؤلفون بتحميل الجدول في النظام الثانيالبيانات التي تحتوي صفوفها على صورة لحيوان أو كائن، وفي العمود الثاني يوجد ملف صوتي ينطق فيه الشخص اسم الكائن أو الحيوان. 

ونتيجة لذلك، أنتجت أول شبكة عصبية رقميةمعنى الشيء الذي عُرض عليها، وحاولت الثانية أن «تحكي» ما رأته. لاحظ الباحثون أن كلتا الخوارزميتين تعاملتا مع المهمة بكفاءة متساوية وأجابتا بشكل صحيح في 92% من الحالات.

إلا أن نتائج التجربة تغيرت عندماقام العلماء بتخفيض العينة من 50 ألفاً إلى 2.5 ألف، ثم انخفضت صحة إجابات الذكاء الاصطناعي الأول إلى 35%، أما الثاني الذي تم تدريبه بالصوت فقد انخفضت إلى 70% فقط.

قراءة المزيد:

غرق الباحثون لأول مرة في أعمق سفينة غارقة

تم إنشاء أول خريطة دقيقة للعالم. ما هو الخطأ مع أي شخص آخر؟

ظهر نظام لاسلكي يساعد المصاب بالشلل