كشف باحثون في فيسبوك عن أكبر نموذج للتعرف التلقائي على الكلام (ASR) حتى الآن. تعلمت
قبل تحميل المواد ، انقسم العلماء51 لغة في مجموعات منفصلة ، ثم اختيار 10 آلاف وحدة مفردات كمجموعة معلومات لكل مجموعة لغوية. بعد ذلك ، قاموا بدمج بعض المجموعات اللغوية الصغيرة يدويًا حتى يتبقى ستة منهم فقط ، مما جعل عملية تعلم النموذج أسرع عدة مرات.
"على حد علمنا ، هذا هو العمل الأول ،الذي يدرس أنظمة متعددة اللغات على نطاق واسع. لقد تلقينا بنية موحدة للتعرف على الكلام لـ 51 لغة ، والتي لا تتطلب الكثير من الموارد ، "- تمت الإشارة إليه على Facebook.
يقول الباحثون أنه خلال عدةالتجارب الأكثر فاعلية من نموذجهم المتعرف على الكلمات بكفاءة 28.75٪. هذا المؤشر أعلى بعدة مرات من نظيره ، وسيتحسن مع التدريب.
في المقالة ، أشار العلماء أيضًا إلى أنهم سينشرون قريبًا الإصدار الثاني من النظام. أصبح أسهل ويحقق النتائج المرجوة في 10 دقائق فقط. تم تدريبها لمدة 53 ألف ساعة من المواد "الخام".
اقرأ أيضا
- اتضح أن حضارة المايا تغادر مدنها
- كشف العلماء عن خطة إصابة بفيروس الهربس للإنسان: تبدو وكأنها لعبة مع الرهانات
- في اليوم الثالث من المرض ، يفقد معظم مرضى COVID-19 حاسة الشم لديهم وغالبًا ما يعانون من سيلان الأنف