يعمل نموذج التعرف التلقائي الجديد على Facebook بـ 51 لغة

كشف باحثون في فيسبوك عن أكبر نموذج للتعرف التلقائي على الكلام (ASR) حتى الآن. تعلمت

فهم 51 لغة بعد أن يتم تدريسها فيها16 ألف ساعة من التسجيلات الصوتية. وفي مقال نشر على موقع Arxiv.org، يزعم المؤلفون المشاركون في العمل أن النظام، الذي يحتوي على حوالي مليار معلمة، يعمل على تحسين أداء التعرف على الكلام بنسبة تصل إلى 28.8%.

قبل تحميل المواد ، انقسم العلماء51 لغة في مجموعات منفصلة ، ثم اختيار 10 آلاف وحدة مفردات كمجموعة معلومات لكل مجموعة لغوية. بعد ذلك ، قاموا بدمج بعض المجموعات اللغوية الصغيرة يدويًا حتى يتبقى ستة منهم فقط ، مما جعل عملية تعلم النموذج أسرع عدة مرات.

"على حد علمنا ، هذا هو العمل الأول ،الذي يدرس أنظمة متعددة اللغات على نطاق واسع. لقد تلقينا بنية موحدة للتعرف على الكلام لـ 51 لغة ، والتي لا تتطلب الكثير من الموارد ، "- تمت الإشارة إليه على Facebook.

يقول الباحثون أنه خلال عدةالتجارب الأكثر فاعلية من نموذجهم المتعرف على الكلمات بكفاءة 28.75٪. هذا المؤشر أعلى بعدة مرات من نظيره ، وسيتحسن مع التدريب.

في المقالة ، أشار العلماء أيضًا إلى أنهم سينشرون قريبًا الإصدار الثاني من النظام. أصبح أسهل ويحقق النتائج المرجوة في 10 دقائق فقط. تم تدريبها لمدة 53 ألف ساعة من المواد "الخام".

اقرأ أيضا

- اتضح أن حضارة المايا تغادر مدنها

- كشف العلماء عن خطة إصابة بفيروس الهربس للإنسان: تبدو وكأنها لعبة مع الرهانات

- في اليوم الثالث من المرض ، يفقد معظم مرضى COVID-19 حاسة الشم لديهم وغالبًا ما يعانون من سيلان الأنف