مايكروسوفت تعلن عن ذكاء اصطناعي VALL-EV قادر على تقليد أي صوت بشري

كشفت مايكروسوفت عن نظام ذكاء اصطناعي جديد قادر على محاكاة أي صوت بشكل مثالي مع عينة صوتية مدتها 3 ثوانٍ فقط.

تم إنشاء أحدث ابتكارات عملاق التكنولوجيا ، VALL-E ، مع القدرة على توليف صوت الشخص بمجرد معرفة صوته. بالإضافة إلى ذلك ، فهو قادر على توليد نغمات لإعطاء تأثير أكثر واقعية.

يشير الفريق المسؤول عن إنشاء VALL-E إلى أنه يمكن استخدام هذا الذكاء الاصطناعي في المواقف التي تتطلب إنشاء صوت عالي الجودة من النص.

بالإضافة إلى ذلك ، فإن لديه أيضًا إمكانات بالاقتران مع ذكاء اصطناعي آخر ، مثل GPT3 لإنشاء محتوى صوتي جديد.

لتدريبه ، استخدمت مايكروسوفت مكتبة Meta الصوتية “LibriLight” ، والتي تحتوي على حوالي 60.000 ساعة من الكلام باللغة الإنجليزية من أكثر من 7000 شخص مختلف ، معظمهم من الكتب الصوتية ذات المجال العام LibriVox.

يخضع هذا النظام حاليًا لاختبارات مصنفة بشكل صارم ، نظرًا لوجود خطر من استخدامه لأغراض أخرى ، تمامًا كما حدث مع التكنولوجيا التي أفسحت المجال للتزييف العميق deepfake ، مما تسبب في عمليات احتيال وبعض المشكلات الأخرى.

مقالات ذات صلة

زر الذهاب إلى الأعلى