كشفت شركة "إنفيديا" عن نموذج ذكاء اصطناعي توليدي جديد أطلقت عليه اسم "فوغاتو" (Fugatto)، واصفة إياه بأنه "سكين الجيش السويسري للصوت". النموذج، الذي أُعلن عنه عبر موقع الشركة الرسمي، يعد خطوة متقدمة في مجال إنشاء وتعديل الأصوات باستخدام الذكاء الاصطناعي.
وتتيح أداة "فوغاتو" للمستخدمين تحويل النصوص أو الأصوات إلى موسيقى، كلام، أو حتى تأثيرات صوتية مخصصة. وصُمم النموذج من قبل فريق دولي من الباحثين يشمل خبراء من الهند، البرازيل، الصين، الأردن، وكوريا الجنوبية، مما يعزز قدرته على فهم اللهجات واللغات المختلفة.
وأشار رافائيل فاليه، مدير أبحاث الصوت في "إنفيديا"، إلى أن الهدف كان "إنشاء نموذج يفهم ويولد الصوت كما يفعل البشر تمامًا".
من بين أبرز إمكانيات "فوغاتو":
إنتاج مقطوعات موسيقية كاملة انطلاقًا من النصوص.
إضافة أو إزالة آلات موسيقية من الأغاني.
تعديل العواطف أو اللهجات في الصوت، مثل تحويل النص إلى نبرة غاضبة، حزينة، أو ضاحكة.
إنشاء أصوات جديدة غير مسبوقة.
أين يمكن استخدام "فوغاتو"؟
يمكن لمنتجي الموسيقى استخدام نموذج "فوغاتو" لإنشاء فكرة أغنية بسرعة أو تعديلها، وتجربة أنماط وأصوات وآلات مختلفة، ويمكنهم أيضا إضافة تأثيرات وتعزيز جودة الصوت لمقطوعة معينة.
وقال إيدو زمشليني، وهو منتج ومؤلف أغان حاصل على العديد من الجوائز البلاتينية وعضو في برنامج "إنفيديا إنسيبشن" (NVIDIA Inception)، إن الذكاء الاصطناعي "أتاح لنا كتابة الفصل التالي من الموسيقى، فنحن لدينا آلة جديدة الآن لصنع الموسيقى، وهذا مثير للغاية".
ومن جهة أخرى، يمكن لأي وكالة إعلانات استخدام "فوغاتو" لاستهداف حملة معينة في مناطق أو مواقف عدة وتطبيق لهجات وعواطف مختلفة على تسجيلات الصوت.
ويمكن لمطوري ألعاب الفيديو استخدام النموذج لتعديل العناصر المسجلة سابقا لتناسب المواقف المتغيرة أثناء لعب المستخدمين للعبة، أو يمكنهم إنشاء عناصر أو أصوات جديدة تناسب أحداث اللعبة.
ويتميز نموذج "فوغاتو" عن غيره بأنه يتحكم بدقة في تطور المشهد، فمثلا يمكنه إنشاء أصوات لعاصفة رعدية مارقة ويُظهر صوت الرعد يختفي ببطء مع ابتعاد العاصفة، كما يمكنه إنشاء مشاهد صوتية إبداعية مثل عاصفة ماطرة تتلاشى ببطء عند شروق الشمس مع صوت زقزقة العصافير.
ولم تذكر "إنفيديا" في منشور مدونتها إذا كانت ستمنح المستخدمين إمكانية الوصول إلى نموذج "فوغاتو"، أو متى سيتوفر للمستخدمين.
ومن الجدير بالذكر أن نموذج "إنفيديا" ليس أول تقنية ذكاء اصطناعي يمكنها إنشاء الأصوات بالاعتماد على نص مُدخل، فقد أصدرت ميتا مجموعة أدوات ذكاء اصطناعي مفتوحة المصدر يمكنها إنشاء صوت من نص.
ومن جانبها، تمتلك غوغل نموذج ذكاء اصطناعي لتحويل النص إلى موسيقى يعرف باسم "ميوزك إل إم" (MusicLM) يمكن الوصول إليه من خلال موقع "إيه آي تيست كيتشن" (AI Test Kitchen) التابع للشركة. (الجزيرة)