السبت 16 نوفمبر / November 2024

بعد حادثة جوهانسون.. تقنية استنساخ الأصوات تثير المخاوف من جديد

بعد حادثة جوهانسون.. تقنية استنساخ الأصوات تثير المخاوف من جديد

شارك القصة

سكارليت جوهانسون
رفضت الفنانة الأميركية سكارليت جوهانسون أن تكون صوت نظام النسخة الجديدة من "تشات جي بي تي"- رويترز
اعتذرت شركة "أوبن إيه آي" من الفنانة الأميركية سكارليت جوهانسون بعدما نسخت صوتها في أحدث نسخة من برنامج للمحادثة.

تدفع تقنية استنساخ الأصوات بمخاوف كثيرة مع إقدام عدد من الشركات على اعتمادها، كـ"أوبن إيه آي" مُبتكرة برنامج "تشات جي بي تي" الشهير، التي اضطرت أخيرًا للاعتذار من الممثلة سكارليت جوهانسون بعدما نسخت صوتها في أحدث نسخة من برنامجها للمحادثة الآلية.

وقد اعتذر مدير عام "أوبن إيه آي" سام ألتمان من الممثلة وأعلن تعليق صوت أداة المساعدة "سكاي" في "تشات جي بي تي".

وكانت الشركة قد قدّمت عرضًا في سبتمبر/ أيلول الماضي لسكارليت التي أعارت صوتها قبل نحو عشر سنوات لنظام بالذكاء الاصطناعي في فيلم "هير"، لكنّ الممثلة رفضت أن تكون صوت نظام النسخة الجديدة من "تشات جي بي تي".

ونفت "أوبن إيه آي" من جانبها أن تكون قد استنسخت صوت جوهانسون، مشيرة إلى أنها ابتكرت أداتها باستخدام صوت ممثلة أخرى.

"عمليات احتيال وتضليل"

وتتصدر أخبار عن حيل صوتية مشابهة جدًا للواقع أو عمليات احتيال أو تضليل باستخدام الاستنساخ الصوتي، عناوين الأخبار باستمرار، مسلّطةً الضوء على قدرة أنظمة الذكاء الاصطناعي على تقليد الأصوات البشرية.

وفي العام الفائت، حذرت شركة Eleven Labs "إيليفن لابز" الناشئة التي تعمل على ابتكار أداة لاستنساخ الصوت باستخدام الذكاء الاصطناعي، من الاستعمال المسيء لبرنامجها.

وتداول مستخدمون مجهولون على منتدى "4 تشان" 4Chan رسائل فيها عمليات استنساخ لأصوات مشاهير، وجعلوا هذه الأصوات تتلفظ بأقوال تنطوي على معان جنسية أو عنصرية.

وفي أحد المقاطع الصوتية، يُسمَع صوت مزيّف للممثلة إيما واتسون وهي تقرأ مقطعًا من كتاب "كفاحي" لأدولف هتلر.

مدير عام "أوبن إيه آي" سام ألتمان
اعتذر مدير عام "أوبن إيه آي" سام ألتمان من الفنانة سكارليت جوهانسون- غتي

وأوضح مدير شركة "سنتيزيا" الناشئة رجل الأعمال الدنماركي فيكتور ريباربيلي، في حديث إلى وكالة فرانس برس، أنّ هذه التكنولوجيا تم ابتكارها إلى حد كبير من خلال برنامج مفتوح المصدر يسمى "تورتس" وأُطلق قبل عامين.

"واقعية ودقيقة بصورة أكبر"

وتقوم شركته بتحويل النص إلى مقطع فيديو باستخدام صورة رمزية (أفاتار) تم إنشاؤها بواسطة الذكاء الاصطناعي. وتوظف ممثلين يخضع صوتهم وشكلهم لعقد مدته عامين، مع احتمال تجديده، على قول ريباربيلي الذي التقت به "فرانس برس" على هامش معرض "فيفاتك" للتكنولوجيات الجديدة الذي أقيم أخيرًا في باريس.

وقد حلّل برنامج التعلم الآلي "تورتس" آلاف الساعات من التسجيلات الصوتية وكان بمثابة قاعدة لتطبيق "إيلفن لابس". وقال ريباربيلي "كان ذلك نقلة نوعية مهمة". وتستخدم "أوبن إيه آي" برامج مماثلة، على الرغم من أنها لا تكشف تفاصيل ذلك.

ومع "تشات جي بي تي 4,0"، يمكن للمستخدم التلفّظ ببضع جمل بالفرنسية أمام التطبيق القادر في دقائق معدودة على إعادة إنتاج هذا الصوت واستخدامه لسرد مقطع فيديو قصيرة بخمس لغات مختلفة، بحسب ما أظهرت "أوبن ايه آي" خلال عرض توضيحي للبرنامج في باريس.

وعلى غرار هذه الشركة الأميركية، باتت مئات الشركات تقدّم خدمة استنساخ الصوت التي أصبحت واقعية ودقيقة بصورة أكبر.

ومن بينها TALKR.ai، وهي شركة فرنسية للمساعدين الصوتيين الافتراضيين الذين يتم إنشاؤهم بواسطة الذكاء الاصطناعي.

ويمكن لهذه الخدمة التعامل مع 25% إلى 30% من مكالمات خدمة الزبائن من دون أي تدخل بشري، بحسب رئيستها كاتيا لينيه.

وترى لينيه كما فيكتور ريباربيلي أنّ استخدام أصوات الممثلين من دون موافقتهم هو خط أحمر.

وعن الذي حدث مع سكارليت جوهانسون، قال ريباربيلي: "إذا استنسخوا صوتها من دون علمها، فهذا سيئ جدًا، لكن إذا لم يكن لديهم الحق في استخدام صوت شخص يشبه صوتها بشكل كبير، فذلك يشكل سابقة غريبة جدًا".

تابع القراءة
المصادر:
أ ف ب
تغطية خاصة
Close