ما يزال التطور المتسارع في مجال الذكاء الاصطناعي يثير المزيد من الجدل خاصة من ناحية قدرته على تنفيذ مهام بشرية.
وجديد ذلك سماع امرأة لصوت كريمتها وهي تبكي في مكالمة هاتفية يزعم رجل فيها أنه خطف الفتاة ويطالب بفدية، إلا أنّ نبرة صوت الابنة لم تكن حقيقية بل مُبتكرة بواسطة تقنية الذكاء الاصطناعي في محاولة للقيام بعملية احتيال، وهي مسألة مُقلقة تبرز مع هذه التكنولوجيا التي تشهد ازدهارًا في المرحلة الراهنة.
لم تميز الصوت
ويشير الخبراء إلى أنّ الخطر الأبرز للذكاء الاصطناعي يتمثّل في قدرة هذه التقنية على تبديدها تقريبًا الخط الفاصل بين الحقيقة والخيال، وتزويد المجرمين بأدوات فعّالة وغير مكلفة.
وتثير عمليات احتيال هاتفية حديثة باستخدام أدوات النسخ الصوتي المُستندة إلى الذكاء الاصطناعي والمتاحة بسهولة عبر الإنترنت، قلق السلطات الأميركية.
وتسمع جينيفر ديستيفانو، وهي أم تقيم في أريزونا، عبر الهاتف صوتًا يقول "ساعديني يا أمي، أرجوكِ ساعديني".
وصدّقت الوالدة أنّ الصوت عائد لابنتها البالغة 15 عامًا والتي خرجت لممارسة للتزلج.
وتقول لمحطة تلفزيونية محلية في حديث يعود إلى أبريل/ نيسان الماضي، "كان الصوت مطابقًا لصوت ابنتي مع طريقة بكائها نفسها"، مضيفةً: "لم أشك للحظة في أنها قد لا تكون هي".
وطلب المحتال الذي اتّصل بالوالدة من رقم مجهول، الحصول على مليون دولار لقاء إطلاق سراح الفتاة.
وراهنًا، تخضع هذه الحادثة التي وصلت إلى نهايتها سريعًا بعدما تمكّنت ديستيفانو من التواصل مع ابنتها، إلى تحقيق من السلطات المختصة، وكان لها دور في تسليط الضوء على عمليات الاحتيال المحتملة بفعل استخدام مجرمي الإنترنت برامج الذكاء الاصطناعي.
استنساخ الصوت ينشط عمليات الاحتيال
ويؤكّد المدير التنفيذي لشركة "بلاكبيرد. ايه آي" وسيم خالد، في حديث إلى وكالة "فرانس برس"، أنّ "النسخ الصوتي عبر الذكاء الاصطناعي والذي بات من شبه المستحيل تمييزه عن الصوت البشري، يتيح للأشخاص السيئين النية كالمحتالين الحصول على معلومات ومبالغ من الضحايا بأسلوب أكثر فعالية ممّا يعتمدون في العادة".
وتتيح تطبيقات كثيرة مجانية ومُتاحة عبر الإنترنت بدرجة كبيرة، استنساخ الصوت الفعلي لشخص ما عبر برنامج للذكاء الاصطناعي يستند إلى تسجيل قصير لصوت هذا الشخص.
ويمكن للمحتال أن يحصل على تسجيلات مماثلة من محتويات منشورة من الضحية عبر الإنترنت.
ويقول خالد: "من خلال تسجيل صوتي قصير، يمكن استخدام استنساخ صوتي أُنشئ استنادًا إلى الذكاء الاصطناعي، لترك رسائل ومقاطع صوتية يُزعم أنها للضحية. وقد يُستخدم الصوت المُستنسخ أيضًا كصوت مُعدَّل أثناء المكالمات الحية".
ويضيف أنّ "المحتالين يستخدمون لهجات متنوّعة، ويقلّدون الطريقة التي تتحدث بها الضحية"، مؤكدًا أنّ هذه التكنولوجيا "تتيح إنشاء عمليات تزييف عميق مقنعة".
لأول مرة.. "#شات_جي_بي_تي" الذي يعمل بالذكاء الاصطناعي يقود قداساً دينياً في كنيسة بـ #ألمانيا pic.twitter.com/WDm6mauQDf
— أنا العربي - Ana Alaraby (@AnaAlarabytv) June 17, 2023
وأظهر استطلاع شمل نحو سبعة آلاف شخص في تسع دول بينها الولايات المتحدة، أنّ شخصًا واحدًا من كل أربعة استُهدف بمحاولة احتيال صوتي عبر الذكاء الاصطناعي، أو يعرف شخصًا تعرّض لعملية مماثلة.
وأشار 70% ممّن شملهم الاستطلاع إلى أنهم لم يكونوا أكيدين من قدرتهم على التمييز بين الصوت الحقيقي وذلك المستنسخ، وفق الاستطلاع الذي نشرته شركة "ماك أفي لابز" الشهر الفائت.
وحذرت السلطات الأميركية أخيرًا من تزايد "عمليات الاحتيال التي تطال الأجداد".
تحذيرات رسمية
بدورها، قالت لجنة التجارة الفدرالية في تحذيرها "تتلقون مكالمة يُسمَع فيها صوت حفيدكم وهو مذعور، يقول إنه في ورطة كبيرة عقب تعرضه لحادث سير واحتجازه من الشرطة، لكنّكم قادرون على مساعدته من خلال إرسال الأموال له".
وفي التعليقات التي كُتبت تحت تحذير اللجنة الأميركية، يشير عدد كبير من المسنّين إلى أنّهم خُدعوا بهذه الطريقة.
واقتنع جدٌّ تعرّض لعملية احتيال بما سمعه لدرجة أنّه بدأ يجمع الأموال وفكّر في رهن منزله، قبل أن يتبيّن أنّ ما يحصل ليس سوى احتيال.
وفي حديث إلى وكالة "فرانس برس"، يقول الأستاذ في كلية المعلومات بجامعة كاليفورنيا في بيركلي هاني فريد، إنّ السهولة التي يتّسم بها استنساخ الصوت تعني أن "كل مستخدم للإنترنت معرض للخطر"، مشيرًا إلى أنّ "عمليات الاحتيال هذه آخذة في الازدياد".
وتعيّن على شركة "إيليفن لابس" الناشئة الاعتراف بأنّ أداتها الناسخة للصوت من خلال الذكاء الاصطناعي يمكن استخدامها لأهداف مسيئة، بعدما نشر عدد من مستخدمي الإنترنت مقطعًا مزيفًا للممثلة إيما واتسون وهي تقرأ مقاطع من كتاب "كفاحي" لأدولف هتلر.
ويقول غال تال-هوشبيرغ، وهو مسؤول في شركة "تيم 8" المتخصصة في الاستثمارات التكنولوجية، "نقترب بسرعة من المرحلة التي لن يعود بإمكاننا فيها الوثوق بالمحتوى المنشور عبر الإنترنت، والتي سيتعين علينا خلالها الاستعانة بتقنيات جديدة لنتأكّد من أنّ الشخص الذي نعتقد أننا نتحدث معه (عبر الهاتف) هو بالفعل مَن نتواصل معه".