تمكنت طائرة مسيّرة يتحكم بها الذكاء الاصطناعي من التفوق للمرة الأولى على أبطال سباقات الطائرات المسيّرة مِن بُعد، بحسب دراسة نشرت في مجلة "نيتشر"، ما يمهد الطريق لتحسين الأنظمة المستخدمة في السيارات الذاتية القيادة أو الروبوتات الصناعية.
وقال أليكس فانوفر، أحد ثلاثة أبطال في هذا المجال جرت الاستعانة بهم من مجموعة الروبوتات والإدراك في جامعة زوريخ السويسرية لمواجهة المسيّرة الفائزة: "لقد كنتُ قريبًا جدًا من المسيّرة ذاتية القيادة لدرجة أني شعرت باضطرابها فيما كنتُ أحاول عدم تركها".
وأقيم السباق على حلبة بطول 75 مترًا مكونة من سبع بوابات، وهي إطارات زرقاء كبيرة يجب عبورها بترتيب معين، على ثلاث لفات.
وحصل السباق مع آلات تصل سرعتها بسهولة إلى 100 كيلومتر في الساعة، وقدرة على زيادة السرعات تفوق حتى ما يحصل على سباقات الفورمولا واحد، والتفافات على منعطفات بزاوية 180 درجة.
AI drone racer finally beats human world champions! Recipe: • state estimation with KF + gate-based measurements as additional KF updates • small deep RL policy trained in sim • residual controllers on top Nature article: https://t.co/fiY7736k1i https://t.co/6vvyNZ7IHg pic.twitter.com/cBW0mmIVz9
— Karol Hausman (@hausman_k) August 30, 2023
وكان أمام الرجال الثلاثة، بينهم بطل العالم السابق في دوري سباقات المسيّرات، أسبوعًا للتدريب، مزودين بخوذة تنقل الصور من طائراتهم المسيّرة للقيادة.
مسيرات بمستوى "الخبير"
وفازت المسيّرة بأغلبية سباقاتها ضد كل منهم، وأكملت أسرع لفة على الحلبة. وهذه المرة الأولى التي "يحقق فيها روبوت متنقل مستقل أداء على مستوى شبيه بأبطال العالم في رياضة تنافسية في العالم الحقيقي"، بحسب الدراسة.
وقد وصلت المسيّرات بالفعل إلى مستوى "الخبير" ولكن بمساعدة نظام خارجي لالتقاط الحركة يعمل على تحسين مسارها. وهذه الميزة "غير عادلة" لفريق زوريخ، إذ يعتمد نظام "سويفت" Swift المستقل تمامًا والذي يدمج أجهزة الاستشعار وقوة الحوسبة الخاصة به على متن المسيّرة.
من جانبه، قال المعد الأول للدراسة إيليا كوفمان الذي كان لا يزال طالب دكتوراه عند إعداد الدراسة: "نظام سويفت يصحح المسار في الوقت الفعلي، ويرسل 100 أمر جديد في الثانية إلى الطائرة المسيّرة".
ويعتمد سر نظام سويفت على تقنية تسمى "التعلم المعزز العميق" ("ديب رينفورسمنت ليرنينغ")، تجمع بين معالجة عدد كبير جدًا من البيانات ومراقبة قواعد تكافئ تقدم الآلة.
تجنب الاصطدام
وقد اختبر النظام ملايين المسارات التي تجمع بين إدراك بيئته وتقدمه نحو البوابة التالية. وقد جرت عملية محاكاة معجلة، إذ "تدرب نظام سويفت على فترة تناهز شهرًا من الوقت الحقيقي، ولكن بطريقة مستعجلة، أي في ساعة واحدة على جهاز كمبيوتر مكتبي"، بحسب كوفمان.
وتشكل هذه الطريقة في التعلم جوهر البرامج القادرة على مواجهة محترفي لعبة "غو" Go اللوحية أو الشطرنج، أو حتى محترفي ألعاب الفيديو مثل "ستاركرافت" StarCraft أو "غران توريسمو" Gran Turismo. لكن خارج العالم الافتراضي، ظل الإنسان حتى الآن سيد السباق.
وتستفيد الآلة من مزايا كامنة، مثل وحدة القصور الذاتي المدمجة التي توفر لها معلومات مثل التسارع، والتي لا يمكن للطيار البشري أن يشعر بها. ميزة أخرى هي أن وقت رد الفعل على الأوامر أسرع بخمس مرات في الآلة من ذلك الذي يتلقاه الدماغ البشري.
وفي هذه المرحلة، يحتفظ الإنسان بميزة في بيئة متدهورة، على سبيل المثال التغييرات في الإضاءة التي قد يجد نظام سويفت صعوبة في أخذها بعين الاعتبار.
كما يأخذ الإنسان بعين الاعتبار تقدمه المحتمل على خصمه، فيبطئ سرعته قليلاً لتجنب الاصطدام.
وتشير الدراسة إلى أن الآلة تعمل دائمًا بأقصى طاقتها و"من المحتمل أن تتحمل مخاطرة زائدة مع بقائها في الصدارة".
ويمتد تأثير هذا العمل إلى ما هو أبعد من سباقات الطائرات المسيّرة، وفق ما يشير غيدو دي كرون، الخبير في هذا الموضوع والأستاذ في الجامعة الهولندية للتكنولوجيا في دلفت، في تعليق مصاحب للدراسة نشرته مجلة نيتشر.
وأشار إلى أن التقدم في هذا المجال يحظى باهتمام كبير من الأوساط العسكرية، ولكن "لديه نطاق أوسع بكثير من التطبيقات"، من خلال تسهيل "مهام أكثر سلاسة وأسرع وأطول مدى".
بالنسبة لإيليا كوفمان، الذي يعمل الآن مهندسًا في شركة لصناعة المسيّرات، فإن التحدي يكمن في الاستجابة "لضعف متأصل في الطائرات المسيّرة ذاتية التحكم، ويتمثل في استقلالية الطيران المحدودة للغاية".
ولفت إلى أن النهج المعتمد مع نظام سويفت، "الذي يجعل من الممكن إعادة جدولة الإجراءات في الوقت الفعلي من دون الحاجة إلى إعادة حساب المسار"، من شأنه أن يسمح بملاحة أكثر كفاءة، وبالتالي توفير المزيد من الطاقة.