الأربعاء 20 نوفمبر / November 2024

"سورا".. إطلاق أداة ثورية تُنشئ مقاطع فيديو بناء على طلب نصي

"سورا".. إطلاق أداة ثورية تُنشئ مقاطع فيديو بناء على طلب نصي

شارك القصة

بإمكان "سورا" إنشاء مشاهد معقدة تضمّ شخصيات عدة وأنواعًا محددة من الحركات - غيتي
بإمكان "سورا" إنشاء مشاهد معقدة تضمّ شخصيات عدة وأنواعًا محددة من الحركات - غيتي
الأداة الجديدة حملت اسم "سورا" Sora، والتي باتت قادرة على إنشاء مقاطع فيديو واقعية تصل مدتها إلى دقيقة واحدة بمجرد إدخال طلب نصّي.

أطلقت شركة "أوبن ايه آي" مبتكرة برنامج "تشات جي بي تي" ومولّد الصور "دال-اي" DALL-E، أداة جديدة حملت اسم "سورا" Sora، والتي باتت قادرة على إنشاء مقاطع فيديو واقعية تصل مدتها إلى دقيقة واحدة بمجرد إدخال طلب نصّي، وهو ابتكار كبير في مجال الذكاء الاصطناعي الذي يتسارع التقدم العالمي فيه وسط منافسة كبيرة بين الشركات العالمية.

قيد الاختبار

وأوضحت الشركة الناشئة المتحالفة مع "ميكروسوفت" أن هذه المنصة الجديدة التي تستند إلى أبحاث سابقة أُجريَت على برنامجي "دال-اي" و"جي بي تي"، لا تزال قيد الاختبار، لكنّها عرضت مع ذلك بعض مقاطع الفيديو وشرحت طريقة نشوئها.

وشرحت "أوبن ايه آي" على موقعها الإلكتروني أن البرنامج يستطيع إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة "مع الحفاظ على الجودة المرئية واحترام طلب المستخدم".

وأضافت أن في إمكان "سورا" إنشاء "مشاهد معقدة تضمّ شخصيات عدة وأنواعًا محددة من الحركات وتفاصيل دقيقة".

وكذلك يتيح "سورا" إنشاء فيديو من صورة ثابتة، أو توسيع مقاطع الفيديو الموجودة، بحسب "أوبن ايه آي".

وأشار رئيس "أوبن ايه آي" سام ألتمان عبر شبكة "إكس" الاجتماعية، أن الشركة ستتيح استخدام الأداة الجديدة "لعدد محدود" من مبتكري المحتوى، في إطار مرحلة تجريبية.

دعوة المستخدمين إلى تقديم مقترحات

كذلك دعا المستخدمين إلى تقديم مقترحات تتعلق بإنشاء مقاطع فيديو، ما لبث بعد لحظات أن عرض أبرزها على المنصة.

ومن بين هذه المقاطع واحد يظهر فيها كلبان يتعاركان وسط الثلج في منطقة جبلية، ويظهر مقطع فيديو آخر حيوانًا وهميًا يطير، نصفه بطة ونصفه تنين، في مشهد رائع لغروب الشمس، وعلى ظهره حيوان قداد (هامستر) يرتدي ملابس رياضية.

وتشكّل أداة "سورا" أساسًا لـ"برامج قادرة على فهم ومحاكاة العالم الحقيقي"، بحسب الشركة الناشئة التي تأمل في أن تكون "خطوة مهمة في تحقيق الذكاء الاصطناعي العام"، وهو نظام شديد الاستقلالية تفوق قدراته ما يستطيعه البشر في معظم المهام المربحة اقتصاديًا.

ونبّهت "أوبن ايه آي" إلى أن ثمة "عيوبًا" في "النموذج الحالي" للمنصة، ومنها الالتباس بين اليسار واليمين أو عدم القدرة على الحفاظ على الاستمرارية البصرية طوال الفيديو.

وأوضحت الشركة أن شخصًا في مقطع فيديو "قد يأكل جزءًا من قطعة بسكويت، لكنّ آثار القضمة قد لا تظهر على قطعة البسكويت" في مشهد ثانٍ من مقطع الفيديو.

وأكدت الشركة أن مسألة الأمن ستكون أساسية في ما يتعلق بهذه الأداة، مشيرة إلى أنها ستنظم عمليات محاكاة لتحديد حدود المنصة بشكل أفضل.

وستعمل الشركة على إشراك صناع السياسات والمعلمين والفنانين في مختلف أنحاء العالم لفهم مخاوفهم وتحديد حالات الاستخدام الإيجابي لهذه التكنولوجيا الجديدة.

وسبق لمجموعات "ميتا" و"غوغل" و"رَنواي إيه آي" أن عرضت نماذج عن تطبيقات مماثلة تسمى text-to-video (تحويل النصوص إلى مقاطع فيديو)، تسعى إلى ابتكارها.

تابع القراءة
المصادر:
أ ف ب
تغطية خاصة
Close