أطلقت شركة Meta لأول مرة مجموعة من نماذج الذكاء الاصطناعي تسمى “Movie Gen” في 4 أكتوبر قادرة على إنتاج أفلام واقعية يصل طولها إلى 16 ثانية، كاملة مع المؤثرات الصوتية والمسارات الموسيقية الداعمة.
لا يعد Movie Gen أول نموذج ذكاء اصطناعي متعدد الوسائط قادر على إنشاء فيديو وصوت من خلال مطالبات نصية بسيطة، ولكن يبدو أنه يُظهر أحدث الإمكانيات. يدعي الباحثون المسؤولون عن تطوير التطبيق أنه تفوق على الأنظمة المنافسة في الاختبارات البشرية.
فيلم الجنرال
وفقًا لمنشور مدونة من Meta، فإن Movie Gen قادر حاليًا على إخراج أفلام تصل مدتها إلى 16 ثانية بمعدل إطارات يبلغ 16 إطارًا في الثانية (FPS). لوضع هذا في الاعتبار، كانت أفلام هوليوود قبل العصر الرقمي يتم تصويرها تقليديًا بمعدل 24 إطارًا في الثانية لتحقيق ما يسمى “مظهر الفيلم”.
في حين أن معدلات FPS الأعلى تعتبر أفضل في الألعاب والتطبيقات الرسومية الأخرى، فإن معدل 16 إطارًا في الثانية من Meta ليس بعيدًا عما يمكن اعتباره صور أفلام ذات جودة احترافية.
يمكن لنماذج Movie Gen إنشاء أفلام جديدة تمامًا استنادًا إلى مطالبات نصية بسيطة أو تعديل الصور أو مقاطع الفيديو الموجودة لاستبدال الكائنات والخلفيات أو تعديلها.
ومع ذلك، قد تكون مساهمتها الأكثر تقدمًا هي قدرة مجموعة الذكاء الاصطناعي على توليد ما يصل إلى 45 ثانية من الصوت الذي يتميز بمؤثرات صوتية وموسيقى خلفية. وفقًا لـ Meta، يقوم Movie Gen بدمج الصوت ومزامنته مع الحركة في مقاطع الفيديو التي تم إنشاؤها.
متعلق ب: يُظهر Meta جسر Web3-to-real مع العرض التوضيحي “Hyperscape” metaverse
الأبحاث فقط
تقوم Meta بإبقاء النماذج الأساسية وراء Movie Gen طي الكتمان في الوقت الحالي. ولم تحدد الشركة إطارًا زمنيًا لإطلاق المنتج، وقالت إنه سيتطلب المزيد من اختبارات السلامة قبل النشر.
وفقًا لورقة بحثية من فريق Meta’s AI:
“تم تطوير مجموعة نماذج Movie Gen الأساسية لأغراض البحث وتحتاج إلى تحسينات متعددة قبل نشرها… وعندما ننشر هذه النماذج، سنقوم بدمج نماذج الأمان التي يمكنها رفض مطالبات الإدخال أو الأجيال التي تنتهك سياساتنا لمنع سوء الاستخدام.”
مجلة: كاد بريان جونسون، رجل الأعمال المناهض للشيخوخة، أن يكرّس حياته للعملات المشفرة