شركة xAI تطلق تقنية مطوّرة ومبتكرة لتوليد الفيديو في Grok
إكس أيه آي تطلق قدرات متطورة لتوليد الفيديو في نموذج جروك
تطور آليات التوليد البصري
كشفت شركة xAI عن تحسينات جوهرية في آلية معالجة الفيديو داخل نموذجها الذكي “جروك”، مستهدفة تعزيز قدرات الذكاء الاصطناعي التوليدي على منصة إكس. يتيح التحديث الجديد تحويل الأوامر النصية المعقدة إلى مشاهد بصرية متحركة، مع التركيز على دقة التفاصيل وفهم السياق المكاني للعناصر داخل المشهد.
تعتمد العملية المحدثة على خوارزميات تعلم عميق متطورة تهدف إلى تقليل زمن الاستجابة (Latency) أثناء عملية التصيير، مما يوفر تجربة مستخدم أكثر سلاسة مقارنة بالنسخ السابقة. يساعد هذا التحسين في تجاوز عقبات التشوه البصري التي غالباً ما تظهر في النماذج الأولية لتوليد الفيديو.
تحسين التناسق الزمني والفيزيائي
يركز التحديث بشكل خاص على معالجة التحديات التقنية المتعلقة بالفيزياء والمحاكاة الواقعية للحركة. تم تدريب النموذج لضمان الاستمرارية الزمنية (Temporal Consistency) بين الإطارات، مما يمنع ظهور التقطيع أو التغيرات العشوائية في الشخصيات والخلفيات أثناء تشغيل المقطع، وهو ما يرفع من جودة المخرجات النهائية.
يستفيد النظام من تقنيات النمذجة متعددة الوسائط لفهم العلاقة بين الكائنات ووصفها النصي بدقة أعلى. تتيح هذه القدرة للمستخدمين توليد سيناريوهات بصرية تتطلب تفاعلاً ديناميكياً بين العناصر، مما يفتح آفاقاً جديدة لصناع المحتوى لإنتاج وسائط غنية دون الحاجة لبرامج تحرير معقدة.
التكامل مع بيئة إكس والتنافسية السوقية
يأتي هذا الإطلاق ليعزز مكانة “جروك” كمنافس مباشر لأدوات توليد الفيديو الرائدة مثل “سورا” و”رنواي”. من خلال دمج هذه الميزة حصرياً لمشتركي الخدمات المدفوعة، تسعى المنصة إلى توطين أدوات الإنتاج الإبداعي داخل تطبيق واحد، مما يغني المستخدم عن الاستعانة بتطبيقات خارجية.
تشير التحسينات إلى توجه xAI نحو استغلال البيانات الضخمة المتاحة على المنصة لتحسين دقة النماذج التوليدية مستقبلاً. يعكس هذا التطور التحول التدريجي من مجرد شات بوت نصي إلى أداة شاملة لإنشاء المحتوى الرقمي، معتمدة على بنية تحتية قوية للحوسبة السحابية.