نماذج متقدمة لإنشاء محتوى بصري رائع انطلاقاً من أوصاف نصية.
يوفر Sora 2 صوتًا متزامنًا وجودة 4K وفيزياء محسّنة للفيديو السينمائي.
نموذج إنشاء الفيديو الثوري من OpenAI والقادر على إنتاج مشاهد واقعية ومبتكرة اعتماداً على تعليمات نصية.
يوفر Kling 3.0 توليدًا متعدد اللقطات، وحركة مدركة للفيزياء، وإخراجًا بدقة 4K الأصلية، وصوتًا متزامنًا ضمن نموذج موحّد.
يوفّر Kling 2.6 توليداً صوتياً أصلياً وتحكماً متقدماً في اتساق العناصر البصرية ودقة حركة الشخصيات.
يدمج Kling O1 مهام الفيديو المختلفة في بنية موحّدة تشمل التوليد المعتمد على المرجع واستيفاء الإطارات الأساسية.
يوفّر Runway Gen-3 Alpha مرئيات بجودة سينمائية مع شخصيات بشرية معبّرة وتحكّم زمني دقيق.
يقدم Pika 2.1 إنشاء فيديو بدقة عالية 1080p مع Pikadditions لإدراج العناصر بسلاسة.
أضاف Pika 2.0 ميزة Scene Ingredients لدمج الصور التي يحمّلها المستخدم في المقاطع المُنشأة بواسطة الذكاء الاصطناعي.
قدّم Pika 1.5 ميزة Pikaffects التي تتيح تحويلات مبتكرة مثل نفخ العناصر أو إذابتها.
Luma Dream Machine هو نموذج لتحويل النص إلى فيديو قادر على توليد حركة واقعية انطلاقًا من مطالبات المستخدم أو الصور الثابتة.
يوفر Luma Ray3.14 توليد فيديو بدقة 1080p بشكل أصلي، أسرع بـ4 مرات وأكثر كفاءة من حيث التكلفة بـ3 مرات، مع تحسين تناسق الحركة.
تحوّل Luma Genie النصوص والصور إلى عناصر ثلاثية الأبعاد عالية الجودة خلال دقائق.
SeeDance 2.0 نموذج فيديو احترافي يعمل بالذكاء الاصطناعي لمعالجة النصوص والصور والصوت والفيديو في الوقت نفسه بجودة سينمائية.
تركز SeeDance 1.0 على تحويل الصور الثابتة إلى فيديوهات سلسة تبدو طبيعية.
Google Veo 3.1 يقدم دقة أصلية 4K، وتحسين اتساق الشخصيات، ودعم تنسيقات الفيديو العمودية مثل YouTube Shorts.
Google Veo 3 يقدم مقاطع عالية الدقة لمدة 8 ثوانٍ بجودة 720p أو 1080p مع توليد صوت مدمج.
ينشئ Google Veo 2 مقاطع فيديو عالية الجودة مع تفسير دقيق للمُوَجَّه ومحاكاة واقعية للفيزياء.
يوفّر Hailuo 2.3 جودة بصرية محسّنة، وتناسقًا أفضل في الحركة، وفهمًا عاليًا للتوجيهات مع طابع سينمائي متقن.
Hailuo 02 هو نموذج فيديو سينمائي يعمل بالذكاء الاصطناعي ويُنتج مقاطع فيديو احترافية بمحاكاة فيزيائية فائقة الواقعية.
MiniMax Video-01 هو النموذج الأساسي الذي يقدم قدرات متعددة الوسائط لتوليد الفيديو.
Mochi 1 نموذج مفتوح المصدر لتحويل النص إلى فيديو يحتوي على 10 مليارات باراميتر، ويتميز بالالتزام القوي بالمطالبة ودقة عالية في الحركة.
تُنتج LATTE3D شبكات ثلاثية الأبعاد مكسوّة بالخامات خلال ثوانٍ، لتعمل كطابعة ثلاثية الأبعاد افتراضية.
قدم Haiper 2.5 عمليات دمج مع واجهات API قبل إيقاف الخدمة في أوائل عام 2025. تم الاستحواذ عليها الآن من قبل NetMind.AI.