Modèles vidéo IA | Veni AI

Modèles d’IA vidéo

Modèles avancés de génération vidéo pour créer des contenus visuels remarquables à partir de descriptions textuelles.

Sora 2

Sora 2 offre un son synchronisé, une qualité 4K et une physique améliorée pour des vidéos cinématographiques.

Audio synchronisé

Fidélité visuelle 4K

10-20 secondes

Cohérence du monde

Détails

Sora

Le modèle révolutionnaire de génération vidéo d’OpenAI, capable de créer des scènes réalistes et créatives à partir d’instructions textuelles.

Génération de texte en vidéo

Jusqu’à 60 secondes

Résolution 1080p

Détails

Kling 3.0

Kling 3.0 propose une génération multi‑plans, des mouvements tenant compte de la physique, une sortie 4K native et un audio synchronisé dans un modèle unifié.

Jusqu’à 15 secondes

Mode multi‑plans (6 coupes)

Sortie 4K native

Audio synchronisé

Détails

Kling 2.6

Kling 2.6 offre une génération audio native ainsi qu’un contrôle avancé de la cohérence visuelle et de la fidélité des mouvements des personnages.

Génération audio native

Cohérence des personnages

Contrôle avancé des mouvements

Kling O1

Kling O1 intègre diverses tâches vidéo dans une architecture unifiée, incluant la génération basée sur des références et l’interpolation d’images clés.

Texte vers vidéo

Interpolation d’images clés

Inpainting vidéo

Génération basée sur des références

Runway Gen-3 Alpha

Runway Gen-3 Alpha offre des visuels de qualité cinématographique avec des personnages humains expressifs et un contrôle temporel précis.

Sortie photoréaliste

Personnages expressifs

Plus de 10 secondes extensibles

1280x768 ou 768x1280

Détails

Pika 2.1

Pika 2.1 introduit la génération vidéo haute définition 1080p avec Pikadditions pour une insertion d’objets fluide.

Génération HD 1080p

Fonction Pikadditions

Remplacement d’éléments Pikaswaps

5 à 10 secondes

Détails

Pika 2.0

Pika 2.0 a ajouté la fonctionnalité Scene Ingredients pour intégrer des images téléchargées par l'utilisateur dans des vidéos générées par l'IA.

Scene Ingredients

Intégration d’images

Interface conviviale

Pika 1.5

Pika 1.5 a introduit Pikaffects, permettant des transformations imaginatives comme le gonflement ou la fonte d’objets.

Transformations Pikaffects

Effets créatifs

Manipulation d’objets

Luma Dream Machine

Luma Dream Machine est un modèle de génération vidéo à partir de texte, capable de produire des mouvements réalistes à partir de requêtes utilisateur ou d’images fixes.

Vidéos de 5 secondes

Résolution 1360x752

Capture de mouvement réaliste

Offre gratuite disponible

Détails

Luma Ray3.14

Luma Ray3.14 offre une génération vidéo native en 1080p, 4 fois plus rapide et 3 fois plus économique, avec une meilleure cohérence des mouvements.

1080p native

Génération 4× plus rapide

3× plus économique

Cohérence des mouvements améliorée

Luma Genie (3D)

Luma Genie transforme du texte et des images en ressources 3D de haute qualité en quelques minutes.

Image vers 3D

Maillages prêts pour la production

Matériaux PBR

Itération rapide

Détails

SeeDance 2.0

SeeDance 2.0 est un modèle vidéo IA professionnel capable de traiter simultanément texte, images, audio et vidéo avec une qualité cinématographique.

Traitement multimodal

Récits cinématographiques

Mouvements tenant compte de la physique

Cohérence des personnages

Détails

SeeDance 1.0

SeeDance 1.0 est conçu pour transformer des images statiques en vidéos fluides et naturelles.

Image vers vidéo

Mouvement naturel

Animations fluides

Détails

Veo 3.1

Google Veo 3.1 offre une résolution 4K native, une meilleure cohérence des personnages et la prise en charge des formats vidéo verticaux comme YouTube Shorts.

Résolution 4K native

Cohérence des personnages

Prise en charge de la vidéo verticale

Optimisé pour YouTube Shorts

Détails

Veo 3

Google Veo 3 produit des séquences de 8 secondes en haute fidélité, en 720p ou 1080p, avec génération audio intégrée.

Sortie 720p/1080p

Clips de 8 secondes

Audio intégré

Filigrane SynthID

Veo 2

Google Veo 2 crée des vidéos de haute qualité avec une interprétation précise des prompts et une simulation réaliste de la physique.

Clips de 8 secondes en 720p

Compatible 4K

Physique réaliste

Styles cinématographiques

Filigrane SynthID

Hailuo 2.3

Hailuo 2.3 offre une qualité visuelle améliorée, une meilleure cohérence des mouvements et une compréhension supérieure des prompts, avec des esthétiques cinématographiques affinées.

1080p à 24 fps

Jusqu’à 6 secondes

Qualité visuelle améliorée

Esthétiques cinématographiques

Détails

Hailuo 02

Hailuo 02 est un modèle vidéo cinématographique d’IA produisant des vidéos de qualité professionnelle avec des simulations physiques ultra‑réalistes.

Jusqu’à 10 secondes

Résolution 1080p

Physique ultra-réaliste

Texte et image vers vidéo

Classement mondial n°2

MiniMax Video-01

MiniMax Video-01 est le modèle de base offrant des capacités multimodales pour la génération vidéo.

Génération multimodale

Traitement rapide

Qualité professionnelle

Mochi 1

Mochi 1 est un modèle texte‑vers‑vidéo open source doté de 10 milliards de paramètres, offrant une forte fidélité au prompt et un mouvement de haute précision.

10 milliards de paramètres

Open source (Apache 2.0)

Mouvement fluide à 30 fps

5–6 secondes

480p (720p HD prévu)

NVIDIA LATTE3D

LATTE3D génère des maillages texturés en quelques secondes, agissant comme une imprimante 3D virtuelle.

Génération en moins d’une seconde

Maillages texturés

Optimisé pour RTX

Prêt pour l’animation

Détails

Haiper 2.5

Haiper 2.5 a introduit des intégrations API avant que le service ne soit arrêté début 2025. Désormais acquis par NetMind.AI.

Intégration API

Génération hyperréaliste

Arrêté (févr. 2025)

Acquis par NetMind.AI

NIM Microservice

NVIDIA imzalı, text-to-3D odaklı yapay zeka modeli.

Détails