OpenAI dévoile Sora, un générateur de vidéos alimenté par IA

Par Sika AGOSSOU 5 Min de Lecture

OpenAI a récemment annoncé son tout dernier outil révolutionnaire dénommé Sora, un modèle d’intelligence artificielle axé sur la création de vidéos hyperréalistes à partir de texte. Ce modèle va au-delà de la simple compréhension des demandes des utilisateurs dans le texte, il comprend également comment ces éléments existent dans le monde physique.

Sora est un modèle d’intelligence artificielle développé par OpenAI qui permet de créer des vidéos d’une durée maximale d’une minute à partir de prompts textuels. À travers une approche de diffusion, il transforme progressivement une vidéo initiale ressemblant à du bruit statique en résultat final en éliminant le bruit étape par étape.

Les fonctionnalités de Sora, le générateur vidéos d’OpenAI

Sora offre plusieurs fonctionnalités impressionnantes pour la création de vidéos, dont des scènes hautement détaillées, une combinaison logique de plusieurs plans, ainsi qu’une certaine compréhension du monde physique.

Annonces

Par conséquent, OpenAI a rendu Sora capable de construire des scènes complexes comprenant des mouvements de caméra sophistiqués et plusieurs personnages. L’outil de création de vidéo peut aussi comprendre comment les objets existent dans le monde réel, et en fonction des invites des utilisateurs, combiner plusieurs plans pour créer des vidéos cohérentes sans interruption de style ou de personnage.

Le modèle possède une compréhension approfondie du langage, ce qui lui permet d’interpréter avec précision les invites et de générer des personnages convaincants qui expriment des émotions vibrantes. Sora peut également créer plusieurs plans dans une seule vidéo générée qui conservent avec précision les personnages et le style visuel.

Toutefois, le modèle tel que lancé présente quelques déficiences. Hormis des difficultés à comprendre la physique de certains cas de cause à effet et à simuler certaines scènes à la perfection dans la création vidéo, Sora peut pareillement confondre des détails d’espace d’une invite et avoir du mal à décrire certains évènements capturés au fil du temps. Toutes ces coquilles à résoudre, résultent pour l’heure à la création de mouvements physiquement invraisemblables, d’apparitions spontanées dans le cas de plusieurs entités à apparaitre dans une scène ou de difficultés pour Sora à modéliser certains objets.

Sora OpenAI
Exemple de problème de modéllisation précise d’une chaise en plastique par Sora. Crédit photo : OpenAI.

Sora n’est pas encore accessible à tous

Actuellement, Sora est en phase de prévisualisation et n’est pas encore disponible au grand public. Grâce à la mobilisation des membres de la Team Red, OpenAI travaille activement à améliorer la sécurité de ce modèle avant de le rendre accessible à tous comme relayé par le site Creapills.

Cela implique notamment le rejet des prompts textuels contenant de la violence extrême, du contenu sexuel, des images haineuses ou des atteintes aux droits de propriété intellectuelle de tiers ou à la vie privée des célébrités. OpenAI collabore avec des experts dans des domaines tels que la désinformation, le contenu haineux et les biais pour tester les limites du modèle.

Malgré les recherches et les tests approfondis, OpenAI reconnaît qu’il est impossible de prédire toutes les utilisations bénéfiques ou abusives de cette technologie. C’est pourquoi l’apprentissage à partir de l’utilisation réelle est essentiel pour créer et diffuser des systèmes d’IA de plus en plus sûrs au fil du temps.

Nous prendrons plusieurs mesures de sécurité importantes avant de rendre Sora disponible dans les produits OpenAI. Nous travaillons avec des équipes rouges – des experts dans des domaines tels que la désinformation, les contenus haineux et les préjugés – qui testeront le modèle de manière contradictoire… Nous développons également des outils pour aider à détecter les contenus trompeurs, tels qu’un classificateur de détection capable de déterminer quand une vidéo a été générée par Sora. Nous prévoyons d’inclure les métadonnées C2PA à l’avenir si nous déployons le modèle dans un produit OpenAI… Nous mobiliserons les décideurs politiques, les éducateurs et les artistes du monde entier pour comprendre leurs préoccupations et identifier des cas d’utilisation positifs de cette nouvelle technologie.

OpenAI
ÉTIQUETTE :
Laisser un commentaire

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *