Le modèle vidéo d'intelligence artificielle d'OpenAI, Sora, continue d'afficher une capacité impressionnante à capturer le monde réel à partir d'une simple invite de texte.

La société affirme qu'elle sera disponible au public à un moment donné cette année, mais d'ici là, la seule façon de découvrir ses capacités est de publier les publications de Sora Sunday sur les réseaux sociaux.

La dernière version intervient dans un contexte de pression croissante exercée sur OpenAI pour qu'elle divulgue la source des données utilisées pour entraîner Sora. Cela a été déclenché par le refus de la directrice technique Mira Murati de confirmer lors d'une interview au Wall Street Journal si les vidéos publiques des créateurs YouTube figuraient dans l'ensemble de données.

En attendant, nous pouvons toujours profiter de ses créations, notamment de sa capacité étrange à fusionner différentes vidéos, à suivre des instructions simples et à créer plusieurs scènes à partir d'une seule invite de texte.

Nouveaux clips Sora incroyables

Cette semaine, nous avons vu une vidéo d'un éléphant vert couvert de feuilles pour marquer la Saint-Patrick, une cascade arc-en-ciel et la valse du bourdon.

OpenAI ajoute à chaque vidéo qu'il partage : « Nous partageons très tôt les progrès de nos recherches pour tirer les leçons des commentaires et donner au public une idée des capacités de l'IA à l'horizon. »

Un éléphant feuillu

L'une des fonctionnalités les plus impressionnantes des outils vidéo d'IA comme Sora est la possibilité de créer quelque chose qui ne pourrait pas exister, et ce à partir d'une invite de texte.

Contrairement aux autres modèles, Sora apporte une cohérence de mouvement. Par exemple, dans cette vidéo d'éléphant partagée sur Instagram, les feuilles de cet éléphant bougent indépendamment.

Invite : « Un éléphant fait de feuilles courant dans la jungle. »

Chaton sous vide

Sora fait aussi très bien le réalisme. Il s'agit d'une vidéo d'un chaton pirate chevauchant un robot aspirateur et j'ai dû y réfléchir à deux fois pour réaliser qu'il ne s'agissait pas simplement d'une vidéo filmée sur un smartphone.

L'une des fonctionnalités amusantes de Sora est sa capacité à fusionner deux vidéos ensemble et un futur outil construit sur le modèle pourrait voir quelqu'un fusionner une vidéo de son propre animal de compagnie avec une autre vidéo comme celle d'un robot aspirateur pour créer une nouvelle génération de des clips sociaux amusants à partager.

Invite : « Un adorable chaton pirate chevauchant un robot aspirateur dans la maison. » Partagé sur Instagram par OpenAI.

Cascade arc-en-ciel

Plus un pot de peinture qu'un arc-en-ciel, mais cela montre une version bizarre des chutes du Niagara qui semble avoir été reprise pour une publicité d'une entreprise de peinture.

Partagé sur Instagram et réalisé à l'aide de l'invite « Les chutes du Niagara avec de la peinture colorée au lieu de l'eau ».

Caméléon en mouvement

Cette image a été partagée sur OpenAI Instagram montrant un caméléon en mouvement et montrant ses capacités de changement de couleur. Il est impressionnant de voir à quel point cela semble réaliste et pourrait faire allusion à l’avenir des documentaires animaliers.

Il a été partagé avec la description : « ce gros plan d’un caméléon met en valeur ses remarquables capacités de changement de couleur. l'arrière-plan est flou, attirant l'attention sur l'apparence frappante de l'animal.

Abeille en vol

C’est l’un de mes favoris et cela me fait aimer la petite abeille alors qu’elle vole à la recherche de pollen à travers une gamme de plantes et d’horizons.

OpenAI l'a partagé sur Instagram avec l'invite : « Vidéo POV d'une abeille alors qu'elle plonge dans un magnifique champ de fleurs ».