L'outil vidéo génératif d'OpenAI, Sora, a fait des vagues lorsqu'il a été révélé le mois dernier, produisant des vidéos de qualité studio à partir de texte – et il semble que nous le verrons officiellement lancé à un moment donné cette année.

S'adressant au Wall Street Journal OpenAI CTO, Mira Murati a déclaré que Sora serait disponible au public d'ici la fin de cette année et peut-être dans les prochains mois. Jusqu'à présent, nous n'avons vu que des vidéos prédéfinies d'OpenAI.

Avant sa sortie, OpenAI tente de rendre Sora plus efficace et moins cher. L'objectif est de lui permettre de générer des vidéos à peu près aussi vite que DALL-E produit des images et de le faire à peu près au même prix.

Cela suggère que Sora pourrait être associé à ChatGPT Plus et disponible sous forme d'API permettant aux développeurs tiers de l'intégrer dans leurs produits, peut-être même dans les futures versions d'outils de montage vidéo comme Adobe Premiere Pro ou Apple Final Cut Pro.

Murati a déclaré qu'ils faisaient également équipe en rouge avec le générateur vidéo d'IA pour s'assurer qu'il ne produit pas de contenu peu recommandable et trouver des moyens de minimiser le risque de désinformation.

Les gens ont du mal à repérer les vidéos de l’IA

OpenAI Sora

La nouvelle concernant la future sortie potentielle de Sora coïncide avec une nouvelle enquête commandée par Variety qui a révélé que la plupart des adultes américains ne parvenaient pas à dire si une vidéo était Sora ou réelle.

L'enquête a été réalisée par HarrisX et comprenait des vidéos de démonstration publiées par OpenAI, notamment des vagues contre des falaises escarpées et la ruée vers l'or en Californie.

Nous ne divulguerons rien sur lequel nous ne sommes pas sûrs de la manière dont cela pourrait affecter les élections mondiales ou d'autres questions.

De nombreuses personnes interrogées ont même suggéré que les vidéos créées par l'homme avaient été réalisées par l'IA, ce qui suggère qu'OpenAI et d'autres plateformes vidéo doivent faire davantage de travail sur l'identification.

Murati a déclaré au Wall Street Journal que c'est un sujet qui l'empêche de dormir la nuit et qu'ils pourraient envisager de retarder sa publication si des mesures de sécurité ne peuvent pas être mises en place avant l'élection présidentielle de novembre.

« Il est important de s'attaquer aux problèmes de désinformation et de préjugés préjudiciables, a expliqué Murati. Ajoutant que « nous ne divulguerons rien sur lequel nous ne sommes pas sûrs de la manière dont cela pourrait affecter les élections mondiales ou d'autres questions ».

Que pourra faire Sora ?

OpenAI Sora

Lorsque Sora sera finalement libéré, Murati dit que ce sera à peu près au même prix que DALL-E et que cela prendra le même temps. Pour y parvenir, ils doivent d’abord le rendre plus efficace et plus rapide, car actuellement, la création d’une simple vidéo de 20 secondes peut prendre « quelques minutes ».

Murati dit qu'ils travaillent également à l'amélioration des fonctionnalités car il existe encore des problèmes irréalistes avec Sora, notamment concernant le mouvement des doigts.

« ChatGPT et DALL-E sont optimisés pour que le public puisse les utiliser là où Sora est un résultat de recherche, donc c'est beaucoup plus cher », a déclaré Murati au WSJ. « Nous ne savons pas à quoi cela ressemblera lorsque nous le rendrons public, nous espérons l'obtenir à un coût similaire à celui de DALL-E. »

« Nous essayons de comprendre comment utiliser cette technologie comme un outil avec lequel les gens peuvent éditer et créer », a expliqué Murati. « Au final, il y aura plus de maniabilité, de contrôle et de précision pour refléter l'intention de ce que vous voulez. »

Quelles limitations Sora aura-t-il à sa sortie ?

OpenAI Sora

OpenAI est actuellement en train de suivre un processus appelé « équipe rouge » avec Sora, où ils testent ses limites et essaient de lui faire faire des choses qui ne sont pas idéales, y compris la génération de vidéos qui pourraient être illégales, irréalistes ou potentiellement diffamatoires comme le montre le schéma. personnalités publiques.

Le résultat sera un modèle doté de garde-corps similaires au modèle d’image DALL-E d’OpenAI. Par exemple, il ne vous permettra pas de générer des vidéos de personnalités publiques.

OpenAI Sora

Murati affirme qu'ils travaillent également avec des artistes et des décideurs politiques dans un large éventail de domaines pour déterminer le niveau de flexibilité que l'outil devrait offrir sur des sujets comme la nudité et la violence.

« Je le vois comme un outil pour développer la créativité », a-t-elle déclaré. « Nous voulons que les acteurs de l'industrie cinématographique et les créateurs du monde entier participent à la manière dont nous le développons et comment nous le déployons. »

« Les outils d'IA élargiront notre créativité et nos connaissances, notre imagination collective et notre capacité à faire n'importe quoi, mais il sera extrêmement difficile de trouver la voie à suivre pour intégrer les outils d'IA dans notre réalité quotidienne, mais je pense que cela vaut la peine d'essayer. »