La plateforme de génération d'images d'intelligence artificielle MidJourney travaille sur de nouveaux modèles de création 3D, vidéo et temps réel qui lui permettraient de simuler le monde entier.

Les détails ont été révélés dans le cadre des récentes « heures de bureau » sur Discord, au cours desquelles les dirigeants de l'entreprise répondent aux questions des utilisateurs sur l'avenir de la plateforme.

Des rumeurs circulent depuis un certain temps selon lesquelles MidJourney s'étendait au-delà des images, mais cela semble suggérer que les nouveaux mouvements seront étroitement axés sur la création d'un modèle mondial.

Ils ont ajouté et mis à niveau d'autres fonctionnalités telles que la description des images et des caractères cohérents tout en créant de nouveaux modèles.

La nature exacte de cela n'est pas claire, mais la société suggère qu'il s'agirait d'un environnement virtuel dans lequel les gens pourraient créer des jeux vidéo ou tourner des films – un « bac à sable en monde ouvert ».

Aller au-delà des images grâce à l’IA

Jouet Spiderman généré par l'IA

MidJourney a été fondée en 2022 par David Holz, un entrepreneur en série autoproclamé.

La première version bêta ouverte a été publiée en juillet de la même année et a été rapidement réitérée et mise à niveau au cours de l'année suivante, son modèle v6 le plus puissant étant sorti en décembre de l'année dernière. Aux mêmes heures de bureau, Holtz a déclaré que la v7 représenterait un saut plus important que de 5 à 6.

MidJourney est resté obstinément à l'intérieur de Discord comme moyen d'interagir avec et de créer des images à l'aide de son modèle, bien que certains utilisateurs intensifs puissent utiliser l'interface Web.

Les travaux ont déjà commencé sur la formation de la septième version du modèle d'image MidJourney et Holtz a déclaré aux utilisateurs de Discord que la génération 3D pourrait arriver avant la vidéo.

L’intérêt de passer aux mondes 3D

Il est logique que la dimensionnalité fasse partie de l’accent. L'une des anciennes startups de Holtz était Leap Motion, une entreprise qui construisait des capteurs pour suivre les mouvements des mains et des doigts en VR.

« Nous essayons vraiment d'accéder à la simulation mondiale », a-t-il déclaré sur Discord. « Nous construisons des MJ 3D à mi-parcours, des MJ vidéo et des MJ en temps réel où les choses évoluent vraiment, très vite. »

Il a ajouté que si vous mettez tout cela ensemble, vous obtenez une simulation mondiale. L’objectif, a-t-il déclaré, est de construire chacun de ces trois éléments de manière indépendante, puis de trouver des moyens de les rassembler.

« Ce sera plutôt un bac à sable », a-t-il expliqué. Ajoutant que « les gens y créeront des jeux vidéo, les gens y tourneront des films, mais l'objectif est de construire le bac à sable du monde ouvert ».

Alors le métaverse est de retour ?

Studio Roblox

À première vue, cela ressemble à une interprétation moderne du métaverse. L'idée d'une série d'environnements virtuels entièrement interconnectés où les gens peuvent effectuer des tâches quotidiennes, gagner de l'argent et s'amuser.

Cependant, cela semble plutôt être une nouvelle façon de créer du contenu de tout type, notamment en générant des environnements virtuels entiers dans lesquels les futurs films de science-fiction pourraient être filmés sans avoir à utiliser des outils VFX pour créer chaque élément à un coût élevé.

La vision du bac à sable de Holtz de MidJourney ressemble davantage à certaines des idées avancées par Roblox pour son studio de développement.

La société a récemment révélé de nouveaux générateurs de textures et d'avatars et lors d'une conversation avec le directeur du studio Stefano Corazza, on m'a dit qu'il était prévu que l'IA génère des environnements entiers à partir d'une invite de texte.