Le générateur d'images d'intelligence artificielle MidJourney a publié la version 6 de son outil populaire, permettant des invites plus longues, des niveaux de détail plus élevés et même l'ajout de texte à une photo.

MidJourney est entré pour la première fois en version bêta ouverte en juillet 2022 et a réalisé des progrès rapides et impressionnants en termes de qualité et de précision des images à chaque version ultérieure.

Cette version arrive à un moment où MidJourney est soumis à une pression croissante de la part de concurrents, notamment du DALL-E 3 d'OpenAI, capable de générer du texte. De même, les outils gratuits de Meta et des services comme Leonardo offrent également de plus en plus de contrôle sur la génération d'images.

Quoi de neuf dans MidJourney v6 ?

La dernière version de MidJourney inclut une longueur d'invite plus longue, un contrôle plus granulaire sur la couleur et l'ombrage, le texte et la possibilité d'affiner le résultat via une conversation avec MidJourney de la même manière que ChatGPT vous permet d'affiner les images DALL-E.

La dernière mise à jour est en développement depuis un certain temps, avec des groupes sélectionnés d'abonnés testant et comparant le résultat pour améliorer la qualité globale.

L’une des mises à jour les plus frappantes réside dans la façon dont il interprète et comprend les invites. Par exemple, il peut désormais comprendre les nuances de ponctuation et de grammaire, faisant ainsi la différence entre manger, tirer et partir.

Où pouvez-vous accéder à MidJourney v6 ?

Comme toutes les versions précédentes de MidJourney, la version six est disponible via Discord. Une fois l'abonnement payé, vous aurez accès au bot dans des messages où vous pourrez/imaginer la création de votre choix.

Pour accéder à la version six, vous devrez soit la sélectionner comme modèle par défaut dans les paramètres, soit ajouter –v 6 à la fin de n'importe quelle invite. Cela garantira qu'il utilise le bon modèle et vous permettra toujours de continuer à utiliser la version 5.2 par défaut.

MidJourney a commencé à ouvrir l'accès à une version Web aux utilisateurs ayant généré plus de 10 000 images. Cela inclut la possibilité de modifier les paramètres via différentes entrées plutôt que de s'appuyer sur le modèle d'IA pour comprendre une seule invite de texte.

À quoi ressemblent les images MidJourney v6 ?

Pour tester la dernière version (qui, souligne MidJourney, est toujours en mode version alpha et révision), je lui ai défini une série d'invites et j'ai comparé la sortie à la même invite dans la v5.2.

Tester le texte

Pour la première invite, j'ai demandé à MidJourney v6 de créer une affiche pour un film intitulé Moon Pups, mais il n'a pas réussi à ajouter le texte à l'image.

J'ai décidé d'être plus explicite et de lui dire d'inclure des mots spécifiques, en les plaçant entre guillemets pour les souligner. Cela a résolu le problème, bien que MidJourney v6 ait le même problème que DALL-E avec l'orthographe.

Comparaison côte à côte

Ensuite, MidJourney v5.2 (à gauche) et MidJourney v6 (à droite) ont chacun généré une image à partir de la même invite à comparer. J'ai trouvé que si la v6 était plus riche en détails, la v5.2 bénéficiait de mois de raffinement et avait plus de caractère.

L'invite : « un dégustateur de vin regardant à travers un verre de vin ».

Vrais gens

Enfin, j'ai demandé à la v5.2 (à gauche) et à la v6 (à droite) de créer l'image d'une personne réelle. Certains modèles d'IA refusent de produire une image d'un être humain vivant, notamment DALL-E, mais MidJourney ne souffre pas des mêmes problèmes.

J'ai demandé à tous les deux de créer une image d'Elon Musk chevauchant une licorne. Ni l’un ni l’autre n’a reçu de précision rapide ni d’instructions supplémentaires. La version 5.2 a créé une représentation semblable à un dessin animé tandis que la version 6 ressemble à une photographie.