MidJourney a mis à niveau sa fonctionnalité Describe qui vous permet d'obtenir une description de n'importe quelle image que vous pourriez ensuite utiliser pour la transformer en une œuvre d'art générative de l'IA.

Cela intègre la fonctionnalité aux autres mises à niveau de la version six et constitue une amélioration significative par rapport à la version précédente qui décrivait mon selfie comme celui d'une femme barbue nommée Tina.

La nouvelle version de Describe s'appuie sur les mêmes mises à niveau qui ont conduit à un plus grand degré de réalisme et à un meilleur suivi des invites que nous avons vu avec MidJourney v6.

Il a même fait une remarque sur l'étagère derrière moi dans mon selfie et ne m'a pas appelé Tina, ce qui était un bonus appréciable.

Comme la version précédente, il présente quatre descriptions possibles en réponse à votre photo et peut en transformer une ou toutes en ce que j'ai pris pour appeler votre « moi » MidJourney.

Comment fonctionne MidJourney Describe

MidJourney Describe fonctionne en tapant /describe dans une session de discussion Discord avec le bot MidJourney. Il vous donne ensuite la possibilité de télécharger une image ou de partager un lien vers une image. Quelques secondes plus tard, vous obtiendrez quatre descriptions de la photo.

Il s'agit d'une fonctionnalité particulièrement importante, qui inverse le texte habituel en image et passe au territoire image en texte. Forme de vision par ordinateur, elle donne également à l’IA un aperçu du monde réel et l’aide à en apprendre davantage sur les images.

Parfois, les descriptions peuvent être bizarres. Par exemple, j'ai téléchargé une photo du rédacteur en chef du Tom's Guide UK, Jeff Parsons, qui lui a donné deux noms complètement aléatoires et a suggéré qu'il travaillait comme informaticien.

En plus d'une précision améliorée, les nouvelles descriptions sont plus longues. La version précédente décrivait mon selfie ainsi : « Tina est une femme avec une barbe et des lunettes, dans le style rtx, dadaïste, classicisme, asexué, gros plan, webcam, manapunk. »

La nouvelle version se lit comme suit : « Un homme avec des lunettes et une barbe, des cheveux courts, vêtu d'une chemise grise parlant à la caméra, un créateur de contenu de jeu vidéo, avec une grosse tête et des cheveux courts châtain foncé, des lunettes à monture noire clairsemées, un visage potelé, des yeux marron et une barbe avec des poils mi-longs, avec une étagère à livres en arrière-plan, publié sur Snapchat en 2018 dans le style d'une publication Snapchat de 2018. « 

À quoi peut servir Describe

Images générées par l'IA à partir de MidJourney

En plus de l'utiliser pour décrire une photo de quelqu'un et la rôtir, Describe est un outil utile d'inspiration. Si vous avez créé quelque chose dans le monde réel et que vous souhaitez utiliser l'IA pour créer une version numérique, vous pouvez utiliser Décrire pour améliorer votre invite en partageant une photo.

Son autre cas d’utilisation significatif, et sans doute le plus important, concerne l’accessibilité. Être capable de générer une description d'une image peut améliorer la qualité du texte alternatif utilisé pour décrire les images pour les personnes utilisant des outils d'audiodescription pour naviguer sur le Web.

Pouvoir obtenir une description d'une image n'est pas exclusif à MidJourney. Presque tous les outils d’image d’IA ont une capacité similaire et tous les principaux chatbots disposent désormais de compétences en analyse d’images. Mais il fait de mieux en mieux son travail et a été l’un des premiers à proposer cette fonctionnalité.

Claude 3 peut lire tout le texte d'une image, déterminer le positionnement d'un graphique et suggérer des invites d'image à partir de l'image, entre autres fonctionnalités couvertes dans ma critique. Gemini et ChatGPT ont également des fonctionnalités similaires et d'autres outils permettent la génération d'image à image.

Le « moi » du MidJourney

Image générée par l'IA

L'une des bizarreries amusantes de Describe in MidJourney est la possibilité de créer une version alternative de vous-même. Chaque description peut être utilisée comme invite pour générer une image. J'ai essayé cela sur mon patron et son patron – ils ressemblaient à des co-fondateurs d'une startup technologique.

Dans mon cas, cela change complètement mon visage, mais cela ressemble plus à une version de moi si ma vie était transformée en téléfilm et si j'étais joué par un acteur qui ne passait pas sa vie à l'intérieur, assis devant un ordinateur portable et se faisant peu d'exercice possible.