Je viens de tester Google Gemini Advanced — et il offre une véritable alternative à ChatGPT Plus
Google a enfin lancé son modèle d'intelligence artificielle Gemini Ultra 1.0, qui, selon la société, peut rivaliser avec le modèle d'IA le plus puissant d'OpenAI, GPT-4-Turbo, sur la plupart des tâches. Si cela est vrai, ce serait la première véritable concurrence au ChatGPT d'OpenAI depuis le début du boom de GenAI.
Pour rendre les choses plus confuses, Google a renommé son chatbot de Bard en Gemini. Le modèle sous-jacent et le service que vous utilisez pour y accéder portent désormais le même surnom.
J'attendais de tester Gemini Ultra depuis sa première annonce en décembre, promettant un véritable support multimodal pour les images, la vidéo, le texte, la voix et le code. Il n'est disponible qu'avec un abonnement de 19,99 $/mois au nouveau forfait Google One AI Premium. Je me suis donc abonné pour le tester.
Il ne s'agit pas d'un examen exhaustif ou d'une comparaison avec ChatGPT – ils suivront dans le temps – mais plutôt d'un instantané de mon expérience de jeu avec ChatGPT au cours des 24 premières heures depuis son lancement.
Première chose que j'ai essayée : coder
La première chose que j’essaie avec tout nouveau chatbot, ce sont ses capacités de codage. C’est quelque chose qui devrait venir naturellement à l’IA et l’un des premiers cas d’utilisation commerciale de l’IA générative avant même ChatGPT.
Google a fait grand cas des capacités de codage de Gemini Ultra, donc pour voir dans quelle mesure cela se traduit par une aide au codage utilisable dans le chatbot Gemini Advanced, je lui ai demandé de créer un site Web.
J'avais généré une image d'un chat pixel-art de style anime assis sur une clôture. J'ai donné à Gemini cette photo et le concept du chat étant la star d'une nouvelle émission sur un chat espion appelée Cat-astrophe. Je lui ai ensuite demandé de créer une feuille de style CSS utilisant les couleurs de l'image.
Il n'a pas fait un excellent travail, se contentant de sélectionner une petite sélection de couleurs, mais il a réussi à créer une feuille de style fonctionnelle. Je lui ai ensuite demandé de créer un site Web utilisant cette feuille de style pour mon exposition féline fictive – ce qu'il a fait étonnamment bien. Tout ce que j'avais à faire était d'inclure le chemin correct vers l'image.
Créer des images à l'intérieur des Gémeaux
La génération d'images n'est pas quelque chose que Gemini Advanced fait lui-même. Ceci est géré par un modèle Imagen 2 distinct créé par Google DeepMind. Cependant, son raisonnement et sa compréhension améliorés devraient permettre une meilleure collaboration entre moi et le chatbot – et une meilleure image.
J'ai commencé par lui demander de créer une image de mon sujet de test préféré « Chat sur la lune » et d'ajouter les mots « Chat sur la lune » au bas de l'image. Cela m'a donné deux images faisant exactement ce que je demandais.
Cependant, c'est quelque chose que je pourrais déjà faire avec Bard, alors j'ai essayé de confondre Gemini. Je lui ai demandé : « Mettez le chat dans une combinaison spatiale et placez-le à la surface de la Lune avec la Terre en arrière-plan. Mais gardez le même style visuel que celui que vous avez déjà généré.
J'ai fait ce que j'ai demandé, comme je l'ai demandé, mais je n'ai pas rajouté le texte. Lorsque je lui ai demandé d'ajouter le texte dans le coin inférieur gauche, il a créé une nouvelle image et l'a placée en haut à droite – ce n'est pas une victoire, mais d'autres plates-formes d'IA ont également du mal à assurer la cohérence de la génération d'images et au moins le texte était lisible.
Un nombre infini de robots écrivant Shakespeare
L’un des domaines dans lesquels l’IA commence à exceller est celui de la poésie, en adaptant ou en reflétant spécifiquement le style des créatifs existants. J'ai donc demandé à Gemini Advanced d'écrire un sonnet shakespearien sur la guerre des consoles. Cela s'est bien passé lors de la première exécution, mais n'a mentionné aucune console.
J'ai alors décidé de lui demander d'être plus précis et cela a créé un morceau de poésie impressionnant. Le problème est que ce n’est pas vraiment un défi pour une IA, je lui ai donc demandé d’extraire les mots les plus couramment utilisés dans le sonnet et de les utiliser pour construire une phrase intéressante ne contenant que ces mots.
Avec ce test, j'espérais qu'il réaliserait que les mots les plus courants seraient des choses comme « de », « est » et « ou » et créerait simplement quelque chose d'amusant. Ce n'est pas le cas, et j'ai dû continuer à insister juste pour qu'il me donne les mots courants sans le message. En revanche, ChatGPT a reçu ma demande dès la première tentative.
Le poème écrit par Gemini Advanced :
Trois banderoles flottent là où font rage les guerres numériques,
Un champ de bataille où se tiennent des joueurs fidèles,
Xbox et PlayStation, légendes sur scène,
Avec le charme de Nintendo, une magie à la main.
Des jours passés où les rivaux s'affrontaient et brûlaient,
Où le martinet hérisson et le plombier se sont courageusement battus,
Les braises de ces batailles sont revenues,
Même si les noms ont changé, la passion reste inculte.
Vert, bleu et rouge, leurs couleurs marquent les lignes,
Chaque champion possède un pouvoir encore inédit,
Avec des mondes immersifs, des récits qui brillent,
Le choix divise l’endroit où les joueurs peuvent se réunir.
Pourtant, au milieu de la mêlée, un amour partagé demeure,
Car dans le domaine du jeu, tous les cœurs se heurtent.
Conclusion – bien mais nécessite un peu de travail
J'ai été généralement impressionné par la façon dont la réponse de Bard… désolé… Gemini Advanced a été comparée aux itérations précédentes. Il a donné des réponses raisonnées et structurées, même à des requêtes complexes, mais il n'a pas non plus répondu plus que ce à quoi je m'attendais.
On a l'impression d'attendre que des réglages précis et des fonctionnalités supplémentaires soient activés, mais quand il y parvient, c'est facilement comparable à l'utilisation de ChatGPT Plus.
Ce qui reste à voir, c'est à quel point cela s'améliore à mesure que Google améliore le bot en réponse aux commentaires des utilisateurs, aux cas d'utilisation réels et grâce à des réglages précis.