Chaque nouvelle vidéo montrant les capacités de ChatGPT Voice me donne encore plus envie de l'essayer par moi-même, et la dernière ne fait pas exception. Nous y voyons l’IA adopter une gamme de voix de personnages différentes sur la base d’une simple invite vocale – parfaite pour la narration.

On ne sait pas exactement quand la prochaine version de ChatGPT Voice, également connue sous le nom d'Omni Voice, sera disponible, mais des rumeurs suggèrent que les premiers utilisateurs y auront accès plus tard dans l'été.

Contrairement à la version actuelle de ChatGPT Voice, ce nouveau modèle est construit à l'aide de GPT-4o et est nativement parole-parole, ce qui signifie qu'il n'a pas besoin d'abord de convertir ce que vous dites en texte.

Cette modalité vocale native permet au modèle de créer des voix aux sonorités différentes, d'exprimer des émotions et même de détecter des signes d'émotion dans votre voix pendant que vous lui parlez.

Que montre la nouvelle démo de ChatGPT ?

OpenAI a progressivement révélé la multitude de fonctionnalités cachées dans le nouveau mode vocal de GPT-4o. Jusqu'à présent, nous l'avons vu traduire des conversations en temps réel, aider aux devoirs et même saluer un public lors d'une conférence tech française.

Dans la dernière démo, il s'ouvre avec un membre du personnel d'OpenAI donnant des instructions au chatbot IA. Il dit à l'IA qu'il est en train d'écrire une histoire et qu'il souhaite pratiquer quelques voix pour différents personnages. L’un est un lion et ChatGPT affiche une voix bourrue et majestueuse.

ChatGPT fait un travail incroyable avec le lion et est ensuite capable de passer rapidement au deuxième personnage qui est une « souris qui s'est faufilée dans une grotte ».

Ce qui était vraiment intéressant, c'était la façon dont il était capable de faire en sorte que l'IA change la voix, en lui disant de la rendre « un peu plus grinçante, comme une toute petite souris ».

Il a ensuite ajouté d'autres personnages, comme un hibou qui semblait sage, agissant comme un conseiller du lion et un personnage méchant au rire diabolique. ChatGPT a eu un rire maniaque ! Il a créé un ensemble complet de personnages à utiliser dans l’histoire.

Dans l'ensemble, il a fait un excellent travail et nous donne un aperçu de la façon dont ChatGPT pourrait potentiellement être utilisé pour agir en tant que Dungeon Master dans un jeu de D&D ou remplacer les livres audio par des histoires interactives personnalisées générées à la volée.

Quand ChatGPT Voice sera-t-il disponible

Logo ChatGPT-4o sur le téléphone

OpenAI tient à préciser que même si le mode vocal est déjà disponible pour tous les utilisateurs dans l'application ChatGPT, les « nouvelles capacités vocales et visuelles avec GPT-4o seront déployées dans les semaines à venir ».

Certains utilisateurs ont commencé à appeler le nouveau mode Omni Voice ou GPT-4o voice. Les fonctionnalités démontrées dans la nouvelle vidéo ne sont disponibles qu'avec la voix et la vision GPT-4o. Certains utilisateurs y auront accès dans les prochains mois.

Si vous accédez à l'application iPhone ou Android et entrez en mode Voix, vous pouvez voir quelle version vous utilisez en cliquant sur l'icône (i) en haut à droite. Il devrait indiquer la nouvelle voix ChatGPT « à venir » si vous utilisez la version actuelle.