ChatGPT Advanced Voice est maintenant sur Mac et Windows – comment y accéder
OpenAI apporte enfin le mode Advanced Voice sur le bureau. Il sera disponible dans les versions Windows et Mac de l'application ChatGPT et fonctionne de la même manière que la version mobile.
Cela signifie que vous pouvez enfin avoir une conversation avec votre ordinateur. Pas de la manière dont vous pouvez parler à Siri ou Alexa (et oui, ils ont tous deux été déclenchés lorsque j'ai dicté cette copie), mais une conversation complète comme si vous parliez à un autre être humain.
Advanced Voice est une synthèse vocale native. Cela signifie que le robot vocal d'OpenAI peut comprendre tout ce que vous dites, comment vous le dites et même les pauses entre vos mots. Il réagit tout aussi naturellement, notamment en ajoutant des tics vocaux tels que « euh » et des bruits de respiration entre chaque phrase.
Nous n'avons pas encore tenu toutes les promesses faites lors de la mise à jour printanière d'OpenAI concernant le partage d'écran et la vidéo en direct avec ChatGPT, mais cela finira par arriver et il s'agit toujours d'une mise à niveau majeure par rapport aux autres modèles vocaux.
Comment fonctionne Advanced Voice sur un ordinateur de bureau ?
Grand jour pour les ordinateurs de bureau. Advanced Voice est désormais disponible dans les applications de bureau macOS et Windows.https://t.co/mv4ACwIhzA pic.twitter.com/HbwXbN9NkD30 octobre 2024
Vous accédez à Advanced Voice dans l'application de bureau de la même manière que vous le feriez sous iOS ou Android : cliquez sur l'icône dans la barre de discussion. Une fois que vous aurez cliqué sur le bouton, une nouvelle vue s'ouvrira avec ce désormais tristement célèbre cercle bleu dégradé.
Vous pouvez continuer à parler à l’IA pendant que vous accomplissez d’autres tâches. Et même s'il ne peut pas voir ce que vous faites, il peut répondre aux descriptions de la tâche ou de vos performances. Ainsi, par exemple, si vous l'utilisez en jouant à Minecraft, vous pouvez décrire la scène et il peut proposer un type de bâtiment ou de bloc à utiliser.
Apporter Advanced Voice sur le bureau est la prochaine étape logique pour OpenAI et consolide davantage ChatGPT comme plus qu'un simple gadget, mais comme une plate-forme de productivité complète. Être capable de tenir une conversation avec une IA vous permet de réfléchir à des idées ou d'effectuer des tâches que vous ne pourriez peut-être pas accomplir seul.
À l'avenir, vous pourrez également partager votre écran avec Advanced Voice afin qu'il puisse regarder ce que vous faites. Et un jour, lorsque les agents IA décolleront, vous pourrez peut-être même leur faire prendre le contrôle de votre écran et vous guider tout au long d'un processus.
Qu’est-ce qui vient ensuite ?
Regarder dessus
Bien qu'Advanced Voice soit un outil incroyablement utile, ce qui est plus puissant est l'API en temps réel sous-jacente. Il s'agit du back-end d'Advanced Voice utilisé par les développeurs pour créer leurs propres versions ou les intégrer dans leurs propres outils.
Lors d'un récent briefing que j'ai eu avec l'équipe OpenAI, le responsable de la liaison avec les développeurs de l'entreprise, Romain Huet, a montré cette démonstration impressionnante du système solaire. Vous pouviez demander à la voix de se déplacer entre les planètes, et elle était capable de donner un aperçu de la nature de chacun des mondes que nous avons visités en temps réel et de répondre aux questions dans un style conversationnel.
Dans une autre démo, il a montré son utilisation comme agent de voyages virtuel pour vous aider non seulement à réserver un vol, mais aussi à trouver la meilleure offre. Vous pourriez lui faire part de vos besoins explicites, et il pourrait poser des questions ou donner suite à des commentaires en fonction de ce qui était disponible, plutôt que de l'approche arborescente logique que nous voyons actuellement dans les appels automatisés.
Toutes ces fonctionnalités vont commencer à être déployées, non seulement dans les applications d'OpenAI mais aussi dans les applications d'autres développeurs au cours des mois et des années à venir. Je pense que la voix va devenir la nouvelle façon dont nous interagissons tous avec nos ordinateurs.
Il ne me reste plus qu'à trouver un meilleur logiciel de dictée qui ne m'oblige pas à passer des heures à revenir sur tout ce que j'ai tapé avec ma voix pour corriger les erreurs flagrantes.