Le grand modèle de langage GPT-5 de nouvelle génération d'OpenAI aura de meilleures capacités de raisonnement, une précision améliorée et une prise en charge vidéo, a révélé le PDG Sam Altman.

Sur le podcast Unconfuse Me de Bill Gates, Altman a expliqué que le modèle de nouvelle génération serait entièrement multimodal avec prise en charge de la parole, de l'image, du code et de la vidéo.

Au cours de la conversation, il a également indiqué que de nombreux problèmes liés aux réponses peu fiables ou au modèle ne comprenant pas correctement les requêtes seraient résolus.

« Parlez, parlez. Images. Finalement, la vidéo », a déclaré Altman à propos de ce qui viendra avec les futures versions du modèle d'IA. « De toute évidence, les gens le veulent vraiment. Nous avons lancé des images et du son, et la réponse a été bien plus forte que prévu », a-t-il expliqué.

Qu’est-ce que GPT-5 ?

Nous ne savons pas encore grand-chose sur GPT-5 au-delà des allusions d'Altman et d'autres. Il devrait s'agir d'un véritable modèle multimodal, similaire au nouveau Gemini Ultra de Google.

OpenAI a commencé à entraîner GPT-5 l'année dernière, avec des indications d'Altman selon lesquelles il s'agirait d'une amélioration significative par rapport à GPT-4, notamment dans sa capacité à comprendre des requêtes complexes et le monde réel.

Altman a déclaré à Bill Gates : « Au moins pendant les 5 ou 10 prochaines années, nous serons sur une courbe d’amélioration abrupte, c’est le plus stupide que ces modèles auront jamais été. »

Sera-ce une superintelligence ?

Bon nombre des plus grands laboratoires d’intelligence artificielle, dont OpenAI, ont pour objectif final l’intelligence générale artificielle (AGI). Créer une forme de superintelligence plus intelligente que l’humanité et bien plus performante.

Il y a eu des suggestions au début selon lesquelles GPT-5 pourrait être une forme de superintelligence, mais les spéculations autour du modèle suggèrent maintenant qu'il s'agira d'une meilleure version du type d'IA que nous avons déjà dans GPT-4, Claude 2 d'Anthropic ou Gemini Ultra de Google. .

C’est-à-dire qu’il aura de bien meilleures capacités de raisonnement, et qu’il sera probablement non seulement plus performant que les humains dans de nombreuses évaluations académiques, mais qu’il aura également un degré de compréhension qui va au-delà du simple reflet de l’intelligence humaine.

Cela pourrait également être la prochaine étape sur la voie de l’AGI. Lors d'un discours prononcé vendredi lors de l'événement Y-Combinator W24, Altman aurait déclaré aux fondateurs et aux entrepreneurs présents dans la salle qu'ils devraient construire en pensant que l'AGI sera atteint « relativement bientôt ».

Qu’attendent les gens de GPT-5 ?

ChatGPT Voice est gratuit

L’un des plus gros problèmes de la génération actuelle de modèles d’IA est le fait qu’ils inventent des choses, également connues sous le nom d’hallucinations. Il s’agit en partie d’un problème de fiabilité qui, selon Altman, sera résolu dans GPT-5.

Il a déclaré à Gates : « Si vous posez la plupart des questions à GPT-4 10 000 fois, une de ces 10 000 est probablement plutôt bonne, mais il ne sait pas toujours laquelle, et vous aimeriez obtenir la meilleure réponse de 10 000 à chaque fois, et donc cette augmentation de la fiabilité sera importante.

L’autre amélioration significative résidera dans la capacité de personnaliser la façon dont l’IA répond, agit et résout les problèmes. Une partie de cela est devenue possible grâce à l'ajout des GPT, des chatbots personnalisés construits sur ChatGPT.

« Les gens veulent des choses très différentes du GPT-4 », a déclaré Altman, y compris différents styles de réponses et même différents ensembles d'hypothèses lors des réponses. « Nous rendrons tout cela possible, ainsi que la possibilité de lui faire utiliser vos propres données. »

Si vous posez la plupart des questions à GPT-4 10 000 fois, une de ces 10 000 est probablement plutôt bonne, mais il ne sait pas toujours laquelle, et vous aimeriez obtenir la meilleure réponse de 10 000 à chaque fois, et donc cette augmentation de la fiabilité sera importante »

Microsoft et Google ont déjà pris des mesures pour intégrer les modèles d'IA aux données personnelles grâce à l'intégration de Copilot avec 365 et au lien de Bard avec Workspace.

Altman dit que cela pourrait aller plus loin à l’avenir. « La possibilité de connaître votre personne, votre courrier électronique, votre calendrier, la manière dont vous aimez les rendez-vous pris, la connexion à d'autres sources de données externes, tout cela. Ce seront quelques-uns des domaines d’amélioration les plus importants.

J'utilise tout le temps des modèles d'IA pour mon travail, je joue avec différents outils et j'essaie de comprendre comment ils fonctionnent et ce qu'ils peuvent faire. Donner à l’IA l’accès à ma vie, à mes données et à ma personnalité semble créer des ennuis – et l’émergence de Skynet.