Les spéculations ont entouré la sortie et les capacités potentielles de GPT-5 depuis le jour de la sortie de GPT-4 en mars de l'année dernière. Avec très peu de commentaires d'OpenAI sur le sujet.

Pour une entreprise dont le nom est « ouvert », OpenAI est presque aussi discret qu'Apple en ce qui concerne les nouveaux produits, les laissant tomber sur X de nulle part lorsqu'ils estiment que le moment est venu.

Cependant, Business Insider rapporte que nous pourrions voir le modèle phare être lancé dès cet été, sur ChatGPT et qu'il sera « sensiblement différent » de GPT-4.

La base des rumeurs sur la sortie estivale semble provenir de sociétés tierces ayant un accès anticipé au nouveau modèle OpenAI. Ces entreprises clientes d'OpenAI font partie du pain quotidien de l'entreprise, générant des revenus importants pour couvrir les coûts croissants liés à l'exploitation de modèles toujours plus grands.

GPT-5 sortira-t-il cet été ?

Les rumeurs de sortie estivale vont à l'encontre de ce que Sam Altman, PDG d'OpenAI, a suggéré lors de son entretien avec Lex Fridman. Il a déclaré que même s'il y aurait de nouveaux modèles cette année, il ne s'agirait pas nécessairement de GPT-5.

« Nous allons sortir un modèle étonnant cette année, je ne sais pas comment nous l'appellerons », a-t-il déclaré. « Je pense qu'avant de parler d'un modèle de type GPT-5, nous avons beaucoup d'autres éléments importants à publier en premier. »

Cela pourrait inclure le modèle d'IA vidéo Sora, qui, selon Mira Murati, CTO d'OpenAI, sortirait avant la fin de cette année.

Je pense qu'avant de parler d'un modèle de type GPT-5, nous avons beaucoup d'autres éléments importants à publier en premier.

Altman a révélé pour la première fois que GPT-5 avait commencé sa formation en novembre de l'année dernière et que s'il n'était pas beaucoup plus grand que son prédécesseur, cela aurait du sens, cela pourrait prendre des mois de travail.

Le rapport de Business Insider suggère qu'ils sont allés au-delà de la formation et sont passés au « red teaming », surtout s'ils proposent des démonstrations à des sociétés tierces. Bien que cela suppose que nous parlons de GPT-5.

L'équipe rouge est l'endroit où le modèle est mis à l'extrême et testé pour les problèmes de sécurité. La prochaine étape après le red teaming consiste à affiner le modèle, à corriger les problèmes signalés lors des tests et à ajouter des garde-corps pour le rendre prêt à être publié publiquement.

Cette étape à elle seule pourrait prendre des mois, comme cela a été le cas avec GPT-4 et donc ce qui est suggéré comme version de GPT-5 cet été pourrait en fait être plutôt GPT-4.5. Après tout, un article de blog supprimé d'OpenAI faisant référence à GPT-4.5-Turbo a été divulgué à Bing plus tôt cette année.

Cela serait lié aux versions de la génération précédente, allant de GPT-3 à GPT-3.5 avant la sortie de GPT-4. Nous avons également vu GPT-3.5-Turbo puis GPT-4-Turbo, désormais disponible gratuitement dans Microsoft Copilot.

Que pouvons-nous attendre du GPT-5 ?

Altman a déjà déclaré que GPT-5 constituerait une grande amélioration par rapport à tous les modèles de génération précédente. Cela inclura des fonctionnalités vidéo – comme la capacité de comprendre le contenu des vidéos – et un raisonnement considérablement amélioré.

Au-delà des commentaires médiatisés lors des interviews, peu de détails spécifiques ont été révélés. Nous savons qu'il sera probablement plus grand et aura plus de paramètres que GPT-4, mais on ne sait pas dans quelle mesure.

Nous obtenons tout juste des détails sur la taille de son prédécesseur. Le PDG de Nvidia, Jensen Huang, a révélé lors de la GDC que GPT-4 avait 1,8 billion de paramètres et nécessitait 30 yottaflops de puissance de calcul pour s'entraîner – c'est comme avoir un milliard de PS5 fonctionnant en permanence pendant 93 000 ans.

Je suis ravi que ce soit plus intelligent. La situation s'améliore dans tous les domaines.

Cependant, ce que nous ne savons pas, c'est s'ils ont utilisé les nouvelles plates-formes GPU exaFLOP de Nvidia pour former GPT-5. Un cluster relativement petit de puces Blackwell dans un centre de données pourrait former un modèle de mille milliards de paramètres en quelques jours plutôt qu'en semaines ou en mois.

Altman a déclaré qu'il serait beaucoup plus intelligent que les modèles précédents. « Je suis ravi que ce soit plus intelligent », a déclaré Altman dans son entretien avec Fridman. « La situation s'améliore dans tous les domaines. »

Au début, il y avait des spéculations selon lesquelles GPT-5 serait la première indication d'une intelligence surhumaine, également connue sous le nom d'intelligence générale artificielle (AGI), mais il semble de plus en plus que même s'il s'agira d'un bond par rapport à GPT-4, ce ne sera pas le cas. c'est un grand pas en avant.