Un nouveau modèle d'intelligence artificielle open source, pouvant s'exécuter « sur l'appareil » et dont l'installation est gratuite, fonctionne aussi bien que ChatGPT sur certains tests clés.

Développé par la startup française Mistral AI, le modèle s'appelle Mixtral 8x7B et s'est avéré performant sur les critères scientifiques, mathématiques, de codage et de raisonnement.

Mistral AI déclare s'être engagé à ouvrir des modèles en les rendant disponibles via un lien torrent et en les mettant sur la plateforme d'IA open source Hugging Face. Il a également été mis à disposition dans des agrégateurs d'IA tiers comme Poe et mis à disposition pour une installation sur des appareils locaux.

Qu’est-ce que Mixtral et pourquoi est-ce important ?

Mistral AI est téléchargeable gratuitement

Mistral 8x7B est le deuxième modèle de Mistral AI, remplaçant le 7B qui en lui-même a bien performé lors des tests standards. La nouvelle IA est un « modèle mixte d’experts » qui utilise plusieurs niveaux de prise de décision pour améliorer les réponses et la précision.

En plus d'être disponible en téléchargement et en utilisation libre, il s'agit également d'un modèle à pondération ouverte, ce qui signifie qu'il peut être recyclé et utilisé dans d'autres formats. Les poids sont des éléments d’information qui représentent les connaissances acquises par l’IA lors des entraînements.

Cela fait partie d'une classe croissante de modèles d'IA open source qui comprend StableLM de Stable Diffusion, Llama 2 de Meta et BLOOM de Hugging Face.

Comment Mistral se compare

Il a été formé sur des données extraites du Web ouvert et constitue un modèle clairsemé permettant davantage de paramètres tout en contrôlant la taille et le nombre de paramètres par jeton. Bien qu'il s'agisse d'un modèle de 46,7 milliards de paramètres, il n'utilise que 12,9 milliards par jeton plutôt que le décompte complet.

Cette efficacité signifie qu’ils peuvent atteindre des capacités de niveau GPT sur une fraction de leur taille. Sur les benchmarks les plus courants, opposés à Llama avec 70 milliards de paramètres et GPT-3,5 avec 175 milliards, il surpasse les deux sur quatre d'entre eux et les égale sur d'autres.

D'autres tests ont montré qu'il fonctionne également bien en termes de précision, battant Llama 2 sur le benchmark TruthfulQA de 20 points de pourcentage. Mistral AI affirme qu'il est également moins biaisé que d'autres modèles, disponibles dans plusieurs langues, dont le français, l'espagnol et l'anglais.

Qu'est-ce que Mistral AI

Mistral AI devient rapidement un acteur majeur dans le domaine de l'IA générative, en signant des accords de partenariat avec Google et en publiant des modèles open source surpassant les principaux acteurs.

Cependant, l'entreprise n'existait pas il y a un an lorsque ChatGPT a été lancé pour la première fois, passant d'une idée sur papier à l'un des laboratoires d'IA à la croissance la plus rapide en moins d'un an.

La startup française a levé 105 millions d'euros (115 millions de dollars) lors de son premier tour de table il y a à peine sept mois, 500 millions d'euros (549 millions de dollars) le mois dernier et 365 millions d'euros supplémentaires (400 millions de dollars) la semaine dernière. Elle est désormais valorisée à 2 milliards d’euros (2,19 milliards de dollars), soit le double du seuil requis pour accéder au statut de licorne.

La croissance rapide de Mistral et d’autres fournisseurs de modèles ouverts comme StabilityAI et la plateforme ouverte Hugging Face montre l’importance croissante des modèles d’IA qui peuvent être exécutés localement, contrôlés indépendamment d’une grande entreprise et adaptés selon les besoins.