Meta Llama 3.1 est l'une des versions d'IA les plus importantes de l'année. Voici comment l'essayer

L'intelligence artificielle a déjà connu une année importante avec la sortie de GPT-4o d'OpenAI, Claude 3.5 Sonnet d'Anthropic et la famille Gemini 1.5 de Google, mais la sortie par Meta d'un Llama 3.1 massif de 405 milliards de paramètres est en lice pour la couronne de « la plus importante ».

Meta a publié hier la version 3.1 de sa famille de modèles d'IA open source Llama et a rapidement acquis la réputation d'être l'un des modèles les plus puissants et les plus utiles disponibles, battant l'IA propriétaire d'OpenAI et d'Anthropic sur de nombreux benchmarks majeurs.

Dans l'ensemble, les performances sont à peu près équivalentes à celles de GPT-4o ou de Sonnet, légèrement inférieures sur certains points et légèrement supérieures sur d'autres. Pourtant, ce ne sont pas les performances qui le rendent important : c'est le fait qu'il soit open source, largement disponible et qu'il puisse même être téléchargé et utilisé sur vos propres machines.

Ce niveau d'accès et de contrôle sur un modèle d'IA de pointe est révolutionnaire car il conduira à de nouvelles recherches, de nouveaux types de modèles et des avancées dans des domaines qui pourraient ne pas valoir la peine d'investir le coût par jeton de l'utilisation de GPT-4o ou de Claude Sonnet 3.5.

Si vous ne disposez pas de votre propre centre de données, les modèles plus petits peuvent fonctionner sur un bon ordinateur portable de jeu ou il existe une multitude de plates-formes et de services cloud offrant un accès, notamment Groq, Perplexity et si vous êtes aux États-Unis, il est disponible sur WhatsApp et le chatbot Meta.ai.

Pourquoi Llama 3.1 405b est-il si important ?

La formation d'un modèle de langage volumineux est extrêmement coûteuse. Récemment, l'accent a été mis sur l'efficacité plutôt que sur l'évolutivité, et même OpenAI a publié un modèle plus petit dans GPT-4o mini.

Cependant, aussi bons que soient les modèles plus petits, la taille compte lorsqu'il s'agit d'intelligence de niveau frontière et avec Llama 3.1, 405b Meta a trouvé un compromis et a réussi à intégrer un modèle de qualité de mille milliards de paramètres dans la moitié de la taille.

La nature open source de Llama 3.1 405b représente une avancée significative dans la démocratisation de l'accès à la technologie de l'IA »

Il s'agit du premier modèle de pointe à être rendu disponible en open source, et Meta est allé plus loin en permettant aux entreprises, organisations ou particuliers d'utiliser les données générées dans 405b pour affiner ou même former complètement leurs propres modèles.

Meta ne se contente pas de publier la famille de modèles, mais également un écosystème complet avec des exemples d'applications, des mesures de protection pour la modération et des garde-fous, et a proposé une nouvelle norme d'interface API qui facilitera la création d'applications utilisant l'IA.

En plus d'être open source, d'offrir des fonctionnalités avancées et un écosystème complet avec des modèles plus petits et des fonctionnalités personnalisées, Llama 3.1 405b semble exceller dans la traduction multilingue, les connaissances générales et les mathématiques. Il est également excellent en termes de personnalisation pour des besoins spécifiques.

Victor Botev, directeur technique de la société de recherche en IA Iris.ai, a décrit Llama 3.1 405b comme une « avancée significative dans la démocratisation de l'accès à la technologie de l'IA ». En effet, le fait d'être ouvert et accessible permet aux chercheurs et aux développeurs de « s'appuyer plus facilement sur une IA langagière de pointe sans les barrières des API propriétaires ou des frais de licence coûteux ».

Où puis-je essayer Llama 3.1 405b ?

À partir d'aujourd'hui, l'open source ouvre la voie. Présentation de Llama 3.1 : nos modèles les plus performants à ce jour. Aujourd'hui, nous publions une collection de nouveaux modèles Llama 3.1, notamment notre tant attendu 405B. Ces modèles offrent des capacités de raisonnement améliorées, un contexte de jeton plus large de 128 000 $… pic.twitter.com/1iKpBJuReD23 juillet 2024

Llama 3.1 405b est peut-être déjà l'un des modèles d'IA les plus largement disponibles, bien que la demande soit si élevée que même des plateformes normalement sans faille comme Groq sont aux prises avec une surcharge.

1. Meta.ai/WhatsApp

Le meilleur endroit pour l'essayer est sur le chatbot meta.ai de Meta ou sur la plateforme de messagerie WhatsApp. Ces deux outils offrent un moyen « comme prévu » de visualiser et d'utiliser le modèle et sur Meta.ai, il permet d'accéder à la génération d'images et à d'autres fonctionnalités.

L’inconvénient de cette option est qu’elle n’est disponible qu’aux États-Unis et que Meta a fait du bon travail en bloquant les VPN, car elle nécessite également un compte Facebook ou Instagram.

2. Moteur d'inférence Groq

Je vante depuis longtemps le génie de Groq, la start-up spécialisée dans l'IA qui conçoit des puces conçues pour exécuter des modèles d'IA très rapidement. Elle a fourni un accès facile à tous les modèles open source, y compris les versions précédentes de la famille Lllama, et elle dispose désormais des trois modèles Llama 3.1.

Il a accès au 405b mais la demande était si forte qu'elle a été limitée et peut donc ne pas apparaître si vous le visitez. Cela inclut via le chatbot et via GroqCloud – mais c'est un excellent moyen d'essayer les modèles 70b et 8b qui ont également reçu une mise à niveau dans Llama 3.1.

3. Recherche de perplexité

Perplexity est un outil formidable pour effectuer des recherches sur le Web, qui utilise une gamme de modèles d'IA personnalisés et publics pour améliorer les résultats renvoyés par les robots d'exploration Web traditionnels. Il peut également générer des pages personnalisées proposant des guides de type Wikipédia sur un sujet.

L'un des modèles les plus récents disponibles avec Perplexity est Llama 3.1 405b, mais il y a un hic : il n'est disponible que si vous avez un plan « pro » qui coûte 20 $ par mois, bien que ce soit un bon choix si vous cherchez un moyen de rechercher sur le Web et de travailler avec une gamme de modèles d'IA.

4. Discussion en face à face avec câlins

HuggingChat est une sorte de joyau caché dans le domaine des chatbots IA, offrant un accès à une large gamme de modèles, dont certains ne sont disponibles nulle part ailleurs, et à des outils tels que la recherche sur le Web et la création d'images. Vous avez besoin d'un compte HuggingFace, mais il est facile à configurer et à démarrer.

Son utilisation est entièrement gratuite et une fois connecté, accédez simplement aux paramètres et sélectionnez Llama 3.1 405b. L'inconvénient de cette plateforme est qu'elle nécessite un certain temps d'apprentissage et qu'elle n'hésite pas à utiliser les noms et descripteurs de modèles complets. Elle n'est pas adaptée aux débutants.

5. Marché de discussion Poe

Poe, la place de marché de chatbots soutenue par Quora, fonctionne un peu comme HuggingChat dans le sens où elle vous donne accès à une gamme de modèles et vous permet de personnaliser la façon dont ils interagissent avec vous, mais avec une approche plus conviviale et axée sur le consommateur.

Contrairement à HuggingChat qui semble relativement ouvert et largement gratuit, Poe facture des « points de calcul » par message envoyé. Vous obtenez un montant relativement généreux par jour gratuitement, mais 405b est un modèle coûteux, coûtant 485 points de calcul par message. Vous n'en obtiendrez donc qu'une demi-douzaine environ sans payer 17 $ par mois pour un compte premium.

Existe-t-il d’autres alternatives ?

Si aucune de ces solutions ne fonctionne, que vous souhaitez davantage de contrôle sur la manière dont vous prévoyez d'utiliser Llama 3.1 405b et que vous ne disposez pas de votre propre centre de données, il vaut la peine de se tourner vers l'une des nombreuses plateformes de cloud computing et pas seulement vers AWS d'Amazon, Google Cloud ou Microsoft Azure ; bien qu'ils aient tous accès au nouveau modèle.

Snowflake, Cloudflare, DataBricks Nvidia AI Foundry et IBM Cloud ne sont que quelques-uns des endroits où vous pouvez créer un compte développeur et accéder au modèle open source.