Meta lancera son modèle d'intelligence artificielle de nouvelle génération, Llama 3, en juillet. Ce sera une alternative entièrement open source à la domination du GPT-4 d'OpenAI et du Gemini de Google.

Rapportée pour la première fois par The Information, la nouvelle version de la populaire famille de modèles Llama est en formation depuis l'année dernière et fait partie des efforts de Meta pour créer une IA superintelligente.

Selon le rapport, Llama 3 apportera de meilleures réponses aux questions sur des sujets controversés comme la race ou l'égalité que les systèmes fermés construits par OpenAI et Google ou que Llama 2, la version du modèle publiée par Meta l'année dernière.

On ne sait pas encore clairement jusqu'où Meta ira, mais selon le rapport, les hauts dirigeants estiment que les garde-fous imposés à la version précédente la rendaient « trop ​​sûre ».

Qu'est-ce qui rendra Llama 3 différent ?

Llama 3 est un grand modèle de langage, un peu comme Gemini, Mistral Large ou GPT-4. Ce que nous ne savons pas exactement, ce sont les capacités du nouveau modèle ni sa taille.

Ce qui est probable par rapport aux versions précédentes de Llama, c'est que Meta offrira une gamme de tailles et permettra aux développeurs tiers de se recycler, d'affiner et de construire facilement sur le modèle de base.

Cependant, il y aura toujours des garde-corps de base. Non seulement en raison de l'impact potentiel sur la réputation de Meta si elle devenait complètement malveillante, mais aussi en raison de la pression croissante des régulateurs et des gouvernements nationaux sur la sécurité de l'IA – y compris la nouvelle loi sur l'IA de l'Union européenne.

Selon l'article d'information, les chercheurs de Meta travaillent sur des moyens de « desserrer » Llama 3 par rapport aux générations précédentes tout en maintenant la sécurité globale.

Cela va à l'encontre des efforts déployés par d'autres sociétés pour ajouter des garde-fous stricts sur des sujets controversés, notamment Google qui a été contraint de désactiver la capacité de Gemini à créer des images de personnes après avoir surinterprété les instructions relatives à la diversité.

Meta cherche apparemment à au moins fournir un contexte autour de la requête plutôt que de l'ignorer ou de reprocher à l'utilisateur d'avoir posé la question.

Pourquoi Lama est-il si important ?

Llama 2, le grand modèle de langage de génération précédente de Meta, est utilisé dans les propres produits de l'entreprise pour alimenter les outils d'IA conversationnelle. Ainsi que sur une gamme d'autres plateformes, y compris sur GroqChat car elle est open source.

Être un modèle ouvert signifie également qu'il peut être exécuté localement sur un ordinateur portable ou même un téléphone. Il existe des outils comme Ollama ou Pinokio qui rendent cela relativement facile à réaliser et vous pouvez interagir avec eux, en s'exécutant entièrement sur votre machine, comme vous le feriez avec ChatGPT, mais hors ligne.

Pour Meta, Llama est crucial. Cela fait partie des ambitions du géant des médias sociaux de rendre l'IA plus utile, notamment en développant l'assistant Meta AI et en créant des modèles superintelligents capables de comprendre le monde réel et la manière dont nous interagissons avec lui.

Il devrait être beaucoup plus grand que Llama 2 avec plus de 100 milliards de paramètres, mais il n'est pas encore clair s'il sera multimodal et donc capable de comprendre et d'analyser des images et des vidéos ainsi que du texte – ce qui est déjà possible avec Gemini. et GPT-4.

Comment Meta aborde-t-il le problème du refus ?

Méta Quête Pro

Meta prévoit d'embaucher quelqu'un pour superviser le ton et la formation à la sécurité de Llama avant sa libération. Il ne s'agira pas de l'empêcher complètement de répondre, mais plutôt de l'aider à devenir plus nuancé dans ses réponses et de garantir qu'il fasse plus que dire « Je ne peux pas vous aider avec cette requête ».

Il ne s’agit pas seulement de résoudre les sujets les plus controversés, mais aussi d’autres sujets de conversation. J'ai demandé à Llama 2 via GroqChat comment je pourrais éviter d'aller à l'école et il a refusé de répondre, disant qu'il ne me dirait pas de mentir ou de simuler une maladie.

Le calendrier de sortie pourrait encore changer, mais juillet semble logique au vu des calendriers précédents. On attend également une nouvelle version du GPT-4 d'OpenAI cette année et éventuellement l'arrivée du GPT-5.

Google travaille également sur de nouvelles versions de Gemini et a déjà dévoilé Gemini Pro 1.5 avec une immense fenêtre contextuelle. Cela va donc être une grande année pour l’IA – encore une fois !