Meta a dévoilé V-Jepa 2, un morceau intelligent d'IA qui donne aux robots quelque chose qui approche du bon sens sur le monde physique.

J'ai vu beaucoup de percées de la robotique, mais celle-ci cherche à s'attaquer à ce problème fondamental que nous avons tous remarqué avec des robots – ils sont souvent remarquablement stupides à propos de la physique de base que même les tout-petits saisissent.

Le système V-Jepa 2, que Meta a préparé dans le cadre de leur poussée plus large dans l'intelligence avancée de la machine, donne essentiellement aux robots la capacité de comprendre leur environnement et de prédire ce qui pourrait arriver ensuite. C'est ce morceau de prédiction qui est la vraie percée ici.

Lorsque vous jetez vos clés sur la table, vous savez qu'ils y atterriront plutôt que de flotter jusqu'au plafond. Une telle compréhension de base du monde physique a été difficile à inculquer dans les machines.

«Nous réalisons cette intuition physique en observant le monde qui nous entoure et en développant un modèle interne de celui-ci, que nous pouvons utiliser pour prédire les résultats des actions hypothétiques», explique Meta.

«V-Jepa 2 aide les agents de l'IA à imiter cette intelligence, les rendant plus intelligents dans le monde physique. Les modèles que nous utilisons pour développer ce type d'intelligence dans les machines sont appelés modèles mondiaux, et ils permettent trois capacités essentielles: comprendre, prédire et planification.»

Meta a enseigné l'intuition physique V-Jepa 2 par, essentiellement, en le faisant regarder tout un tas de vidéos. Grâce à cette formation, il a repris les modèles sur la façon dont les gens gèrent les objets, la façon dont les choses se déplacent dans l'espace et comment les objets interagissent les uns avec les autres.

Lorsque l'équipe de Meta a branché le V-Jepa 2 dans leurs robots de laboratoire, les machines pourraient effectuer des tâches de base comme atteindre les choses, les ramasser et les placer ailleurs avec une nouvelle compréhension de la physique.

Ce qui est particulièrement intelligent, c'est que les robots peuvent gérer des objets et des environnements inconnus. La robotique traditionnelle a toujours eu du mal avec l'inattendu (c'est-à-dire un programme un robot pour ramasser les carrés rouges, et il tombe en morceaux lorsqu'il est présenté avec un triangle bleu.)

Robot utilisant Meta V-Jepa 2 AI pour choisir une approche la plus susceptible de réussir son objectif dans le monde physique.

Meta a publié trois nouvelles références aux côtés de V-Jepa 2 qui aideront les chercheurs à tester à quel point leurs propres systèmes d'IA comprennent et la raison du monde physique par vidéo. C'est une approche collaborative qui reconnaît qu'aucune entreprise ne résoudra ces seuls défis complexes.

Pour les robots dans le monde réel, ce type de compréhension pourrait tout transformer de l'automatisation des entrepôts aux robots d'assistance à domicile. Le robot d'entrepôt qui a actuellement besoin d'éléments précisément placés dans des emplacements prédéfinis pourrait bientôt gérer la réalité chaotique des salles de stock réelles. Votre futur robot domestique pourrait attraper de manière fiable une tasse sans l'envoyer s'écraser au sol.

Les implications de sécurité ne doivent pas non plus être négligées. Les robots qui peuvent anticiper les conséquences de leurs actions sont beaucoup moins susceptibles de provoquer des accidents. Personne ne veut un robot de livraison qui ne peut pas prédire que rouler dans un terrain de jeu bondé pourrait mal terminer.

Tout en accordant du crédit dû à Meta et à leur travail sur V-Jepa 2, nous sommes encore au début. Les démos actuelles se concentrent sur des tâches de manipulation relativement simples – nous ne voyons pas de robots effectuer une chirurgie cérébrale ou de fabriquer des toufflés parfaits – mais le potentiel futur est passionnant. Nous regardons le développement de machines qui ne suivent pas seulement des instructions rigides mais possèdent quelque chose qui approche de l'intuition physique.

Dans quelques années, nous pourrions avoir des robots qui ne semblent pas déconcertés par la physique de base du monde qui les entoure. Ne serait-ce pas quelque chose?

(Crédit d'image: Meta)