Dans un geste à la fois effrayant et impressionnant, une équipe de chercheurs a connecté un robot humanoïde à GPT-4, le modèle d'intelligence artificielle qui alimente ChatGPT.

Au cours de l'année qui a suivi le lancement de ChatGPT par OpenAI, la technologie sous-jacente a été utilisée pour tout générer, des blagues ringardes aux romans. Il a été mis à niveau pour comprendre la vidéo, l'audio, les images et maintenant le mouvement.

Alter3 est un robot humanoïde construit par une équipe de l'Université de Tokyo. Avec l'aide de GPT-4, il peut désormais adopter une gamme de poses, notamment une position de selfie ou faire semblant d'être un fantôme, et ce, sans que ces poses aient besoin d'être programmées au préalable dans sa base de données.

Pourquoi s’agit-il d’une évolution importante ?

Auparavant, le contrôle des robots de bas niveau, tel que le mouvement, ne relevait pas du champ d'application des grands modèles de langage, car il dépendait du matériel et n'était pas couvert par les données de formation.

Pour surmonter ce problème, l’équipe japonaise a trouvé un moyen de traduire l’expression du mouvement humain en code que l’androïde pourrait comprendre.

Cela a permis à Alter3 de générer un mouvement spontané. Il ne portera pas vos sacs ni ne participera à une course de sitôt car ses mouvements sont limités au haut du corps. Son corps inférieur est fixé à un support.

Comment fonctionne Alter3 ?

Le robot peut créer une gamme de mouvements à la volée

Cela signifie que le robot peut générer des séquences d'actions au fil du temps sans que les développeurs aient à programmer pour chaque partie du corps. Il peut apprendre à bouger, un peu comme le ferait un tout-petit lorsqu’il passe pour la première fois de traîner, à ramper et à marcher.

Les utilisateurs peuvent également ajuster la pose ou aider l’androïde à comprendre la différence entre une touche et une touche infinie. Une partie de moi se demande si les chercheurs voulaient simplement un moyen de tester de nouvelles émoticônes Fortnite en dehors du jeu.

Un humain parlant à Alter3 peut dire quelque chose comme « prenez un selfie avec votre iPhone » et le robot exécutera une série d'appels au GPT-4 d'OpenAI, notamment en demandant à l'IA ce qu'implique la prise d'un selfie. GPT-4 transformera ensuite cela en code Python que le robot pourra comprendre et utiliser pour effectuer les mouvements nécessaires.

Que se passe-t-il ensuite ?

Alter3 peut répondre aux commandes humaines

L'équipe derrière Alter3 et le nouveau projet de découverte de texte en mouvement basé sur GPT-4 prévoit de rendre ses découvertes disponibles pour une utilisation dans d'autres robots humanoïdes. Selon eux, il s’agit d’une avancée significative dans le développement des robots.

« Remarquablement, Alter3 peut imiter des fantômes, des animaux et des expressions d'émotions semblables à celles des humains. Sa réponse au contenu conversationnel à travers des expressions faciales et des gestes représente une avancée significative dans la robotique humanoïde, facilement adaptable à d'autres androïdes avec des modifications minimes », ont-ils écrit dans le document de recherche. « 

Même si un robot faisant un dab ou prétendant être un fantôme n'est peut-être pas très inquiétant pour l'avenir de l'humanité aujourd'hui, il n'en faut qu'un pour devenir voyou et nous avons un Terminator entre nos mains.