ElevenLabs est la plate-forme sonore d'intelligence artificielle générative la plus importante et l'une des meilleures disponibles, créant des voix synthétiques et des voix clonées à partir de minuscules échantillons.

Il s'oriente désormais vers les effets sonores, permettant aux créateurs de générer une gamme de bruits à partir d'une simple invite qui pourraient être utilisés dans des présentations, des films ou des podcasts.

J'ai essayé l'outil et il peut créer des effets sonores complexes et multicouches à partir d'une invite relativement simple comprenant des bruits d'animaux, d'atmosphère et techniques.

Il n'est pas encore parfait, il a du mal avec certains bruits et ne parvient pas du tout à obtenir le son d'un moderne du milieu des années 90, lui donnant trop de tonalité musicale et manquant les clics durs, mais dans l'ensemble, il est impressionnant étant donné que les sons sont générés par l'IA. et non enregistré.

Comment fonctionnent les effets sonores d'ElevenLabs ?

Comme tout outil d’IA générative, le modèle d’effets sonores d’ElevenLabs a été formé sur une grande quantité de données, notamment des sons enregistrés d’objets du monde réel.

Chaque objet, animal ou scène utilisé dans l'ensemble de données d'entraînement aurait été bien étiqueté et décrit, permettant à l'IA d'apprendre à reproduire le bruit.

Pour utiliser l'outil, vous obtenez une zone de texte standard qui sera familière à toute personne ayant utilisé plus ou moins un outil d'IA générative, ainsi qu'un bouton pour générer.

Le générateur d'effets sonores ElevenLabs vous propose cinq sons à partir de la même invite et contrairement à l'image et à la vidéo de l'IA, chaque version peut varier considérablement les unes des autres.

Dans quelle mesure les effets sonores d'ElevenLabs fonctionnent-ils ?

Il est particulièrement doué pour les sons météorologiques et ceux du monde naturel, y compris les animaux, mais il semble avoir davantage de difficultés avec les sons électroniques.

Je lui ai donné sept invites pour voir dans quelle mesure il gérait une gamme de sons. Cela comprenait un feu de camp crépitant, des vagues océaniques, un orage, des carillons éoliens et un sifflet de train à l’ancienne.

Dans l'ensemble, il a bien fonctionné sur la plupart des invites, bien que sur les cinq versions qu'il génère en réponse à une invite, seules une ou deux étaient généralement bonnes et duraient plus de quelques secondes.

L'outil est également conçu de telle manière que vous pouvez doubler les sons. Pour une vidéo de vagues s'écrasant sur la plage, j'ai découvert qu'il me fallait deux sons, un de vagues et un de mouettes, car aucun des deux ne capturait la tapisserie complète présentée dans la vidéo.

Le son est un domaine de l'IA en croissance rapide, des outils musicaux à la parole synthétique et maintenant aux effets sonores et aux bruits personnalisés. Il donne une nouvelle dimension à la vidéo générée, une nouvelle forme de narration pour les diapositives et rend la création de podcasts plus immersive.