Eleven Labs, le géant de l'intelligence artificielle, a propulsé les générations futures de synthèse vocale à un niveau supérieur avec son application AI Reader. L'entreprise est leader dans ce domaine depuis des années et a considérablement évolué depuis qu'elle a lancé la synthèse vocale. Et maintenant, sa dernière fonctionnalité, Iconic Voices, est tout simplement révolutionnaire.

L'application Reader est devenue un outil de synthèse vocale polyvalent et puissant, disponible en anglais pour les personnes résidant aux États-Unis, au Canada et au Royaume-Uni. Si vous êtes un utilisateur d'iPhone, vous pouvez installer l'application immédiatement. Pour les utilisateurs d'Android, vous devrez vous inscrire sur la liste d'attente pour un accès anticipé.

Ses fonctionnalités avancées et ses voix naturelles en font un excellent choix pour les personnes malvoyantes ou ayant des difficultés de lecture, ainsi que pour tous ceux qui préfèrent écouter un texte plutôt que le lire. Entrons dans le vif du sujet.

1. Téléchargez l'application

Accéder à l'App Storetéléchargez ElevenLabs Reader et Cliquez sur Créer un compte. Vous pouvez créer manuellement un compte ou continuer avec votre compte Google ou Apple.

2. Naviguer sur la page d'accueil

Une fois connecté, vous serez directement redirigé vers la page d'accueil. Cliquez sur le bouton plus en haut à droite pour ajouter du contenu.

3. Saisie de texte

L'application Reader vous permet d'ajouter du contenu de trois manières. Sélectionnez Écrire du texte pour saisir directement du textesoit en le tapant, soit en le collant. Pour convertir le contenu d'une page Web, Choisissez Coller le lien pour saisir l'URL. Toi peut également télécharger un fichier par en cliquant sur Importer le fichier.

4. Bibliothèque de voix

En termes de voix disponibles, la bibliothèque est très complète. Pour y accéder, Cliquez sur le bouton Voix.

Cette section présente toute une gamme d'âges, de dialectes et d'humeurs. Les voix sont classées par leur ton de voix, comme « agréable », et par ce à quoi la voix est la mieux adaptée, comme « Médias sociaux ».

Et, bien sûr, les utilisateurs peuvent désormais entendre leur texte lu par les légendes oscarisées Sir Laurence Olivier, James Dean, Burt Reynolds et le Judy Garland.

Ce qu'il peut faire

Bienvenue à Ozvale

Pour mettre en valeur les capacités impressionnantes de l'application ElevenLabs Reader, je voulais créer un podcast fictif Inspiré par l'un de mes podcasts préférés, Welcome to Nightvale. Cette série plonge dans le paysage surréaliste d'Ozvale, où chaque brique de la route jaune mène à un nouveau mystère.

Chaque épisode réimagine des événements clés avec des rebondissements inattendus, comme par exemple : que se passerait-il si le Conseil Munchkin gouvernait d'une main de fer, ou si la quête de sagesse de l'Épouvantail prenait une tournure sombre. j'ai fourni ChatGPT 4 avec l'inviteet cela m'a donné un script partiel avec lequel travailler.

Dorothy Gale, en train de signer

D'abord, sélectionnez la voix emblématique en cliquant sur l'acteursuivi de en cliquant sur le bouton plus. Cela ajoutera automatiquement la voix à votre bibliothèque.

J'ai pu convertir le script en un son effrayant et réaliste, donnant vie à Dorothy avec un réalisme époustouflant. La voix générée par l'IA a capturé de manière impressionnante les tons et les nuances distincts de Judy Garland, donnant au podcast l'impression d'être un véritable drame radiophonique de l'âge d'or d'Hollywood.

Les résultats…

Application de lecture ElevenLabs Monologue de Judy Garland – YouTube
Application de lecture ElevenLabs Monologue de Judy Garland - YouTube

Surveiller

La complexité de la voix m'a laissé complètement stupéfait. Des pauses et des inflexions magistralement exécutées ont donné un sens du rythme et du drame, donnant vie au récit. Ce qui m'a le plus frappé, c'est l'utilisation du souffle, qui imite la cadence naturelle d'un conteur chevronné avec une précision déconcertante.

Chaque mot semblait soigneusement choisi et prononcé avec une intention délibérée. La capacité de l'IA à imiter des nuances aussi subtiles était vraiment impressionnante. Le rythme de la voix coulait naturellement, alternant entre des phrases descriptives plus longues et des phrases plus courtes. Cette variation ajoutait de la profondeur à la narration, me gardant captivé tout au long du récit.

J'attends avec impatience les prochaines évolutions d'ElevenLabs. Alors que l'IA continue de trouver sa voix, l'avenir de la communication en dit long – et cela semble remarquablement humain.