Utiliser l’IA pour transcrire la parole n’a rien de nouveau. Des applications telles que Otter.ai se sont avérées être un véritable changeur de jeu à cet égard, permettant de transformer l'audio contenant de la parole en un texte précis et lisible en un rien de temps.

Dans de nombreux cas, cependant, vous devez payer pour de tels services, c'est pourquoi la dernière offre de Gemini s'avère attrayante. Téléchargez un fichier audio, et tant qu'il ne dépasse pas 10 minutes, Gemini l'analysera et le transcrira rapidement pour vous, gratuitement.

Vous pouvez télécharger jusqu'à 10 fichiers audio à la fois, à condition que leur durée combinée ne dépasse pas 10 minutes. Gemini peut également être utilisé pour nettoyer les transcriptions, résumer les points clés et trouver des informations spécifiques dans un fichier audio.

1. Ajouter un fichier audio


Tout d'abord, assurez-vous que vous utilisez la dernière version de Gemini si vous utilisez la version de l'application ou aller au Google Gémeaux site web.

Ensuite, lorsque vous êtes prêt à transcrire un fichier, sélectionnez + et soit choisissez Télécharger des fichiers dans la version du navigateur ou choisissez Fichiers dans la version de l'application.

2. Sélectionnez votre fichier


Vous pourrez désormais parcourir votre appareil pour trouver le fichier audio que vous souhaitez transcrire. Gemini peut fonctionner avec les formats MP3, AAC et WAV.

Sélectionnez le fichier audio et il sera chargé dans Gemini, prêt à être utilisé.

3. Tapez une invite


Saisissez une invite telle que « transcrire ce discours » et les Gémeaux se mettront au travail. S'il génère une erreur, il suffit entrez « réessayer ».

J'ai d'abord reçu un message d'erreur incorrect indiquant que le fichier audio était vide, même si ce n'était pas le cas. Heureusement, une deuxième tentative a immédiatement fonctionné.

4. Nettoyer la transcription


Gemini se chargera de transcrire le fichier pour vous. Cela se fera très rapidement, mais c'est essentiellement mot pour mot, donc il y a beaucoup de marqueurs de discours – pensez « euh » et « ah », mais c'est normal.

Vous pouvez corriger cela en demandant quelque chose comme « Pouvez-vous le nettoyer ? », ou « Pouvez-vous supprimer les ums« , et il produira une transcription nettoyée avec les mots de remplissage supprimés.