Explorez le Speech-to-Text avec l'IA et ses Avantages
Découvrez comment améliorer la transcription vocale en français grâce à l'intelligence artificielle et explorez différentes options pour l'usage personnel et professionnel.
File
SimpleGratuit - Basculez dans le monde secret de la transcription audio avec Whisper Web
Added on 01/27/2025
Speakers
add Add new speaker

Speaker 1: Bonjour, bonjour à tous. Bienvenue, c'est Gaël dans Simple et Gratuit. Aujourd'hui, on va parler tout simplement d'intelligence artificielle, mais surtout de speech to text. Un truc qui peut sembler assez bizarre, mais rassurez-vous, ça existe depuis bien longtemps. Il faut dire que l'IA est venue à son secours pour lui donner un petit coup de jeûne et ça, ça fait du bien. Allez, on va s'intéresser dès maintenant à cette merveilleuse technologie qui nous permet tout simplement de transcrire par écrit ce qu'on entend à l'oral et ce, en français ou dans n'importe quelle langue. Et ça, c'est quand même vachement cool. Oui, parce qu'avant l'IA, il faut quand même se dire un truc, c'est que le speech to text, ça marchait essentiellement dans des langues qui étaient, allez, on va dire choisies. L'anglais, bien sûr, l'allemand, l'espagnol, de temps en temps le français, mais en français, on n'était pas terrible, terrible. Dès ceci dit, grâce à l'IA, c'est vrai que comme l'IA parle français, souvent, c'est plus facile quand même. Alors, nous allons aller sur un site Internet. Mais avant, je voulais simplement vous rappeler que le speech to text, par exemple, moi, je m'en servais sur mon premier smartphone qui n'était pas encore un smartphone à l'époque, puisque le mot smartphone a été surtout inventé grâce à Apple et son iPhone. Mais bon, avant la sortie de l'iPhone en 2007, eh bien, il y avait déjà des Windows Phone. Enfin, ça ne s'appelait pas comme ça à l'époque. C'était des PPA ou des PIDA. Je ne sais plus comment ça s'appelait exactement. Moi, j'en avais un et donc, c'était génial parce qu'on pouvait déjà surfer sur Internet. Il y avait des tas de programmes. On pouvait même avoir un Internet Explorer. On pouvait même vraiment tout comme un petit ordinateur, mais avec un écran qui faisait 4,5 pouces à l'époque. C'était minuscule. Voilà. Mais moi, j'avais ça déjà en 2005, 2006 et j'adorais ça. Et puis, c'est vrai qu'après, les smartphones sont arrivés, les écrans ont grandi et puis on a abandonné ce genre de technologie. Et c'est dommage, d'ailleurs. En tout cas, le speech to text, ça existe depuis très longtemps. Et comme je le disais à l'époque, en français, c'était pas terrible, mais ça permettait de parler et d'écrire ses SMS. Si on n'avait pas d'accent qu'on articulait bien, ça fonctionnait plutôt bien. En tout cas, maintenant, grâce à l'IA, ça reconnaît quand même pas mal les accents, la façon de parler des gens et ça, c'est plutôt cool. Allez, on va sur Internet. On tape cette adresse que vous retrouvez dans la description. Pendant que vous êtes dans la description, pensez à liker cette vidéo. Pensez à vous abonner et pensez évidemment à la partager à tous les gens que vous connaissez. Une fois que c'est là, eh bien, vous voyez qu'on est donc sur un site Internet qui appartient à Huguenface.co. Si vous ne connaissez pas Huguenface.co, en gros, dessus, vous avez accès à quasiment toutes les intelligences artificielles. Ça vous permet de les tester et ce gratuitement, bien évidemment. Vous avez aussi une version premium qui vous coûte, je crois, 9 dollars par mois. Mais franchement, ça vaut le coup par rapport à un tchat GPT qu'on va payer 20 dollars par mois ou bien l'équivalent chez Gemini qui coûte pour la version Pro aux entours de 20 dollars également. Ça finit par faire cher si on doit utiliser plusieurs intelligences artificielles. Avec celle-là, vous avez quand même accès à pas mal de choses, des large languages comme j'en ai cité juste avant tchat GPT, Gemini, etc. ou Copilot. Et puis, vous avez des moyennes languages comme ici, par exemple, ou des small languages. Alors, les small languages, c'est génial, ça vous permet d'avoir une intelligence artificielle directement sur votre ordinateur. Sauf qu'il faut un ordinateur assez puissant quand même parce que ça pompe en termes de ressources. Mais sinon, ça marche très bien et c'est vrai que ça permet à plein d'entreprises aujourd'hui d'avoir une IA qui gère leurs données et tout ça, mais interne à l'entreprise, ce qui fait qu'il y a peu de risques finalement que les données s'envolent, puisqu'effectivement, ils n'utilisent pas tchat GPT, Bard, etc. qui eux, par contre, sont à Google, appartiennent à des serveurs qui sont chez Microsoft, etc. D'accord ? Donc ici, quel est le principe ? Vous le voyez, vous pouvez ici télécharger les fichiers pour l'avoir directement sur votre disque dur. D'accord ? Mais après, il faut savoir le faire fonctionner, comme pour tout, évidemment. Et sinon, vous pouvez utiliser l'interface web avec le lien que je vous ai mis dans l'inscription, le lien qu'on a ici. OK ? Une fois que c'est fait, on a trois possibilités. Celui-ci, par l'adresse Internet, si vous avez un son par une adresse Internet, par exemple une conférence ou quoi que ce soit de 4 ou 5 heures, vous avez l'audio, paf . Vous envoyez le lien ici et ça va travailler tout seul. Ça, c'est génial. Vous avez ici la possibilité d'utiliser un fichier. Ça peut être un fichier enregistré par ordinateur, une conférence que vous auriez eu, une visio, ou pourquoi pas, vous qui auriez enregistré, je ne sais pas, votre téléphone portable posé à côté d'une enceinte pendant une conférence qui a duré plusieurs heures également, il n'y a pas de souci. Vous pouvez mettre votre fichier ici ou bien record ici et vous pouvez le faire en utilisant votre micro et votre voix directement. Donc ça, c'est plutôt cool. C'est à dire qu'il y a plusieurs façons de travailler et ça veut dire qu'ils traitent un peu différentes manières de faire et on imagine qu'ils nettoient un peu les sons pour pouvoir mieux comprendre les choses. Donc ça, c'est plutôt bien et ça permet vraiment de travailler d'une manière confortable, on va dire. Donc vous pouvez, par exemple, si vous avez effectivement une conférence de 5, 6, 7 heures en anglais, par exemple, avoir toute la traduction en français en version texte, ce logiciel le fait. Donc ça, c'est plutôt cool. Voilà, vous pouvez aussi faire l'inverse, par exemple, avoir une conférence en français et la traduire en texte en anglais. Une fois que vous avez 8 heures de transcription, vous pouvez demander à ChatGPT ou n'importe quelle intelligence artificielle de traiter le texte pour vous faire un condensé en quelques lignes avec les points importants sur lignée, etc. Et ça, il le fait très très bien. Du coup, c'est vrai qu'en multipliant les intelligences artificielles, on va gagner énormément de temps et ça, c'est super cool. Alors nous, on va s'intéresser maintenant essentiellement à l'enregistrement audio. Comme ça, je peux vous faire un live, c'est beaucoup plus pratique. Ok, donc on va simplement cliquer sur record ici, record, et on va pouvoir après accepter le micro parce que c'est sécurisé quand même. Et puis après, on va pouvoir enregistrer une phrase. Je ne sais pas encore ce qu'on va enregistrer, mais on verra bien. On y va, on fait un test ensemble et vous allez voir comment ça marche. Il y a des petits réglages, des petits paramétrages à faire après. Je clique ici, il me demande tout de suite de start recording, d'accord, c'est ce que je veux faire, ou bien de close, donc d'arrêter. Ok, c'est en anglais par contre le site, mais ne vous inquiétez pas, pour tout le reste, vous pouvez bien sûr parler français, ça marche. Donc ici, je vais cliquer sur start et vous voyez que ici, il me demande une interface, tout simplement de savoir ce que je fais avec le micro. Est-ce que ma décision va être pour jusqu'à ce que je ferme ce site, c'est-à-dire que si je ferme ici et que je réouvre un onglet, il va me le redemander, d'accord, ou pas. Ça dépend ce que je mets pendant 24 heures, pendant une semaine ou bien définitivement. Moi, je vais mettre le premier, donc tout simplement. Une fois que c'est ça, eh bien, qu'est-ce que je lui dis ? Est-ce que je l'autorise ? Est-ce que je le bloque jusqu'à ce que je ferme ce site ? Moi, je vais l'autoriser, attention parce que là, comme je vais l'autoriser, il va lancer l'enregistrement automatiquement, d'accord, mais si jamais vous vous avez déjà autorisé sur ce site ou quoi que ce soit, il n'y aura pas à refaire, d'accord, il n'y aura pas de revérification. On pourrait toujours aller ici et modifier après, d'accord. Donc ici, on va le faire. Bienvenue sur Simple et Gratuit, c'est Gaël et nous sommes ensemble sur cette vidéo pour découvrir une manière d'écrire et de parler ou plutôt de parler et d'écrire. On clique sur stop recording. Ici, on peut écouter, d'accord, tout ce qu'on a fait et ici, on va pouvoir cliquer sur l'OM. A noter ici que si vous voulez, vous trouvez votre voix superbe et ce que vous avez dit, c'est trop profond, vous pouvez télécharger l'audio. C'est gratis. Une fois que c'est fait, donc bon, là, évidemment, ça arrive sur le site. Ensuite, il va se passer deux choses. La première, c'est qu'il va nous télécharger le modèle d'intelligence artificielle qui va lui permettre de comprendre ce qu'on raconte, d'accord. Et la deuxième chose, eh bien, en fait, après, il va traiter la voix. Donc, ça peut prendre un petit peu de temps pour la première fois parce qu'il va devoir télécharger le modèle d'intelligence artificielle. Mais après, vous n'aurez que la deuxième étape à faire. Donc ça, c'est plutôt cool. OK, donc la première chose qu'on va faire, puisque c'est la première fois qu'on l'utilise ensemble, eh bien, on va utiliser la petite roue crantée. Ici, moi, je clique dessus et ici, on a donc deux possibilités, soit Xenova, d'accord, en Tiny, donc c'est-à-dire en version light, légère, qui fait 152 kilos ou bien la version de base que vous avez à 291 kilos. Et vous avez même des versions pro et tout ça, mais pour ça, il faut vous abonner, d'accord. Encore une fois, comme cette vidéo n'est pas sponsorisée, bon, allons pas plus loin, faisons les choses simples. Mais pour la majorité du temps, moi, je m'en sers dans le milieu professionnel, par exemple, la version de base est largement suffisante. Elle comprend tout à fait ce que vous dites. Bon, là, moi, puisque je ne vais pas faire traîner trop parce que 152 MO à télécharger quand on a orange et qu'on habite en campagne, c'est une vraie galère. 291, c'est encore pire. On va choisir 152, mais vous, vous pouvez choisir bien évidemment celle que vous voulez. OK, moi, je vous conseille la deuxième, évidemment. Pour le professionnel, moi, je choisis la deuxième. Ici, on a le multi-language. Alors ça, c'est plutôt cool. Vous cliquez dessus et vous voyez ici, vous pouvez choisir en fait la langue, langue, source, c'est à dire la langue dans laquelle j'ai parlé. Comme vous voyez, je n'ai pas parlé en anglais parce que ça aurait été incompréhensible, même pour un anglais. Et alors, je choisis French pour français, bien sûr. Et ici, on a deux options où on transcribe, c'est à dire qu'on transforme en texte. Donc, on aura du texte en français ou bien on traduit en anglais. Donc, ça va nous permettre d'avoir le texte, mais traduit en anglais. Donc, vous pouvez faire les deux. Mais nous, on va faire le premier essentiellement puisque c'est le sujet de ce tuto. Je clique sur close et mes paramètres sont enregistrés. Je n'ai plus qu'à appuyer sur transcript audio et c'est parti. Et vous voyez, en fait, il y a deux étapes. La première étape, c'est effectivement le téléchargement, tout ça. Ensuite, il va encoder et puis comprendre ce que j'ai dit, tout simplement. Donc, vous voyez, ça va prendre un petit peu de temps. Malheureusement, ça, je ne peux pas couper, d'accord ? Après, selon les ordinateurs, ça va aller plus ou moins vite. Bon, ça n'a pas été trop long, donc ça, c'est plutôt cool. Et vous voyez qu'effectivement, tout de suite, hop, il m'a mis ici. Bienvenue sur Simple et Gratuit, c'est Gaël. Nous sommes ensemble sur cette vidéo pour découvrir une manière d'écrire et de parler, ou plutôt de parler et d'écrire. Alors, on peut réécouter, voir ce que j'ai dit. Bienvenue sur Simple et Gratuit, c'est Gaël. Et nous sommes ensemble sur cette vidéo pour découvrir une manière d'écrire et de parler, ou plutôt de parler et d'écrire. D'accord ? Et donc, vous voyez qu'ici, finalement, moi, j'ai utilisé que la version tinie, la version la plus légère. Et vous voyez déjà le résultat, ok ? Et vous noterez également qu'il parle breton, parce qu'il n'a pas mis les petits accents ici, ce qu'on appelle des trémas sur le E. Il y a des trémas sur le E que quand on est français. Quand on est breton, on n'est pas de trémas sur le E, on n'en a pas besoin. Voilà, c'est pour ça que mon prénom s'écrit sans les trémas. En tout cas, voilà. Maintenant, vous savez comment faire. Ça, c'est plutôt cool. Vous pouvez à nouveau télécharger votre fichier ici pour avoir l'audio. Et puis ici, vous pouvez soit l'avoir en version texte, donc fichier texte que vous pouvez ouvrir avec n'importe quel logiciel, ou bien l'exporter en version JSON, c'est-à-dire, allez, globalement, en base de données. J'essaye de pas trop, trop vous prendre la tête avec des termes un peu techniques. On verra ça dans une autre vidéo, bien sûr. Mais voilà, le JSON, ça peut servir pour le classement, les sites Internet, ou bien pour le référencement dans un programme, par exemple. Ça peut être très pratique, notamment pour retrouver les mots-clés. Voilà donc ce que je voulais vous dire. J'espère que ça vous a plu. Ça n'a pas pris trop le temps. Je suis content. Pensez encore une fois à liker et à partager cette vidéo. Pensez également à vous abonner. Plus de 70% d'entre vous n'êtes pas abonné. C'est dommage. En tout cas, voilà. Merci à vous tous d'avoir suivi cette vidéo. Et on se retrouve très bientôt pour une nouvelle vidéo dans moins de 48 heures sur Simple et Gratuit. C'était Gaël. Ciao, ciao, bye.

ai AI Insights
Summary

Generate a brief summary highlighting the main points of the transcript.

Generate
Title

Generate a concise and relevant title for the transcript based on the main themes and content discussed.

Generate
Keywords

Identify and highlight the key words or phrases most relevant to the content of the transcript.

Generate
Enter your query
Sentiments

Analyze the emotional tone of the transcript to determine whether the sentiment is positive, negative, or neutral.

Generate
Quizzes

Create interactive quizzes based on the content of the transcript to test comprehension or engage users.

Generate
{{ secondsToHumanTime(time) }}
Back
Forward
{{ Math.round(speed * 100) / 100 }}x
{{ secondsToHumanTime(duration) }}
close
New speaker
Add speaker
close
Edit speaker
Save changes
close
Share Transcript