Guía para Transcribir Audio a Texto Usando YouTube
Aprende a transcribir audios a texto fácilmente con la ayuda de YouTube. Descubre los pasos y requisitos para obtener una transcripción automática efectiva.
File
Transcripción automática de audio a texto en Youtube
Added on 01/27/2025
Speakers
add Add new speaker

Speaker 1: Hola, en esta guía vamos a aprender una forma de realizar la transcripción automática de un audio a texto. Para ello vamos a ayudarnos del subtitulado automático de YouTube. Este es un proceso que no siempre funciona, y el proceso depende de varios factores para que la transcripción se realice correctamente. Los factores que pueden hacer que la operación no se realice exitosamente son los siguientes. Que el idioma del vídeo no sea compatible, castellano e inglés lo son. Que el vídeo sea demasiado largo. Que la calidad del audio sea mala o el discurso no se reconozca bien. Que hay un periodo largo de silencio al comienzo del vídeo. O que aparezcan diferentes personas cuyos discursos se superponen. Podemos partir de dos situaciones. Una es tener un vídeo cuyo audio queremos transcribir. Y la segunda es partir de un fichero de audio. En el primer caso, teniendo el vídeo, solo habría que comenzar el proceso subiendo el vídeo a YouTube. Pero en el segundo caso, donde solo disponemos de un fichero de audio, es necesario convertir ese fichero de audio a un formato de vídeo, ya que YouTube no permite subir vídeos que solo contengan audio y no imagen. Convertir un fichero de audio en vídeo es muy sencillo, y se puede hacer de muchas maneras, con herramientas online, con herramientas de edición de vídeo, Por ejemplo, en Windows se puede hacer con Windows Movie Maker y en Mac se puede hacer con iMovie. En este caso vamos a ver un ejemplo con Windows Movie Maker. Realmente no necesitamos ningún vídeo aparte para mezclarlo con el audio, con tan solo una imagen nos basta. Y será esa imagen la que se verá de manera estática en el vídeo a lo largo de toda su duración. Así el producto final sería un vídeo cuyo audio es el audio original y el vídeo es dicha imagen fija. Bien, vamos a realizar el proceso con Windows Movie Maker, en Windows. Será tan sencillo como abrir el programa y ahora introducir en nuestra película los materiales de los que disponemos, que serán el audio y una imagen. Los tenemos aquí. Este es el audio y esta es la imagen. Vamos a arrastrar la imagen hasta aquí y el audio lo vamos a introducir desde Agregar música y desde aquí agregar música. Se nos abre un explorador y vamos hasta la carpeta en cuestión que en este caso es la que sale por defecto. Selecciono mi audio y le doy a abrir. Bien ya tengo mi película, el audio que está aquí abajo y la imagen. Si pongo el ratón encima de la imagen me dice que la duración es de 7 segundos entonces lo que yo tengo que conseguir es que la duración de la imagen en la pantalla en el vídeo dure lo mismo que dura el audio. Para eso pincho dos veces en la imagen y le digo que la duración sea más larga por ejemplo 25 y veo ya que efectivamente la duración de la imagen es bastante más larga que la duración del audio entonces lo que tengo que hacer es recortar este espacio de aquí que me sobra y este espacio de aquí que me sobra eso lo puedo hacer estableciendo un punto final pero para ello tengo que poner primero el cursor en el punto final me vendría aquí y le diría que este es el punto final de vídeo y ahora efectivamente tiene la misma duración la imagen y el audio ahora que hemos terminado la edición podemos comprobar que el vídeo empiece y acaba donde debe dándole a reproducir hola buenos días este vídeo es sólo una prueba de cómo se realiza una transcripción automática de un audio a través de la plataforma youtube en este caso desde un fichero de audio hemos creado un vídeo y lo hemos subido a YouTube para que éste genere automáticamente su transcripción. Efectivamente el vídeo está bien, empieza donde empieza el audio y termina donde acaba el audio. Ahora lo único que me quedaría sería exportar esto a un vídeo y eso lo haría desde el menú principal, guardar película y ahora ¿qué opción utilizo? Pues cualquiera, esta misma de recomendada para este proyecto no suele valer. Me sale de nuevo otro explorador de Windows y ahora lo único que tengo que hacer es darle un nombre a la película. El tipo de formato podemos seleccionarlo, pero cualquiera de los dos nos vale para subirla a YouTube. Seleccionamos el primero y ahora le damos a guardar. Y ahora habrá que esperar un poco a que se termine de exportar la película. Bien, ya he terminado la exportación, así que ahora podemos coger el archivo y subirlo a YouTube para comenzar el proceso de transcripción. Bueno, ya estamos en la página web de YouTube, concretamente en el canal Docencia, que es nuestro canal de innovación docente, y lo que tenemos que hacer ahora es subir ese vídeo. Para subir ese vídeo le tenemos que dar al botón Subir, que siempre va a aparecer en una página web de YouTube, youtube y evidentemente necesitamos tener una cuenta aquí. Introducimos los datos e iniciamos la sesión. Ya estamos en la página de cargar los archivos de subir los vídeos y lo que tenemos que hacer es simplemente irnos al explorador de archivos de windows. Aquí tenemos una ventana del explorador de windows y lo que tenemos que hacer es coger nuestro archivo de vídeo que es esta película y arrastrarlo a esta zona de aquí. Bien, la película se está subiendo, se ha subido muy rápido porque es muy cortita y ahora se está procesando. En este tiempo que se está procesando podemos seleccionar o establecer algunos de los parámetros, como por ejemplo el nombre, podemos definir una descripción y también vamos a establecer si nuestro vídeo es público, privado u oculto. siempre que sea un vídeo de prueba o que estemos testeando algo, lo ideal es que no aparezca como público, para que el público en general no pueda acceder a él, que sólo pueda acceder la gente que tenga la URL de vídeo, que es esta de aquí, esto sería oculto, o privado, que sólo pueda acceder los usuarios que nosotros le demos permiso o nosotros mismos. Vamos a ponerlo como oculto. El vídeo como hemos visto tiene una barra de desplazamiento que nos ha ido avisando cuando se iba cargando, lo que pasa es que se ha cargado muy rápido porque es muy cortito y luego tiene un proceso de transformación, que YouTube está transformando el vídeo a un formato que él puede manejar. Este proceso también ha sido muy rápido, pero puede ser más lento si el vídeo es demasiado grande y termina cuando nos dice que el proceso está terminado. Entonces le podemos dar a listo que quiere decir que ya hemos terminado. Le damos a listo y youtube nos dice que el vídeo está aquí. Entonces si nosotros copiamos esta dirección y la pegamos arriba con ctrl c y ctrl u y le damos a enter efectivamente el vídeo está aquí y podemos verlo. Hola buenos días este vídeo es sólo una prueba de cómo se realiza una transcripción automática de un audio a través de la plataforma youtube. En este caso desde un fichero de audio hemos creado un vídeo y lo hemos subido a youtube para que éste genere automáticamente su transcripción. Bueno efectivamente el vídeo se ha subido perfectamente, está perfectamente colocado en youtube y ahora donde tenemos que irnos es a los subtítulos, que es este botón de aquí. Le damos a subtítulos Y ya nos ha aparecido aquí un idioma que es español automático. Si cuando entremos en el vídeo no ha aparecido todavía es porque se está procesando. Es decir, la generación de este idioma automático, o sea, de la transcripción del texto que se está hablando en el vídeo, suele tardar un poco. Y si el vídeo es un poquito grande suele tardar bastante. Así que tenemos que esperar a que termine de aparecer esto aquí. También puede ocurrir que esta transcripción automática no se llegue a realizar nunca. porque se den alguna de las circunstancias que hemos visto al principio de esta guía en las que esta transcripción no se genera correctamente. Así que puede pasar que intentemos entrar muchas veces y no termine de aparecer ahí nunca este cartel. Eso quiere decir que la transcripción para este vídeo no está disponible o no se puede realizar. Y si me echamos en él nos aparecen aquí una serie de textos que es la transcripción de lo que yo he hablado en el vídeo, es decir, del audio y del vídeo, la tenemos aquí y nos aparece por tramos de tiempo. Esta frase del segundo a cero al segundo uno y medio, esta de aquí del segundo uno y medio al 6.3 y las demás, ¿no? Y ahora lo bueno es que este conjunto de frases transcritas de nuestro vídeo podemos descargarla desde aquí, desde acciones, en cualquiera de estos tres formatos. Si seleccionamos este por ejemplo, nos lo ha descargado aquí y si le damos a abrir, nos lo abre con el blog de notas y vemos que dentro del fichero hay una serie de parámetros que definen el tipo de fichero que es y la estructura que tiene y luego vamos a tener aquí ya la transcripción del vídeo que están en estas frases. Esto hay que corregirlo porque la transcripción nunca suele ser buena al 100%, puede ser muy mala, puede ser regular, puede ser muy buena o puede ser casi perfecta, pero siempre hay que repasarla porque lo normal es que haya algunas palabras que no estén bien. Bueno pues ya hemos visto cuál es el proceso completo desde que tenemos el fichero de audio hasta que tenemos la transcripción en un blog de notas, es decir, en un archivo de texto. Para un audio tan corto como este o un texto tan pequeño no nos merece la pena hacer esto de esta manera, nos hubiera sido mucho fácil transcribirlo a mano, pero cuando tengamos un texto de varias páginas o un archivo de audio de varios minutos, pues igual haciéndolo así, sí que ganamos bastante tiempo, aunque después, como he dicho, es muy importante repasar que la transcripción sea correcta. Un saludo desde el Centro de Recursos Digitales de la Universidad de Cádiz.

ai AI Insights
Summary

Generate a brief summary highlighting the main points of the transcript.

Generate
Title

Generate a concise and relevant title for the transcript based on the main themes and content discussed.

Generate
Keywords

Identify and highlight the key words or phrases most relevant to the content of the transcript.

Generate
Enter your query
Sentiments

Analyze the emotional tone of the transcript to determine whether the sentiment is positive, negative, or neutral.

Generate
Quizzes

Create interactive quizzes based on the content of the transcript to test comprehension or engage users.

Generate
{{ secondsToHumanTime(time) }}
Back
Forward
{{ Math.round(speed * 100) / 100 }}x
{{ secondsToHumanTime(duration) }}
close
New speaker
Add speaker
close
Edit speaker
Save changes
close
Share Transcript