Guía para transcripción automática con YouTube
Aprende a transcribir de audio a texto usando subtítulos automáticos de YouTube. Detalles sobre proceso y consejos para mejorar resultados exitosos.
File
TUTORIAL TRANSCRIPCIÓN AUTOMÁTICA DE AUDIO A TEXTO EN YOUTUBE - ESPAÑOL 2016
Added on 01/27/2025
Speakers
add Add new speaker

Speaker 1: ¡Hola. En esta guía vamos a aprender una forma de realizar la transcripción automática de un audio a texto. Para ello vamos a ayudarnos del subtitulado automático de YouTube. Este es un proceso que no siempre funciona, y el proceso depende de varios factores para que la transcripción se realice correctamente. Los factores que pueden hacer que la operación no se realice exitosamente son los siguientes. Que el idioma del vídeo no sea compatible con YouTube, que el vídeo sea demasiado largo, que la calidad del audio sea mala o el discurso no se reconozca bien, que haya un periodo largo de silencio al comienzo del vídeo, o que aparezcan diferentes personas cuyos discursos se superponen. Podemos partir de dos situaciones, una es tener un vídeo cuyo audio queremos transcribir, y la segunda es partir de un fichero de audio. En el primer caso, teniendo el vídeo, solo habría que comenzar el proceso subiendo el vídeo a YouTube, pero en el segundo caso, donde solo disponemos de un fichero de audio, es necesario convertir ese fichero de audio a un formato de vídeo, ya que YouTube no permite subir vídeos que solo contengan audio y no imagen. Convertir un fichero de audio en vídeo es muy sencillo, y se puede hacer de muchas maneras, con herramientas online, con herramientas de edición de vídeo, por ejemplo en Windows se puede hacer con Windows Movie Maker y en Mac se puede hacer con iMovie. En este caso vamos a ver un ejemplo con Windows Movie Maker. Realmente no necesitamos ningún vídeo aparte para mezclarlo con el audio, con tan solo una imagen nos basta, y será esa imagen la que se verá de manera estática en el vídeo a lo largo de toda su duración, así el producto final sería un vídeo cuyo audio es el audio original y el vídeo es dicha imagen fija. Bien, vamos a realizar el proceso con Windows Movie Maker en Windows, será tan sencillo como abrir el programa y ahora introducir en nuestra película los materiales de los que disponemos, que serán el audio y una imagen. Los tenemos aquí, este es el audio y esta es la imagen. Vamos a arrastrar la imagen hasta aquí y el audio lo vamos a introducir desde agregar música y desde aquí, agregar música. Se nos abre un explorador y vamos hasta la carpeta en cuestión, que en este caso es la que sale por defecto. Selecciono mi audio y le doy a abrir. Bien, ya tengo mi película, el audio, que está aquí abajo, y la imagen. Si pongo el ratón encima de la imagen, me dice que la duración es de 7 segundos, entonces lo que yo tengo que conseguir es que la duración de la imagen en la pantalla en el vídeo dure lo mismo que dura el audio. Para eso pincho dos veces la imagen y le digo que la duración sea más larga, por ejemplo 25. Y veo ya que efectivamente la duración de la imagen es bastante más larga que la duración del audio, entonces lo que tengo que hacer es recortar este espacio de aquí que me sobra y este espacio de aquí que me sobra. Eso lo puedo hacer estableciendo un punto final, pero para ello tengo que poner primero el cursor en el punto final. Me vendría aquí y le diría que este es el punto final de mi vídeo. Y ahora efectivamente tiene la misma duración la imagen y el audio. Ahora que hemos terminado la edición podemos comprobar que el vídeo empiece y acaba donde debe, empezándole a reproducir. Hola, buenos días. Este vídeo es sólo una prueba de cómo se realiza una transcripción automática de un audio a través de la plataforma YouTube. En este caso, desde un fichero de audio, hemos creado un vídeo y lo hemos subido a YouTube para que éste genere automáticamente su transcripción. Efectivamente, el vídeo está bien, empieza donde empieza el audio y termina donde acaba el audio. Ahora lo único que me quedaría sería exportar esto a un vídeo. Y eso lo haría desde el menú principal, guardar película. Y ahora, ¿qué edición utilizo? Pues cualquiera. Esta misma de recomendada para este proyecto no suele valer. Me sale de nuevo otro explorador de Windows y ahora lo único que tengo que hacer es darle un nombre a la película. El tipo de formato podemos seleccionarlo, pero cualquiera de los dos nos vale para subirlo a YouTube. Seleccionamos el primero y ahora le damos a guardar. Y ahora habrá que esperar un poco a que se termine de exportar la película. Bien, ya ha terminado la exportación, así que ahora podemos coger el archivo y subirlo a YouTube para comenzar el proceso de transcripción. Bueno, ya estamos en la página web de YouTube, concretamente en el canal Docencia, que es nuestro canal de innovación docente, y lo que tenemos que hacer ahora es subir ese vídeo. Para subir ese vídeo le tenemos que dar al botón Subir, que siempre va a aparecer en una página web de YouTube, y evidentemente necesitamos tener una cuenta aquí. Introducimos los datos e iniciamos la sesión. Ya estamos en la página de cargar los archivos, de subir los vídeos, y lo que tenemos que hacer es simplemente irnos al explorador de archivos de Windows. Aquí tenemos una ventana del explorador de Windows y lo que tenemos que hacer es coger nuestro archivo de vídeo, que es esta película, y arrastrarlo a esta zona de aquí. Bien, la película ya se está subiendo, se ha subido muy rápido porque es muy cortita, y ahora se está procesando. En este tiempo que se está procesando podemos seleccionar o establecer algunos de los parámetros, como por ejemplo el nombre, podemos definir una descripción, y también vamos a establecer si nuestro vídeo es público, privado u oculto. Siempre que sea un vídeo de prueba o que estemos testeando algo lo ideal es que no aparezca como público, para que el público en general no pueda acceder a él, que sólo pueda acceder la gente que tenga la URL de vídeo, que es esta de aquí, esto sería oculto, o privado, que sólo pueda acceder los usuarios que nosotros le demos permiso o nosotros mismos. Vamos a ponerlo como oculto. El vídeo como hemos visto tiene una barra de desplazamiento que nos ha ido avisando cuando se iba cargando, lo que pasa es que se ha cargado muy rápido porque es muy cortito, y luego tiene un proceso de transformación, que YouTube está transformando el vídeo a un formato que él puede manejar. Este proceso también ha sido muy rápido, pero puede ser más lento si el vídeo es demasiado grande y termina cuando nos dice que el proceso está terminado. Entonces le podemos dar a listo que quiere decir que ya hemos terminado. Le damos a listo y YouTube nos dice que el vídeo está aquí. Entonces si nosotros copiamos esta dirección y la pegamos arriba, con control c y control v y le damos a enter, efectivamente el vídeo está aquí y podemos verlo, ¿no? Hola, buenos días. Este vídeo es sólo una prueba de cómo se realiza una transcripción automática de un audio a través de la plataforma YouTube. En este caso, desde un fichero de audio hemos creado un vídeo y lo hemos subido a YouTube para que éste genere automáticamente su transcripción. Bueno, efectivamente el vídeo se ha subido perfectamente, está perfectamente colocado en YouTube y ahora donde tenemos que irnos es a los subtítulos, que es este botón de aquí. Le damos a subtítulos y ya nos ha aparecido aquí un idioma que es español automático. Si cuando entramos en el vídeo no ha aparecido todavía es porque se está procesando. Es decir, la generación de este idioma automático, o sea de la transcripción del texto que se está hablando en el vídeo, suele tardar un poco. Y si el vídeo es un poquito grande suele tardar bastante. Así que tenemos que esperar a que termine de aparecer aquí. También puede ocurrir que esta transcripción automática no se llegue a realizar nunca porque se den alguna de las circunstancias que hemos visto al principio de esta guía en las que esta transcripción no se genera correctamente. Así que puede pasar que intentemos entrar muchas veces y no termine de aparecer ahí nunca este cartel. Eso quiere decir que la transcripción para este vídeo no está disponible o no se puede realizar. Y si me echamos en él nos aparecen aquí una serie de textos que es la transcripción de lo que yo he hablado en el vídeo, es decir, del audio del vídeo. La tenemos aquí y nos aparece por tramos de tiempo. Esta frase del segundo a cero al segundo uno y medio, esta de aquí del segundo uno y medio al 6.3 y las demás. Y ahora lo bueno es que este conjunto de frases transcritas de nuestro vídeo podemos descargarla desde aquí, desde acciones, en cualquiera de estos tres formatos. Si seleccionamos este, por ejemplo, nos lo ha descargado aquí y si le damos a abrir nos lo abre con el blog de notas y vemos que dentro del fichero hay una serie de parámetros que definen el tipo de fichero que es y la estructura que tiene. Y luego vamos a tener aquí ya la transcripción del vídeo que están en estas frases. Esto hay que corregirlo porque la transcripción nunca suele ser buena al 100%. Puede ser muy mala, puede ser regular, puede ser muy buena o puede ser casi perfecta, pero siempre hay que repasarla porque lo normal es que haya algunas palabras que no estén bien. Bueno, pues ya hemos visto cuál es el proceso completo desde que tenemos el fichero de audio hasta que tenemos la transcripción en un blog de notas, es decir, en un archivo de texto. Para un audio tan corto como este o un texto tan pequeño no nos merece la pena hacer esto de esta manera, nos hubiera sido mucho más fácil transcribirlo a mano, pero cuando tengamos un texto de varias páginas o un archivo de audio de varios minutos, pues igual haciéndolo así, sí que ganamos bastante tiempo, aunque después, como he dicho, es muy importante repasar que la transcripción sea correcta. Un saludo. Subtítulos realizados por la comunidad de Amara.org

ai AI Insights
Summary

Generate a brief summary highlighting the main points of the transcript.

Generate
Title

Generate a concise and relevant title for the transcript based on the main themes and content discussed.

Generate
Keywords

Identify and highlight the key words or phrases most relevant to the content of the transcript.

Generate
Enter your query
Sentiments

Analyze the emotional tone of the transcript to determine whether the sentiment is positive, negative, or neutral.

Generate
Quizzes

Create interactive quizzes based on the content of the transcript to test comprehension or engage users.

Generate
{{ secondsToHumanTime(time) }}
Back
Forward
{{ Math.round(speed * 100) / 100 }}x
{{ secondsToHumanTime(duration) }}
close
New speaker
Add speaker
close
Edit speaker
Save changes
close
Share Transcript