Blog chevron right Leyendas

Caption File Formats Explained (SRT vs VTT) for Legal Video and Training

Christopher Nguyen
Christopher Nguyen
Publicado en Zoom may. 10 · 10 may., 2026
Caption File Formats Explained (SRT vs VTT) for Legal Video and Training

Para vídeos legales y de formación, SRT y VTT son los formatos de subtítulos más prácticos. SRT funciona casi en cualquier plataforma; VTT añade opciones útiles para la web, como posición, estilo y metadatos.

La mejor elección depende de dónde publicarás el vídeo, qué exige tu equipo legal o de formación y cuánto control necesitas al editar.

Key takeaways

  • SRT es simple, ligero y muy compatible.
  • VTT sirve mejor para reproductores web y puede incluir más datos de formato.
  • Los subtítulos no son solo texto: influyen en accesibilidad, revisión legal, búsqueda interna y formación.
  • Para cumplimiento, importa más la precisión, la sincronía y la legibilidad que la extensión del archivo.
  • Guarda siempre una copia editable y revisa codificación, saltos de línea, etiquetas de hablante y timecodes.

Qué es un archivo de subtítulos y qué contiene

Un archivo de subtítulos conecta texto con momentos exactos del vídeo. No suele incluir el vídeo ni el audio; solo instrucciones para mostrar palabras en pantalla.

En vídeos legales y de formación, ese archivo ayuda a que las personas puedan seguir el contenido sin depender solo del sonido. También facilita revisión, archivo y reutilización.

Elementos básicos

  • Texto: lo que se dice o lo que debe leer el espectador.
  • Timecodes: hora de inicio y fin de cada subtítulo.
  • Orden: secuencia de bloques para que el reproductor los muestre bien.
  • Etiquetas: marcas como nombre del hablante, música, ruidos o notas de contexto.
  • Formato: reglas de estilo, posición o alineación, según el tipo de archivo.

Ejemplo sencillo de SRT

Un bloque SRT suele verse así:

  • 1
  • 00:00:02,000 --> 00:00:05,000
  • Abogada: Por favor, indique su nombre completo.

La coma en el timecode es normal en SRT. Muchos errores vienen de cambiar esa coma por un punto en plataformas que esperan el formato exacto.

Ejemplo sencillo de VTT

Un archivo VTT suele empezar con WEBVTT y usa puntos en los milisegundos:

  • WEBVTT
  • 00:00:02.000 --> 00:00:05.000
  • <v Abogada>Por favor, indique su nombre completo.

VTT puede aceptar más información que SRT. Por eso se usa mucho en entornos web.

SRT vs VTT: diferencias prácticas

La diferencia principal entre SRT y VTT no es la calidad del texto. Es la forma en que cada formato guarda tiempos, estructura y opciones extra.

Si el subtítulo está mal transcrito o mal sincronizado, ningún formato lo arregla. El formato solo determina cómo se entrega y cómo se reproduce.

SRT: simple y compatible

SRT significa SubRip Subtitle. Es uno de los formatos más comunes para subtítulos porque resulta fácil de abrir, editar y convertir.

  • Usa números de secuencia.
  • Usa timecodes con coma: 00:00:02,000.
  • No exige una cabecera especial.
  • Soporta texto básico y algunas etiquetas simples, según el reproductor.
  • Funciona en muchas plataformas de vídeo, LMS y herramientas de edición.

Para equipos legales o de formación que necesitan un archivo directo, SRT suele ser la opción segura. También sirve bien cuando varias personas revisan el texto en herramientas distintas.

VTT: más flexible para la web

VTT significa WebVTT. El estándar WebVTT del W3C define este formato para mostrar pistas de texto en la web.

  • Empieza con la cabecera WEBVTT.
  • Usa timecodes con punto: 00:00:02.000.
  • Puede incluir notas, identificadores y ajustes de posición.
  • Puede marcar voces con etiquetas como <v Nombre>.
  • Se integra bien con reproductores HTML5 y plataformas web.

VTT es útil cuando necesitas más control visual o cuando el reproductor web lo pide. También encaja bien en módulos de e-learning que viven dentro de un navegador.

Comparación rápida

  • Compatibilidad general: SRT suele ganar.
  • Funciones web: VTT suele ganar.
  • Edición manual: ambos son fáciles, pero SRT es más simple.
  • Estilo y posición: VTT ofrece más opciones.
  • Riesgo de errores: ambos fallan si se rompen los timecodes o la codificación.

Otros formatos relacionados que puedes encontrar

SRT y VTT son los más comunes en flujos modernos, pero no son los únicos. En legal, formación, televisión y plataformas internas, puedes recibir otros formatos.

No conviene convertir archivos sin saber para qué sistema se usarán. Algunas conversiones eliminan estilo, posición o metadatos.

SCC

SCC aparece mucho en flujos de emisión y vídeo profesional. Puede llevar datos de closed captions usados en estándares de televisión.

Si trabajas con vídeo para broadcast, archivo institucional o entrega a una cadena, pregunta si piden SCC. No lo elijas solo porque “suena más profesional”.

TTML o DFXP

TTML, también llamado a veces DFXP, usa una estructura basada en XML. Puede guardar estilos y datos más complejos.

Algunas plataformas de formación, archivo o distribución lo aceptan. Es menos cómodo para editar a mano que SRT o VTT.

SBV

SBV es un formato simple usado por algunas herramientas de vídeo. Se parece a SRT en que une texto con tiempos.

Puede ser útil en flujos concretos, pero no suele ser la primera opción si necesitas máxima portabilidad.

TXT o transcripción sin tiempos

Un TXT puede contener el texto completo del audio, pero no siempre incluye timecodes. Eso lo convierte en transcripción, no en archivo de subtítulos listo para reproducir.

Sirve para revisión, búsqueda y documentación. Para mostrar subtítulos en vídeo, necesitarás sincronizarlo.

Cómo afectan los formatos al cumplimiento, la accesibilidad y la revisión legal

El formato ayuda, pero el cumplimiento depende del resultado para la persona que ve el vídeo. Un archivo SRT limpio puede ser más útil que un VTT con estilo pero con errores.

Para accesibilidad digital, las pautas WCAG del W3C explican principios sobre alternativas de texto, medios temporales y contenido perceptible. Revisa también las normas internas de tu organización.

En vídeo legal

En contenido legal, la precisión importa mucho. Un nombre mal escrito, una negación omitida o una etiqueta de hablante incorrecta pueden cambiar el sentido.

  • Deposiciones: usa etiquetas claras de hablante cuando haya preguntas y respuestas.
  • Audiencias grabadas: marca cambios de hablante y sonidos relevantes.
  • Pruebas en vídeo: conserva una copia original y documenta cualquier conversión.
  • Revisión interna: usa nombres consistentes para abogados, testigos, intérpretes y jueces.

Si el archivo formará parte de un expediente o revisión sensible, evita editarlo sin control de versiones. Guarda fecha, fuente y versión final.

En vídeo de formación

En formación, los subtítulos ayudan a entender términos técnicos, instrucciones y nombres de productos. También sirven cuando una persona estudia sin audio.

  • Cursos de cumplimiento: asegúrate de que los términos clave coincidan con la política oficial.
  • Onboarding: usa frases cortas y fáciles de leer.
  • Formación técnica: revisa siglas, comandos, nombres de software y medidas.
  • Vídeos multilingües: separa transcripción, traducción y subtitulado para no mezclar errores.

Si el curso vive en un LMS, confirma qué formato acepta antes de producir cientos de archivos. Algunos sistemas aceptan SRT; otros prefieren VTT.

Subtítulos abiertos y cerrados

Los subtítulos cerrados se pueden activar o desactivar. SRT y VTT suelen usarse para este tipo de entrega.

Los subtítulos abiertos van quemados en el vídeo y no se pueden apagar. Son útiles cuando una plataforma no permite pistas separadas, pero dificultan correcciones futuras.

Guía de selección: qué formato elegir

Elige el formato según el destino, no según una preferencia general. El mejor archivo es el que tu plataforma reproduce bien y tu equipo puede mantener.

Antes de decidir, pregunta dónde se alojará el vídeo, quién lo revisará y si habrá traducciones o versiones futuras.

Elige SRT si...

  • Necesitas máxima compatibilidad.
  • Vas a subir el vídeo a varias plataformas.
  • El equipo revisará el texto en editores simples.
  • No necesitas posición o estilo avanzado.
  • Quieres un formato fácil de convertir.

Elige VTT si...

  • Tu reproductor web lo pide o lo recomienda.
  • Trabajas con vídeo HTML5.
  • Necesitas etiquetas de voz más estructuradas.
  • Quieres añadir notas o identificadores internos.
  • Necesitas controlar mejor la posición del texto.

Elige otro formato si...

  • Un canal de emisión pide SCC.
  • Una plataforma pide TTML, DFXP o XML.
  • Un sistema de archivo exige un formato concreto.
  • El cliente o el tribunal indica una especificación técnica.

Checklist antes de entregar

  • ¿La plataforma acepta el formato elegido?
  • ¿Los timecodes usan coma en SRT y punto en VTT?
  • ¿La codificación está en UTF-8 si hay acentos, eñes o símbolos?
  • ¿Los nombres de hablantes son coherentes?
  • ¿La duración de cada subtítulo permite leerlo sin prisa?
  • ¿El archivo abre bien en el reproductor final?

Consejos básicos de manejo y edición

Un archivo de subtítulos parece simple, pero pequeños cambios pueden romperlo. Edita con cuidado, sobre todo si el vídeo tiene valor legal o forma parte de un curso obligatorio.

Si necesitas crear subtítulos desde audio o vídeo, puedes empezar con servicios de subtitulado cerrado y después revisar el archivo según tu plataforma.

Timecodes

  • No dejes solapamientos entre subtítulos, salvo que tu sistema los permita.
  • No dejes gaps largos si una persona sigue hablando.
  • Ajusta el inicio para que el texto aparezca cuando empieza la frase.
  • Ajusta el final para que no tape la siguiente idea.
  • Usa el separador correcto: coma en SRT, punto en VTT.

También revisa el frame rate si vienes de un editor de vídeo. Una conversión mal hecha puede desplazar los subtítulos poco a poco.

Codificación y caracteres

Usa UTF-8 cuando trabajes con español, nombres propios, símbolos legales o texto multilingüe. Así reduces problemas con tildes, eñes y signos de apertura.

  • Revisa palabras como “acción”, “señor”, “¿por qué?” y “número”.
  • Evita copiar desde procesadores que cambian comillas o guiones de forma extraña.
  • Abre el archivo en el reproductor final, no solo en tu editor de texto.

Etiquetas de hablante

Las etiquetas de hablante ayudan mucho en vídeos legales y en cursos con varios instructores. Mantén un formato constante.

  • Legal: “Abogada:”, “Testigo:”, “Juez:” o nombres si se permiten.
  • Formación: “Instructor:”, “Empleado:”, “Narradora:” o el rol de la persona.
  • VTT: considera etiquetas de voz como <v Instructor> si tu reproductor las admite.

No cambies entre “Dr. Pérez”, “Doctor” y “Pérez” sin razón. Esa variación complica búsquedas y revisión.

Sonidos y contexto

Incluye sonidos relevantes cuando ayudan a entender el contenido. No hace falta describir cada ruido si no aporta información.

  • [risas]
  • [música]
  • [inaudible]
  • [hablan a la vez]
  • [pausa larga]

En legal, marca partes inaudibles con prudencia y sin inventar. En formación, usa notas claras cuando un sonido indique una acción importante.

Líneas, longitud y lectura

Procura que cada subtítulo sea fácil de leer de un vistazo. Las líneas demasiado largas cansan y pueden tapar elementos importantes del vídeo.

  • Divide frases largas en dos bloques si hace falta.
  • No cortes nombres, cifras o términos legales de forma confusa.
  • Evita poner demasiado texto en pantalla al mismo tiempo.
  • Comprueba el resultado en móvil y escritorio si el vídeo será web.

Errores comunes y cómo evitarlos

La mayoría de problemas con SRT y VTT salen de detalles básicos. Una revisión final en el reproductor real evita muchos fallos.

Confundir SRT y VTT solo por cambiar la extensión

No basta con renombrar archivo.srt como archivo.vtt. Debes cambiar la estructura, la cabecera y el formato de timecodes cuando corresponda.

Romper caracteres en español

Si ves símbolos extraños donde debería haber tildes, revisa la codificación. Guarda de nuevo el archivo como UTF-8 y prueba otra vez.

Omitir hablantes en vídeos con diálogo

Sin etiquetas, el espectador puede perder quién habla. Esto afecta más en deposiciones, entrevistas, paneles y formación con escenarios.

Entregar sin probar en la plataforma final

Un archivo puede verse bien en tu ordenador y fallar en el LMS o reproductor del cliente. Sube una muestra y verifica antes de cerrar el proyecto.

Editar el texto y olvidar los tiempos

Si añades frases largas, quizá el espectador no pueda leerlas antes de que desaparezcan. Ajusta tiempos después de cambiar el contenido.

Common questions

¿SRT y VTT son subtítulos o transcripciones?

Son archivos de subtítulos porque tienen texto sincronizado con tiempos. Una transcripción puede no tener timecodes y no siempre sirve para reproducirse como pista de subtítulos.

¿Puedo convertir SRT a VTT?

Sí, pero revisa el resultado. Debes confirmar la cabecera WEBVTT, los puntos en milisegundos y cualquier etiqueta que la conversión haya cambiado.

¿Qué formato conviene para un curso online?

Depende del LMS o reproductor. Si acepta ambos, SRT es una opción simple; VTT puede ser mejor si el curso está basado en web y necesita opciones extra.

¿Qué formato conviene para vídeo legal?

Usa el formato que pida el sistema de revisión, el cliente o el tribunal. Si no hay requisito técnico, SRT suele ser práctico por su compatibilidad y facilidad de revisión.

¿Los archivos SRT o VTT cumplen por sí solos con accesibilidad?

No por sí solos. También necesitas texto preciso, buena sincronía, identificación de hablantes cuando sea necesaria y sonidos relevantes para entender el contenido.

¿Debo incluir cada “eh” o muletilla?

Depende del objetivo. En legal puede ser importante conservar más detalle; en formación suele primar la claridad, siempre sin cambiar el significado.

¿Puedo editar SRT o VTT en un bloc de notas?

Sí, pero haz una copia antes. No cambies el orden, los separadores de tiempo ni la codificación sin comprobar el archivo después.

Resumen práctico

SRT es la opción simple y compatible para muchos vídeos legales y de formación. VTT ofrece más control en la web y puede guardar información adicional útil.

La decisión correcta empieza por la plataforma final y sigue con una revisión cuidadosa del contenido. Comprueba timecodes, UTF-8, etiquetas de hablante y reproducción real antes de entregar.

Si necesitas crear, revisar o adaptar subtítulos para vídeos legales o de formación, GoTranscript ofrece soluciones adecuadas para cada flujo de trabajo, incluidas professional transcription services.