Una plantilla de plan de transcripción es un documento corto que define qué necesitas antes de enviar audio o vídeo a transcribir: plazo de entrega, formato, etiquetas de hablante, marcas de tiempo y reglas de control de calidad (QA). Si lo dejas claro desde el principio, reduces dudas, evitas revisiones innecesarias y consigues textos listos para analizar o publicar más rápido. A continuación tienes una plantilla copiable y una guía para rellenarla sin tecnicismos.
- Qué es: un checklist de requisitos para cada pedido de transcripción.
- Para qué sirve: menos retrabajo, entregas más consistentes y análisis más ágil.
- Qué incluye: turnaround, formatos (DOCX/TXT/SRT/VTT), hablantes, timestamps y QA.
Key takeaways
- Define el plazo (turnaround) según el uso real del texto: análisis interno, publicación o subtítulos.
- Elige el formato en función del destino: DOCX para editar, TXT para datos, SRT/VTT para subtítulos.
- Decide etiquetas de hablante y marcas de tiempo antes de transcribir para evitar cambios caros.
- Fija reglas de QA medibles (nombres propios, números, inaudibles, consistencia) para reducir revisiones.
- Un plan claro acelera el trabajo porque elimina preguntas y facilita el control de calidad.
Qué es un plan de transcripción y por qué ahorra tiempo
Un plan de transcripción reúne en una sola página todo lo que el transcriptor (o tu equipo) necesita para entregar el texto en el formato y con el nivel de detalle adecuados. No es burocracia: es una forma simple de evitar el típico “¿lo querías con hablantes?”, “¿con timestamps?”, “¿qué hacemos con las muletillas?”.
Cuando tus requisitos están claros, el equipo puede aplicar un criterio estable desde el minuto uno y tu revisión final se convierte en un control rápido, no en una reescritura completa. Además, si vas a analizar entrevistas o reuniones, un plan consistente hace que buscar, filtrar y citar sea mucho más rápido.
Señales de que necesitas esta plantilla
- Recibes transcripciones con estilos distintos según quién las haga.
- Tu equipo pierde tiempo “arreglando” formato, nombres o etiquetas.
- Vas a subtitular y te entregan solo texto corrido.
- Necesitas comparar varias entrevistas y cada una viene con criterios diferentes.
Plantilla de plan de transcripción (copiar y pegar)
Copia este bloque en un documento y rellena los campos. Si lo usas para varios proyectos, guarda una versión “base” y otra por encargo.
1) Datos del proyecto
- Nombre del proyecto: [_____]
- Persona de contacto: [_____]
- Email / canal para dudas: [_____]
- Idioma y variante: [Español (España) / otro: _____]
- Tipo de contenido: [entrevista / reunión / clase / podcast / juicio / otro]
- Uso final: [análisis interno / publicación web / archivo legal / subtítulos / formación]
2) Plazo de entrega (turnaround)
- Fecha y hora límite: [_____] (zona horaria: [_____])
- Prioridad: [estándar / urgente]
- Entrega parcial: [sí/no]. Si sí: [primera entrega: _____] y [entrega final: _____]
Nota: si necesitas una entrega parcial, indícalo explícitamente para poder revisar antes y evitar cambios a última hora.
3) Formatos de entrega
- Formato principal: [DOCX / TXT / SRT / VTT]
- Formato adicional (si aplica): [DOCX / TXT / SRT / VTT]
- Convención de nombres de archivo: [Proyecto_Fecha_ID.ext]
- Un archivo por: [pieza / capítulo / día / ponente / otro]
4) Etiquetas de hablante (speaker labels)
- ¿Identificar hablantes? [sí/no]
- Formato de etiqueta: [HABLANTE 1 / Entrevistador / Nombre real]
- Lista de hablantes conocidos: [Nombre — rol — voz (si aplica)]
- Regla cuando no se reconoce: [HABLANTE DESCONOCIDO / HABLANTE X]
- Interrupciones y solapamientos: [marcar / no marcar]. Si marcar: [cómo: p. ej. “(solapan)”]
5) Marcas de tiempo (timestamps)
- ¿Incluir timestamps? [sí/no]
- Frecuencia: [cada cambio de hablante / cada X minutos (p. ej. 1, 2, 5) / por párrafo]
- Formato: [HH:MM:SS]
- Para SRT/VTT: [sí/no]. Si sí: respetar estructura de subtítulos.
6) Estilo de transcripción
- Tipo: [verbatim (literal) / clean verbatim (limpia) / resumida]
- Muletillas (“eh”, “vale”, “en plan”): [mantener / eliminar parcialmente / eliminar]
- Errores gramaticales: [mantener / corregir sin cambiar sentido]
- Tacos y lenguaje sensible: [mantener / censurar parcialmente / censurar]
- Risas, pausas, suspiros: [incluir / no incluir]. Si incluir: [cómo: “(ríe)”]
7) Reglas de QA (control de calidad)
- Nombres propios: usar la lista proporcionada y mantener consistencia (p. ej. “María José” siempre igual).
- Números y fechas: [en palabras / en cifras / mixto]. Ej.: [“3” o “tres”].
- Acrónimos y siglas: [mantener sigla / expandir la primera vez].
- Inaudibles: marcar como [inaudible] con timestamp si hay timestamps; no inventar.
- Terminología del sector: usar glosario. Si falta: anotar dudas para revisión.
- Consistencia: mismas reglas en todo el proyecto (etiquetas, puntuación, estilo).
- Revisión final: ortografía, puntuación y coherencia básica antes de entregar.
8) Material de apoyo (muy recomendado)
- Glosario / palabras clave: [pegar lista]
- Nombres de personas y cargos: [pegar lista]
- Enlaces o documentos de referencia: [_____]
- Reglas internas (si tienes): [p. ej. estilo de marca]
9) Privacidad y manejo de archivos
- Datos sensibles: [sí/no]. Si sí: [qué tipo: salud, menores, finanzas, etc.]
- Redacción/anonimización: [sí/no]. Si sí: [qué campos: nombres, direcciones, etc.]
- Canal de entrega: [plataforma / email / enlace seguro / otro]
Si tratas datos personales en la UE, revisa tus obligaciones de protección de datos y define quién accede a los archivos. Para contexto sobre normativa, puedes consultar el texto del RGPD.
Cómo elegir el turnaround sin pagar “con prisas” en tiempo o calidad
El plazo de entrega no es solo “cuanto antes mejor”. Debe encajar con tu calendario de revisión y con el uso final del contenido.
- Para análisis interno: prioriza consistencia y etiquetas de hablante; un plazo estándar suele funcionar si no hay publicación.
- Para publicación: reserva tiempo para edición final (títulos, cortes, estilo) y pide DOCX para revisar con control de cambios.
- Para subtítulos: añade tiempo para revisar el corte de líneas y la sincronización, aunque uses SRT/VTT.
Si el contenido es largo, pide una entrega parcial (por ejemplo, por capítulos o por cada hora) para detectar pronto problemas de nombres, estilo o hablantes.
Qué formato pedir: DOCX vs TXT vs SRT/VTT (y cuándo combinar)
Elegir el formato correcto evita conversiones manuales y errores. Cada formato sirve para un destino distinto, y a veces conviene pedir dos.
DOCX
- Útil para: editar, comentar, aprobar y dar formato final.
- Ventaja: fácil de revisar en Word o Google Docs.
- Consejo: pide títulos, encabezados o secciones si el texto va a publicarse.
TXT
- Útil para: importar a herramientas de análisis, notas y sistemas que prefieren texto plano.
- Ventaja: limpio, ligero y estable entre plataformas.
- Consejo: define cómo van los saltos de línea (por hablante o por párrafo).
SRT
- Útil para: subtítulos en muchas plataformas de vídeo.
- Incluye: numeración, tiempos de entrada/salida y líneas de texto.
- Consejo: especifica si quieres subtítulos literales o adaptados (más cortos).
VTT
- Útil para: web y reproductores que trabajan bien con WebVTT.
- Ventaja: más compatible con entornos web modernos.
- Consejo: si lo usarás en un LMS o intranet, confirma qué formato acepta.
Combinación típica que funciona: DOCX + SRT/VTT si vas a editar el texto y también publicarlo como subtítulos. Si estás comparando entrevistas, TXT + etiquetas de hablante + timestamps suele acelerar búsquedas y extracción de citas.
Etiquetas de hablante y timestamps: reglas simples que evitan confusión
Las etiquetas y las marcas de tiempo convierten una transcripción en una herramienta de trabajo. Sin ellas, localizar un fragmento o saber quién dijo qué puede llevar más tiempo que transcribir.
Decisiones clave sobre hablantes
- ¿Cuántos hablantes hay? Si son muchos, usa “HABLANTE 1, 2, 3…” y añade una tabla de equivalencias.
- ¿Usas nombres reales? Solo si tienes permiso y lo necesitas; si no, usa roles (Entrevistador/Invitado).
- ¿Qué haces con voces puntuales? Define una etiqueta para “OTRA PERSONA” o “PÚBLICO”.
Cuándo usar timestamps (y con qué frecuencia)
- Cambio de hablante: ideal para entrevistas y reuniones donde necesitas citar rápido.
- Cada 1–2 minutos: útil para clases largas y revisiones, sin saturar el texto.
- Solo en inaudibles: opción mínima si quieres poder volver al audio en puntos problemáticos.
Si vas a crear subtítulos, pide directamente SRT o VTT y evita pedir “timestamps” dentro de un DOCX como sustituto. Cada cosa sirve para un flujo distinto.
Reglas de QA: cómo definir calidad sin complicarlo
QA no significa “perfección”, significa que el resultado cumple tus reglas. Si defines QA con ejemplos, reduces interpretaciones.
Checklist de QA que puedes pegar en tu plan
- Consistencia: mismas etiquetas de hablante y mismo criterio de puntuación en todo el documento.
- Exactitud de nombres: usar la lista de nombres y mantener tildes y apellidos.
- Numerales: mismo criterio para números, cantidades, porcentajes y horas.
- Inaudibles: marcar claramente y no “adivinar”.
- Audio con ruido: si hay tramos imposibles, señalarlos con timestamps para que puedas decidir.
- Entrega final: revisión ortográfica y limpieza de formato (saltos, guiones, etc.).
Ejemplos de reglas claras (mejor que “hazlo bien”)
- Muletillas: “Eliminar muletillas excepto cuando cambien el sentido o muestren duda importante”.
- Risas: “Incluir (ríe) solo cuando cambie el tono o la interpretación”.
- Inaudible: “Usar [inaudible 00:12:34] si no se entiende una palabra o frase”.
Si el texto va a auditoría, legal o cumplimiento, define también reglas de literalidad (verbatim) y cómo marcar interrupciones. Si el texto es para contenido, prioriza legibilidad y clean verbatim.
Cómo unos requisitos claros reducen retrabajo y aceleran el análisis
La mayoría del retrabajo viene de decisiones tomadas tarde: “ah, necesitábamos SRT”, “cambia los hablantes por nombres”, “añade timestamps cada dos minutos”. Cada cambio obliga a reestructurar el documento o rehacer partes.
- Menos idas y vueltas: el equipo recibe menos preguntas y tú revisas menos versiones.
- Mejor búsqueda: con timestamps y hablantes, encuentras citas en segundos.
- Comparación más rápida: si todas las entrevistas siguen el mismo estilo, puedes detectar patrones sin “normalizar” textos.
- Subtitulación sin fricción: pedir SRT/VTT desde el inicio evita convertir un DOCX a mano.
En proyectos con varias piezas, un plan único también ayuda a que diferentes personas transcriban con el mismo criterio, aunque trabajen en días distintos.
Errores comunes al pedir una transcripción (y cómo evitarlos)
- Pedir “lo de siempre”: lo de siempre cambia según el proyecto; usa la plantilla como estándar.
- No enviar glosario: nombres y términos técnicos generan la mayoría de correcciones evitables.
- No decidir el tipo de transcripción: verbatim vs limpia cambia el resultado y el tiempo de revisión.
- Marcas de tiempo ambiguas: “pon timestamps” no define frecuencia ni formato.
- Olvidar la privacidad: si hay datos sensibles, define anonimización y acceso desde el inicio.
Common questions
¿Qué diferencia hay entre transcripción verbatim y clean verbatim?
Verbatim recoge todo tal cual (muletillas, repeticiones y errores), mientras que clean verbatim limpia el texto para que se lea mejor sin cambiar el sentido. Elige verbatim si necesitas literalidad; elige limpia si vas a editar o analizar ideas.
¿Debo pedir DOCX o TXT para análisis?
TXT suele ir mejor si vas a pegar el contenido en herramientas o bases de datos. DOCX va mejor si vas a revisar y comentar con otras personas.
¿Cada cuánto pongo timestamps para una entrevista?
Una opción práctica es “en cada cambio de hablante”. Si la entrevista es muy dinámica, también funciona cada 1–2 minutos para mantener el documento ligero.
¿SRT y VTT sirven para lo mismo?
Ambos son formatos de subtítulos, pero no siempre los admite el mismo reproductor. Si tu plataforma no está clara, pide ambos para evitar conversiones.
¿Qué hago si no conozco los nombres de los hablantes?
Usa HABLANTE 1, HABLANTE 2, etc., y luego añade una tabla de equivalencias cuando identifiques quién es quién. Es mejor que usar nombres “a ojo”.
¿Cómo se marcan partes inaudibles?
Define una etiqueta fija, por ejemplo [inaudible], y decide si debe llevar timestamp. Evita pedir que “se complete como sea”, porque introduce errores.
¿Necesito subtítulos para accesibilidad?
Si publicas vídeo para audiencias diversas, los subtítulos ayudan a seguir el contenido sin audio. Para orientación general sobre subtitulado y accesibilidad web, puedes revisar la referencia de WCAG del W3C.
Si quieres convertir esta plantilla en un proceso repetible, GoTranscript puede ayudarte con transcripciones, subtítulos y revisión según tus reglas. Puedes ver opciones en nuestros professional transcription services y, si necesitas un flujo más automático para borradores, también puedes considerar la transcripción automática o el servicio de corrección de transcripciones.