Blog chevron right Investigación

Plantilla de presupuesto de transcripción para ayudas de investigación (partidas + texto de justificación)

Michael Gallagher
Michael Gallagher
Publicado en Zoom abr. 16 · 19 abr., 2026
Plantilla de presupuesto de transcripción para ayudas de investigación (partidas + texto de justificación)

Una plantilla de presupuesto de transcripción para ayudas de investigación debe indicar partidas claras (minutos u horas), una suposición de tarifa, una contingencia y un texto breve que explique por qué la transcripción es necesaria para el método. Abajo tienes un modelo listo para copiar, más una guía rápida para estimar minutos a partir del número de entrevistas y para redactar la justificación en lenguaje de convocatoria.

La idea es sencilla: calcula cuántos minutos de audio/vídeo vas a generar, añade tareas que suelen olvidarse (marcas de tiempo, control de calidad, anonimización y formatos de entrega) y deja por escrito cómo la transcripción sostiene el análisis y la trazabilidad del estudio.

Key takeaways

  • Presupuesta por minutos de audio (o por horas) y especifica el nivel de detalle (verbatim, limpio, con marcas de tiempo).
  • Incluye partidas que suelen faltar: gestión de datos, anonimización, revisión y subtitulado si vas a difundir resultados en vídeo.
  • Añade una contingencia para repeticiones, mala calidad de audio o entrevistas extra.
  • En la justificación, vincula transcripción con rigor metodológico, auditoría y accesibilidad cuando aplique.

1) Qué suele pedir una convocatoria y cómo traducirlo a partidas

En muchas convocatorias te piden partidas “razonables”, “necesarias” y “medibles”, y que justifiques el cálculo. Para transcripción y captioning, lo medible casi siempre es el tiempo de grabación (minutos/horas) y el tipo de entrega (texto, subtítulos, formatos, revisiones).

Antes de escribir números, define estas decisiones porque cambian el coste y la narrativa:

  • Tipo de material: entrevistas 1:1, grupos focales, observación, sesiones clínicas, etc.
  • Idioma(s): uno o varios; si habrá traducción.
  • Nivel de transcripción: limpia (sin muletillas), verbatim (con repeticiones) o con notación adicional (risas, pausas).
  • Identificación de hablantes: “Entrevistador/Participante” o por nombre/código.
  • Marcas de tiempo: ninguna, cada 30–60 s, o por cambio de hablante.
  • Protección de datos: si necesitas anonimizar antes de analizar o compartir.
  • Difusión: si publicarás vídeos y necesitas subtítulos o closed captions.

2) Plantilla de presupuesto (lista de partidas + unidades + supuestos)

Usa esta plantilla tal cual y sustituye valores. Si tu presupuesto va por “costes unitarios”, te conviene expresar todo en €/minuto y luego convertir a total.

Tabla de partidas (para pegar en tu memoria económica)

  • Partida A. Transcripción de audio/vídeo
    • Unidad: minuto de grabación (min) o hora (h).
    • Cantidad: [TOTAL_MIN] min.
    • Tarifa asumida: [X] €/min (o [X] €/h).
    • Especificación: [transcripción limpia/verbatim] + [identificación de hablantes] + [marcas de tiempo cada 60 s / por turnos].
    • Subtotal: [TOTAL_MIN × X].
  • Partida B. Revisión/corrección de transcripciones (QA)
    • Unidad: minuto de grabación (min) o documento.
    • Cantidad: [TOTAL_MIN] min (o [N_DOC] documentos).
    • Supuesto: revisión de consistencia de nombres/códigos, terminología y segmentos inaudibles.
    • Tarifa asumida: [Y] €/min (o [Y] €/doc).
    • Subtotal: [TOTAL_MIN × Y].
  • Partida C. Anonimización/seudonimización
    • Unidad: documento o minuto.
    • Cantidad: [N_DOC] docs (o [TOTAL_MIN] min).
    • Supuesto: sustitución de nombres propios, ubicaciones y datos identificativos por códigos; creación de tabla de equivalencias (uso restringido).
    • Tarifa asumida: [Z] €/doc (o [Z] €/min).
    • Subtotal: [N_DOC × Z].
  • Partida D. Marcas de tiempo y segmentación para análisis
    • Unidad: minuto o documento.
    • Cantidad: [TOTAL_MIN] min.
    • Supuesto: timecodes regulares (p. ej., cada 60 s) o por cambio de hablante para facilitar codificación y citas.
    • Tarifa asumida: [W] €/min.
    • Subtotal: [TOTAL_MIN × W].
  • Partida E. Conversión de formatos y entregables
    • Unidad: paquete o documento.
    • Cantidad: [N_DOC] docs.
    • Incluye: DOCX/Google Docs/PDF; TXT; estructura para importación (p. ej., con etiquetas de hablante); nomenclatura estándar.
    • Tarifa asumida: [V] €/doc (o tarifa fija).
    • Subtotal: [N_DOC × V].
  • Partida F (opcional). Closed captions / subtítulos para materiales de difusión
    • Unidad: minuto de vídeo (min).
    • Cantidad: [VIDEO_MIN] min.
    • Supuesto: creación de archivos SRT/VTT, lectura y sincronización; estilo según plataforma.
    • Tarifa asumida: [C] €/min.
    • Subtotal: [VIDEO_MIN × C].
  • Partida G (opcional). Traducción del transcript o de subtítulos
    • Unidad: palabra o minuto (según proveedor).
    • Cantidad: [N_WORDS] palabras (o [TOTAL_MIN] min).
    • Supuesto: traducción para análisis comparado o difusión internacional; incluye revisión.
    • Tarifa asumida: [T] €/palabra (o [T] €/min).
    • Subtotal: [N_WORDS × T].
  • Partida H. Contingencia
    • Unidad: % del total de A–G.
    • Cantidad: [5–15] % (según riesgo).
    • Justificación: entrevistas adicionales, regrabaciones, audio de baja calidad, más hablantes o jerga técnica.
    • Subtotal: [(A–G) × %].

Supuestos de cálculo (texto corto para la memoria)

  • Unidad de medida: minutos de grabación efectiva (sin contar pausas largas no grabadas).
  • Nivel de detalle: [limpia/verbatim] con identificación de hablantes [sí/no].
  • Marcas de tiempo: [cada 60 s / por cambio de hablante / no].
  • Entrega: [DOCX + TXT / SRT/VTT / plantilla para software de análisis].
  • Contingencia: [X]% para cubrir variaciones en duración y calidad del audio.

3) Cómo estimar los minutos: de entrevistas y sesiones a total de grabación

Para una estimación defendible, empieza por el diseño del trabajo de campo y tradúcelo a minutos. Luego añade un margen por repeticiones, sesiones extra o entrevistas que se alargan.

Fórmula base (entrevistas)

  • Total minutos entrevistas = Nº de entrevistas × duración media (min) × factor de repetición (si aplica).
  • Total minutos grupos focales = Nº de grupos × duración media (min).
  • Total minutos sesiones/observación grabada = Nº de sesiones × duración media (min).
  • Total general = suma de todo lo anterior.

Ejemplo rápido (para que lo adaptes)

  • 20 entrevistas × 60 min = 1.200 min.
  • 4 grupos focales × 90 min = 360 min.
  • Total previsto = 1.560 min.
  • Contingencia 10% = 156 min extra (o % sobre el coste).

Guía de factores que cambian el esfuerzo (y tu contingencia)

  • Más hablantes (grupos): suele exigir más identificación y revisión.
  • Audio irregular (ruido, distancia al micro): aumenta los “inaudible” y la necesidad de aclaraciones.
  • Terminología técnica o nombres propios: sube la carga de control de calidad.
  • Entornos multilingües o code-switching: puede requerir transcriptores especializados o decisiones de traducción.
  • Requisitos de accesibilidad para difusión pública: añade subtitulado/captions.

4) Texto de justificación listo para copiar (métodos y presupuesto)

Debajo tienes bloques de texto que puedes copiar y ajustar. Mantén la justificación breve y ligada al método: qué aporta, para qué fase y cómo reduce errores.

A) Justificación metodológica (para “Metodología”)

“Las entrevistas y grupos focales se grabarán (audio/vídeo) y se transcribirán para disponer de un registro textual completo. La transcripción permitirá la codificación sistemática, la comparación entre casos y la extracción de citas con trazabilidad (marcas de tiempo), reforzando la consistencia del análisis cualitativo y la auditoría interna del proceso.”

B) Justificación de necesidad (para “Gastos elegibles / Subcontratación”)

“Se contempla la contratación del servicio de transcripción debido al volumen de grabaciones previsto y a la necesidad de estandarizar formato, identificación de hablantes y control de calidad. Externalizar esta tarea reduce retrasos en el calendario de análisis y evita cargas operativas que afectarían al trabajo de campo y a la codificación.”

C) Justificación de cálculo (para “Desglose del presupuesto”)

“El coste se estima en función de los minutos de grabación: [TOTAL_MIN] minutos (entrevistas: [A] min; grupos focales: [B] min; otras sesiones: [C] min) multiplicados por una tarifa unitaria de [X] €/min para transcripción con [nivel de detalle] e identificación de hablantes, más [Y] €/min para revisión. Se incluye una contingencia del [P]% para cubrir variaciones de duración, calidad del audio y entrevistas adicionales.”

D) Justificación de confidencialidad y tratamiento de datos (si aplica)

“Las transcripciones se entregarán con seudonimización/anonimización de datos identificativos (p. ej., nombres, ubicaciones, centros), para facilitar el análisis y la circulación interna de materiales minimizando riesgos de identificación. El manejo de datos personales seguirá la normativa aplicable en materia de protección de datos.”

E) Justificación de accesibilidad y difusión (si vas a publicar vídeo)

“Para la difusión de resultados en formato audiovisual se crearán subtítulos/closed captions. Estos materiales facilitan el acceso a personas con discapacidad auditiva y mejoran la reutilización del contenido en docencia y comunicación pública.”

Si necesitas encajar esta frase en un marco normativo europeo, puedes citar la referencia general a la Directiva (UE) 2016/2102 sobre accesibilidad de los sitios web y aplicaciones móviles del sector público cuando el proyecto publique contenidos en entornos del sector público.

5) Errores comunes al presupuestar transcripción y cómo evitarlos

Muchos presupuestos se caen en revisión porque no explican la unidad de medida, o porque olvidan tareas imprescindibles. Estos son los fallos más habituales y su solución.

  • Olvidar la revisión: añade una partida de QA o corrección, sobre todo con jerga o varios hablantes.
  • No definir “verbatim” vs “limpia”: especifica el nivel para evitar cambios de coste o entregas que no sirven para análisis.
  • No presupuestar anonimización: si vas a compartir transcripciones con el equipo, suele ser necesaria.
  • No prever formatos: pide DOCX/TXT y, si hay vídeo, SRT/VTT; así evitas trabajos manuales posteriores.
  • Contingencia inexistente: añade 5–15% según la incertidumbre del trabajo de campo.
  • Mezclar traducción con transcripción: sepáralo en partidas distintas, con unidades distintas.

6) Criterios para decidir: humana, automática o híbrida

Tu convocatoria puede permitir varios enfoques, pero conviene justificar la elección según el uso final (análisis, publicación, archivo). Estas preguntas te ayudan a decidir sin complicarte.

  • ¿Necesitas alta fidelidad para citas? Si vas a publicar citas textuales, prioriza revisión humana o transcripción humana.
  • ¿El audio es difícil? Ruido, solapamientos y acentos diversos suelen exigir más revisión.
  • ¿Qué plazos tienes? Un enfoque híbrido (borrador automático + corrección) puede encajar si defines bien el control de calidad.
  • ¿Vas a subtitular? Los subtítulos requieren segmentación y sincronización; cuéntalo como trabajo específico.

Si necesitas un primer borrador para acelerar, puedes valorar transcripción automática y luego una capa de revisión, por ejemplo con corrección de transcripciones.

Common questions

  • ¿Presupuesto en minutos de audio o en páginas de texto?
    Mejor en minutos u horas de grabación, porque es una unidad objetiva y se alinea con cómo tarifican muchos servicios.
  • ¿Qué nivel de detalle debería pedir para investigación cualitativa?
    Depende del método, pero suele bastar transcripción limpia con identificación de hablantes; el verbatim completo se usa cuando la forma de hablar es parte del análisis.
  • ¿Cómo justifico marcas de tiempo?
    Como apoyo a la trazabilidad: permiten localizar fragmentos en el audio y documentar citas y decisiones de codificación.
  • ¿Necesito incluir anonimización como partida separada?
    Sí si el proyecto trata datos personales y vas a compartir transcripciones; así demuestras que lo has previsto y lo puedes auditar.
  • ¿Cuánta contingencia es razonable?
    Usa un porcentaje moderado (p. ej., 5–15%) y explícalo con riesgos concretos: entrevistas más largas, audio deficiente o sesiones adicionales.
  • Si hago transcripción automática, ¿puedo presupuestar revisión?
    Sí, suele ser lo más defendible: el coste se reparte entre generación del borrador y corrección para alcanzar el estándar que exige el análisis.
  • ¿Cuándo tiene sentido presupuestar subtítulos además de transcripción?
    Cuando vas a publicar vídeos, impartir formación con material audiovisual o necesitas accesibilidad para audiencias con pérdida auditiva.

Si quieres convertir esta plantilla en un presupuesto listo para adjuntar, GoTranscript puede ayudarte con transcripción, revisión y subtitulado según las necesidades del proyecto. Puedes ver opciones en sus professional transcription services y adaptar las partidas a tu convocatoria.