Blog chevron right Guías prácticas

Lenguaje para un Plan de Gestión de Datos (DMP) sobre transcripción: párrafos para copiar y pegar en subvenciones

Christopher Nguyen
Christopher Nguyen
Publicado en Zoom mar. 8 · 8 mar., 2026
Lenguaje para un Plan de Gestión de Datos (DMP) sobre transcripción: párrafos para copiar y pegar en subvenciones

Si necesitas redactar un Plan de Gestión de Datos (DMP) para una subvención y tu estudio incluye grabaciones y transcripción, puedes usar lenguaje estándar y adaptarlo al nivel de sensibilidad del proyecto.

A continuación tienes párrafos listos para copiar y pegar sobre grabación de audio, enfoque de transcripción, desidentificación, almacenamiento/seguridad, planes de compartición y retención/destrucción, con tres versiones (mínima, moderada y alta sensibilidad).

  • Palabra clave principal: lenguaje DMP para transcripción

Key takeaways

  • El DMP debe describir el ciclo completo: grabación → transcripción → desidentificación → almacenamiento → compartición → retención y destrucción.
  • Prepara versiones por sensibilidad: no todos los proyectos necesitan el mismo nivel de controles.
  • Evita promesas vagas (“seguro”); concreta quién accede, dónde se guarda, cómo se cifra y cuándo se destruye.
  • Incluye cómo tratarás nombres propios y datos especiales antes de compartir o archivar.

Antes de copiar y pegar: qué debes personalizar sí o sí

Estos textos funcionan como base, pero tendrás que completar campos entre corchetes para que el DMP sea creíble y coherente con tu protocolo.

Como mínimo, decide y rellena: ubicación de almacenamiento (por ejemplo, servidor institucional), quién accede, plazos, herramientas y si habrá compartición externa.

  • Tipo de datos: entrevistas, grupos focales, consultas clínicas, sesiones educativas, etc.
  • Base legal/ética: consentimiento informado, limitaciones del comité de ética, y si el audio es necesario o se puede destruir pronto.
  • Datos personales: nombres, direcciones, empresa, cargo, voz identificable, etc.
  • Nivel de riesgo: bajo (tema general), moderado (datos laborales o sensibles indirectos), alto (salud, menores, violencia, migración, ilegalidad, etc.).

Plantilla “mínima” (estudios de baja sensibilidad)

Úsala si el tema es poco sensible, el riesgo de reidentificación es bajo y no hay categorías especiales de datos.

Grabación de audio

“Las entrevistas se grabarán en audio con dispositivos [grabadora digital/teléfono corporativo] únicamente tras obtener el consentimiento informado. Las grabaciones se realizarán en un entorno controlado y se etiquetarán con un identificador de estudio (por ejemplo, ID-###) sin incluir el nombre de la persona participante.”

Enfoque de transcripción

“La transcripción se realizará para convertir el audio en texto utilizable para análisis cualitativo. Se aplicará una transcripción verbatim (palabra por palabra) con limpieza ligera (por ejemplo, eliminación de muletillas) según el protocolo del estudio, y se registrarán incidencias de audio (ininteligible, solapamientos) cuando proceda.”

Desidentificación (anonimización/pseudonimización)

“Durante la preparación de las transcripciones se eliminarán o sustituirán datos personales directos (por ejemplo, nombres propios, teléfonos, correos) por etiquetas (por ejemplo, [NOMBRE], [TELÉFONO]). La lista de correspondencia entre ID y datos de contacto se guardará por separado y con acceso restringido.”

Almacenamiento y seguridad

“Los audios y transcripciones se almacenarán en [servidor institucional/entorno en la nube aprobado por la institución] con control de acceso por usuario y contraseña. Solo el personal del proyecto (PI y equipo autorizado) tendrá acceso. Se realizarán copias de seguridad según las políticas de [institución].”

Compartición y reutilización

“Las transcripciones desidentificadas podrán compartirse en formato [DOCX/TXT] con personas colaboradoras del proyecto bajo acuerdo de confidencialidad. No se compartirá audio fuera del equipo salvo necesidad justificada y aprobación ética.”

Retención y destrucción

“Los audios se conservarán hasta [fecha/hito: finalización del análisis/verificación] y después se eliminarán de forma segura. Las transcripciones desidentificadas se conservarán durante [X años] conforme a las políticas de [institución/financiador] y se destruirán o archivarán al finalizar el periodo de retención.”

Plantilla “moderada” (datos personales, riesgo medio, colaboración externa)

Úsala si hay datos personales o temas delicados, si trabajas con varios equipos o si prevés compartir datos con más controles.

Grabación de audio

“El equipo recogerá audio de entrevistas/grupos focales mediante dispositivos gestionados por el proyecto. Antes de grabar, se informará a las personas participantes del propósito, del uso de la transcripción y de las medidas de confidencialidad, y se obtendrá consentimiento informado. Cada archivo se nombrará con un identificador aleatorio (ID) y metadatos mínimos (fecha aproximada, tipo de sesión), evitando nombres y lugares exactos.”

Enfoque de transcripción (calidad y control)

“La transcripción se hará siguiendo una guía de estilo del estudio (por ejemplo, reglas para pausas, risas, solapamientos y palabras incompletas). El equipo revisará una muestra de transcripciones frente al audio para control de calidad y corregirá errores que afecten al significado. Cuando el audio sea ininteligible, se marcará con [inaudible mm:ss] para facilitar auditoría interna.”

Desidentificación y minimización

“Las transcripciones se pseudonimizarán sustituyendo identificadores directos e indirectos (por ejemplo, nombres, empresa, cargo muy específico, ubicaciones pequeñas) por categorías (por ejemplo, [EMPRESA], [CARGO], [CIUDAD]). Se aplicará minimización de datos: se conservará solo la información necesaria para los objetivos del estudio.”

Separación de llaves y control de acceso

“La ‘llave’ que vincula IDs con datos de contacto se almacenará en un repositorio separado del audio y las transcripciones, con acceso limitado al PI y a [rol]. El resto del equipo trabajará, cuando sea posible, con datos desidentificados.”

Almacenamiento, cifrado y transferencias

“Los datos se guardarán en [servidor institucional/unidad cifrada/servicio en la nube aprobado] con control de acceso basado en roles. Las transferencias de archivos se realizarán mediante canales aprobados por la institución (por ejemplo, enlace seguro con caducidad), evitando el envío de audio por correo sin cifrado. Los portátiles o soportes que contengan datos estarán cifrados y protegidos con contraseña.”

Uso de terceros (si aplica)

“Si se utiliza un proveedor externo para transcripción o revisión, se compartirá únicamente el mínimo necesario (preferiblemente audio ya recortado y sin metadatos). Se exigirá acuerdo de confidencialidad y se documentarán las instrucciones de desidentificación. El proveedor devolverá los archivos mediante canal seguro y eliminará copias tras la entrega, conforme al contrato.”

Compartición y acceso controlado

“Las transcripciones desidentificadas podrán compartirse con colaboradores externos para replicación o análisis secundario bajo condiciones de uso (por ejemplo, prohibición de reidentificación, no redistribución). Si se depositan datos en un repositorio, se valorará un acceso restringido y se adjuntará documentación (diccionario de etiquetas y guía de desidentificación).”

Retención y destrucción

“El proyecto conservará el audio identificable el tiempo mínimo necesario para verificación y control de calidad (por ejemplo, hasta [X meses] tras transcribir). Después se destruirá de manera segura. Las transcripciones desidentificadas y la documentación asociada se conservarán durante [X años] y se revisarán al final del periodo para decidir archivo o destrucción, según requisitos del financiador y del comité de ética.”

Plantilla “alta sensibilidad” (salud, menores, riesgos legales o reidentificación alta)

Úsala si el contenido puede causar daño si se filtra, si hay grupos vulnerables o si la voz es altamente identificable.

Grabación y minimización desde el origen

“El estudio grabará audio solo cuando sea imprescindible para los objetivos y con consentimiento explícito. Se minimizarán los datos desde el origen: se evitará recoger nombres completos, direcciones o datos identificativos no necesarios, y se recordará a las personas participantes que no mencionen terceros por nombre cuando sea posible. Se documentará cualquier limitación adicional impuesta por el comité de ética.”

Transcripción con controles reforzados

“La transcripción se realizará en un entorno controlado por el proyecto o mediante un proveedor aprobado por la institución, bajo acuerdo de confidencialidad y cláusulas de eliminación de datos. Se aplicarán controles de acceso estrictos (principio de mínimo privilegio) y trazabilidad interna de quién accede a qué archivos.”

Desidentificación avanzada y tratamiento de voz

“Las transcripciones se desidentificarán de forma robusta, eliminando identificadores directos e indirectos y generalizando detalles (por ejemplo, fechas exactas, ubicaciones pequeñas, nombres de organizaciones) cuando exista riesgo de reidentificación. Si se comparte cualquier material, se hará únicamente en formato de texto desidentificado; el audio no se compartirá externamente salvo obligación regulatoria o aprobación ética específica.”

Almacenamiento, cifrado y segmentación

“Los audios se almacenarán cifrados en repositorios institucionales con acceso restringido (PI y personal esencial). Se mantendrá segmentación: audio, transcripciones desidentificadas y llave de reidentificación estarán en ubicaciones distintas, con permisos distintos. Se prohibirá almacenar datos en dispositivos personales o en servicios no aprobados.”

Transferencia segura y trabajo remoto

“Cualquier transferencia se hará mediante soluciones seguras aprobadas (por ejemplo, SFTP o enlace cifrado con caducidad). Para trabajo remoto, el acceso se realizará mediante VPN institucional y autenticación multifactor cuando esté disponible. No se permitirá descargar audio a equipos no gestionados por la institución.”

Compartición: por defecto no, o acceso muy controlado

“Por el riesgo de reidentificación, no se prevé compartir datos identificables. Si se comparte texto desidentificado, se hará mediante acceso restringido (por ejemplo, repositorio con aprobación previa), con condiciones de uso que prohíban intentos de reidentificación, y con revisión adicional de desidentificación antes del depósito.”

Retención mínima y destrucción verificable

“El audio identificable se retendrá el mínimo tiempo posible (por ejemplo, hasta completar transcripción, verificación y auditoría interna) y después se destruirá de forma segura siguiendo los procedimientos de [institución]. La llave de reidentificación tendrá un periodo de retención separado y se destruirá antes que otros materiales cuando ya no sea necesaria.”

Bloques extra para completar tu DMP (opcionales, muy útiles)

Estos textos cortos te ayudan a cubrir huecos típicos que revisores y comités miran con lupa.

Formato de archivos y documentación

  • “Los audios se guardarán en formato [WAV/MP3] y las transcripciones en [TXT/DOCX] y/o [CSV] para análisis.”
  • “Se mantendrá un diccionario de etiquetas de desidentificación (por ejemplo, [NOMBRE], [HOSPITAL]) y una guía de transcripción para asegurar consistencia.”
  • “Los archivos incluirán metadatos mínimos (ID, fecha aproximada, tipo de sesión, idioma) para facilitar trazabilidad sin aumentar el riesgo.”

Gestión de consentimientos

  • “El consentimiento incluirá: finalidad de la grabación, si se conservará audio, si habrá transcripción por terceros y si habrá compartición de transcripciones desidentificadas.”
  • “Se respetarán retiradas de consentimiento según el protocolo, cuando sea aplicable y técnicamente posible (por ejemplo, antes de la desidentificación y el análisis agregado).”

Base legal y privacidad (si trabajas en la UE/España)

“El tratamiento de datos personales se realizará conforme al marco aplicable de protección de datos, incluyendo el RGPD y la normativa nacional. Se aplicarán principios de minimización, limitación de finalidad y control de acceso, y se documentarán las medidas técnicas y organizativas.”

Si necesitas citar norma, consulta el texto del RGPD (Reglamento (UE) 2016/679).

Accesibilidad y subtítulos (si el proyecto produce vídeos)

“Cuando el estudio genere material audiovisual para docencia o difusión, se crearán subtítulos o transcripciones para mejorar la accesibilidad, usando versiones desidentificadas si procede.”

Si tu proyecto tiene requisitos formales de accesibilidad digital, revisa las pautas WCAG 2.1 para orientar buenas prácticas.

Errores frecuentes al redactar lenguaje DMP para transcripción

  • Decir “guardaremos los datos de forma segura” sin explicar dónde, con qué controles y quién accede.
  • No separar la llave de reidentificación del resto de archivos.
  • No definir plazos para destruir audio y versiones intermedias.
  • Compartir audio cuando bastaría con texto desidentificado.
  • Olvidar a los terceros: si hay transcripción externa, describe contratos, transferencias y eliminación de copias.
  • No alinear el DMP con el consentimiento: lo que prometes a participantes debe coincidir con lo que escribes en la subvención.

Criterios rápidos para elegir versión (mínima, moderada o alta sensibilidad)

Si dudas, elige una versión más estricta y simplifica solo si el comité de ética lo permite y el riesgo es realmente bajo.

  • Mínima: temas generales, poca información identificable, uso interno del equipo.
  • Moderada: datos personales o colaboración externa, o riesgo de reidentificación razonable.
  • Alta sensibilidad: categorías especiales, grupos vulnerables, riesgo de daño alto, o voz/entorno muy identificable.

Common questions

  • ¿Debo prometer “anonimización” o “pseudonimización”?
    Usa “pseudonimización” si mantienes una llave para poder volver al origen. Usa “anonimización” solo si ya no puedes reidentificar de forma razonable.
  • ¿Es buena idea destruir el audio tras transcribir?
    A menudo sí, si no lo necesitas para verificación o si aumenta el riesgo. Indica un plazo mínimo que permita control de calidad y luego destrucción.
  • ¿Qué pongo si usaré un servicio de transcripción?
    Describe qué compartirás (audio o extractos), cómo lo transferirás, qué acuerdos firmarás (confidencialidad), y si el proveedor eliminará copias.
  • ¿Cómo describo la desidentificación sin revelar detalles del estudio?
    Habla en categorías: identificadores directos, indirectos, generalización, y revisión antes de compartir. Evita incluir listas con ejemplos demasiado específicos si el proyecto es sensible.
  • ¿Qué formatos son mejores para análisis cualitativo?
    TXT o DOCX suelen funcionar bien para revisión, y CSV/TSV ayudan si extraes variables o códigos. Lo importante es que uses formatos comunes y mantengas consistencia.
  • ¿Puedo compartir transcripciones en un repositorio abierto?
    Solo si el riesgo de reidentificación es bajo y el consentimiento lo permite. Si hay dudas, usa acceso restringido o comparte solo extractos desidentificados.
  • ¿Cuánto tiempo debo conservar las transcripciones?
    Depende del financiador, la institución y el comité de ética. En el DMP, define un periodo claro y un criterio de revisión al final del mismo.

Recursos de GoTranscript para tu flujo de transcripción

Si tu DMP incluye transcripción por terceros, revisión o creación de subtítulos, planifica desde el principio qué nivel de desidentificación necesitas y cómo gestionarás el intercambio de archivos.

GoTranscript puede ayudarte a encajar estas tareas en tu plan con soluciones de transcripción, revisión y accesibilidad, y puedes empezar revisando sus professional transcription services.