Blog chevron right Legal

Usar transcripción con IA en investigación con participantes humanos: checklist de riesgos del CEI/IRB y controles

Michael Gallagher
Michael Gallagher
Publicado en Zoom feb. 21 · 24 feb., 2026
Usar transcripción con IA en investigación con participantes humanos: checklist de riesgos del CEI/IRB y controles

La transcripción con IA puede acelerar el trabajo en estudios con participantes humanos, pero también puede introducir riesgos de confidencialidad y cumplimiento que tu CEI/IRB puede rechazar. Para evaluarla bien, revisa cinco puntos: quién procesa los datos (terceros), cuánto tiempo se guardan (retención), dónde se alojan (residencia), qué trazabilidad ofrece (auditoría) y cómo proteges la identidad (confidencialidad). Abajo tienes un checklist de riesgos y controles concretos para reducirlos, sabiendo que cada CEI/IRB puede pedir cosas distintas.

Palabra clave principal: transcripción con IA en investigación con participantes humanos.

Key takeaways

  • Antes de usar IA, confirma si el audio contiene datos identificativos y si el proveedor actúa como tercero que “trata” datos.
  • Define por escrito: retención, ubicación de los datos, quién accede, y cómo registrarás cambios y accesos.
  • Mitiga con controles simples: herramienta aprobada, redacción antes de subir, acceso restringido y revisión humana de segmentos sensibles.
  • No hay un estándar único: distintos CEI/IRB aceptan o rechazan la IA según su interpretación del riesgo y del contrato.

Qué suele preocupar a un CEI/IRB cuando usas transcripción con IA

Un CEI/IRB se centra en proteger a las personas y reducir el riesgo de daño, especialmente por pérdida de confidencialidad. La transcripción con IA afecta a ese riesgo porque implica copiar audio a texto y, a menudo, enviarlo a un proveedor externo.

En la práctica, estas son las áreas que más preguntas generan en la revisión:

  • Confidencialidad: si el material incluye nombres, lugares, rostros, voces, historias clínicas o detalles únicos que identifiquen.
  • Procesamiento por terceros: si el proveedor de IA (y sus subencargados) accede a los datos.
  • Retención y borrado: cuánto tiempo guardan audio, transcripción y metadatos, y cómo se borran.
  • Residencia/transferencias: en qué país o región se almacenan y procesan los datos.
  • Auditabilidad: si puedes demostrar quién accedió, qué se subió, qué cambió y cuándo.

Si trabajas en España o la UE, además de tu CEI/IRB tendrás que considerar obligaciones de protección de datos (por ejemplo, RGPD). Puedes consultar el marco general en el sitio oficial de la UE sobre el Reglamento General de Protección de Datos (RGPD).

Checklist de evaluación del riesgo (IRB/CEI) para transcripción con IA

Usa este checklist como una plantilla para tu protocolo, tu plan de gestión de datos y, si aplica, tu evaluación de impacto. Adáptalo al tipo de estudio (entrevistas, focus groups, observación, clínica) y al nivel de sensibilidad.

1) Confidencialidad: qué datos hay realmente en el audio

  • ¿El audio incluye identificadores directos? (nombre, dirección, teléfono, email, DNI, historia clínica, cara, nombre del centro).
  • ¿Incluye identificadores indirectos o combinaciones que reidentifican? (cargo único, localidad pequeña, evento muy concreto).
  • ¿Hay poblaciones vulnerables o temas de alto riesgo? (salud, violencia, migración, menores).
  • ¿El consentimiento informa de que se usará un proveedor externo o IA para transcribir?

2) Terceros y cadena de tratamiento (quién “toca” los datos)

  • ¿La herramienta es local (offline) o en la nube?
  • Si es en la nube: ¿quién es el proveedor principal y qué subprocesadores usa?
  • ¿Existe contrato o condiciones que permitan el uso en investigación con datos sensibles?
  • ¿El proveedor usa tus datos para entrenar modelos por defecto, o puedes desactivarlo?

3) Retención, borrado y control de copias

  • ¿Puedes configurar retención cero o retención mínima?
  • ¿Qué se guarda: audio, texto, logs, IPs, identificadores del dispositivo?
  • ¿El borrado es inmediato o diferido, y se aplica también a copias de seguridad?
  • ¿Puedes descargar y borrar después, dejando el mínimo rastro?

4) Residencia de datos y transferencias internacionales

  • ¿Puedes elegir región (UE/EEE) para almacenamiento y procesamiento?
  • Si los datos salen de tu país: ¿tienes base legal y garantías adecuadas para la transferencia?
  • ¿El CEI/IRB exige residencia específica (p. ej., “solo servidores institucionales”)?

5) Seguridad y control de acceso (antes, durante y después)

  • ¿Usas cuentas individuales y autenticación multifactor?
  • ¿Aplicas el principio de mínimo privilegio (solo accede quien lo necesita)?
  • ¿Cifras los archivos en reposo y en tránsito, y controlas las descargas?
  • ¿Separás datos identificativos del contenido (archivo de claves separado)?

6) Auditabilidad y trazabilidad (lo que te pedirán que demuestres)

  • ¿Puedes registrar quién subió el audio, cuándo, y desde qué cuenta?
  • ¿Tienes historial de versiones de la transcripción (IA vs edición humana)?
  • ¿Conservas un log de accesos y descargas para auditoría interna?
  • ¿Puedes documentar el flujo de datos de extremo a extremo (diagrama simple)?

7) Calidad, sesgos y daño por error de transcripción

  • ¿La precisión es suficiente para el objetivo (codificación cualitativa, citas, análisis temático)?
  • ¿Hay acentos, mezcla de idiomas o ruido que aumenten errores?
  • ¿Un error podría causar daño? (malinterpretación en contextos clínicos o legales).

Controles de mitigación: qué poner en el protocolo para bajar el riesgo

Estos controles suelen funcionar porque traducen el riesgo a acciones verificables. No todos aplican a todos los estudios, así que elige los que encajen con tu CEI/IRB y tu política institucional.

1) Usa herramientas aprobadas y documenta el motivo

  • Prioriza herramientas que tu universidad/hospital ya haya revisado y aprobado.
  • Guarda una ficha breve del proveedor: dónde procesa, cómo borra, y opciones de privacidad.
  • Evita “apps gratuitas” sin términos claros para datos sensibles.

2) Redacción antes de subir (cuando sea posible)

Si el riesgo principal es la identificación, intenta reducirlo antes del envío a terceros. Puedes:

  • Anonimizar el nombre del participante en el audio (p. ej., usar “P1” en la grabación si es viable).
  • Separar un tramo inicial con datos identificativos (presentaciones) y transcribirlo de forma local.
  • Silenciar o cortar segmentos con datos especialmente sensibles antes de subirlos.

3) Acceso restringido y entorno de trabajo controlado

  • Limita el acceso a un grupo pequeño (PI + personal autorizado) y revisa permisos cada cierto tiempo.
  • Evita compartir enlaces públicos o carpetas con “cualquiera con el link”.
  • Define dónde se guardan los ficheros finales (servidor institucional o repositorio cifrado).

4) Configura retención mínima y borrado verificable

  • Activa, si existe, una opción de no retención o retención corta.
  • Descarga la transcripción y borra audio/texto del proveedor cuando termines.
  • Documenta fechas: subida, descarga, borrado, y quién lo ejecutó.

5) Revisión humana de segmentos sensibles (y de todo lo que se cite)

La IA puede equivocarse más en nombres propios, términos clínicos o habla emocional, y esos errores pueden contaminar el análisis. Control útil:

  • Revisa manualmente los fragmentos que vayas a citar en publicaciones o informes.
  • Revisa y corrige segmentos sensibles (salud, violencia, menores, confesiones).
  • Marca “inaudible” o “no claro” cuando no puedas confirmar un pasaje sin inventar.

Si tu plan es combinar IA + revisión, puede ayudarte un flujo de corrección formal. Por ejemplo, puedes usar un servicio de revisión de transcripciones para normalizar calidad y reducir errores antes del análisis.

6) Separa identificadores y contenido (pseudonimización)

  • Guarda la tabla de correspondencias (P1→nombre real) en un archivo separado, cifrado y con acceso mínimo.
  • Usa códigos en nombres de archivos y dentro de la transcripción.
  • Elimina identificadores del texto lo antes posible, si no son necesarios para el análisis.

Cómo escribirlo para tu CEI/IRB: plantilla corta para el protocolo

Muchos rechazos vienen por falta de detalle, no porque la IA sea “prohibida”. Estas frases y puntos te ayudan a describir el proceso con claridad, en lenguaje simple.

Descripción del flujo de datos (2–6 líneas)

  • “Grabaremos entrevistas en un dispositivo cifrado y transferiremos los archivos a un almacenamiento institucional con acceso restringido.”
  • “La transcripción se realizará con [herramienta], configurada con retención mínima/no retención, y borraremos los archivos del proveedor tras la descarga.”
  • “Antes del análisis, eliminaremos identificadores directos del texto y mantendremos la tabla de códigos separada y cifrada.”

Controles (lista verificable)

  • Herramienta aprobada por la institución o revisada por el equipo de seguridad/privacidad.
  • Acceso por cuentas individuales + MFA.
  • Retención mínima y borrado documentado.
  • Redacción/corte de segmentos identificativos cuando sea posible.
  • Revisión humana de segmentos sensibles y de cualquier cita.

Plan de incidencias

Incluye un plan simple de qué harás si hay un acceso no autorizado o una subida accidental. Si estás en la UE, la gestión de brechas tiene requisitos y plazos bajo RGPD; puedes ver un resumen oficial en la Junta Europea de Protección de Datos (EDPB).

Errores comunes (y cómo evitarlos)

  • Asumir que “es anónimo” porque no pones el nombre: muchos detalles reidentifican, sobre todo en muestras pequeñas.
  • No mirar la configuración de retención: a veces el proveedor guarda audios o textos más tiempo del que esperas.
  • No controlar quién comparte archivos: un enlace reenviado puede romper la confidencialidad.
  • Usar la misma cuenta para todo el equipo: dificulta auditoría y responsabilidades.
  • Confiar en la IA para citas textuales: revisa siempre contra el audio antes de publicar.

Common questions

¿Mi CEI/IRB va a aceptar transcripción con IA?

Depende del tipo de datos, del proveedor y de tus controles. Dos CEI/IRB pueden llegar a decisiones distintas con el mismo estudio, así que presenta el flujo de datos y las mitigaciones de forma muy concreta.

¿Basta con “quitar nombres” para que sea seguro?

No siempre, porque hay identificadores indirectos (lugares, cargos, eventos) que pueden reidentificar. Lo más sólido suele ser combinar redacción, pseudonimización y control de accesos.

¿Qué debo preguntar al proveedor de transcripción con IA?

Pregunta por: subprocesadores, residencia de datos, retención/borrado, uso para entrenamiento, cifrado, controles de acceso y logs. Si no te lo responden por escrito, es difícil justificarlo ante un CEI/IRB.

¿Puedo usar una herramienta “consumer” si firmo el consentimiento?

Aunque el consentimiento ayude, tu institución puede prohibir ciertas herramientas por política interna o por falta de garantías contractuales. Revisa siempre el marco institucional antes de basarte solo en el consentimiento.

¿Cuándo conviene transcripción humana en vez de IA?

Cuando el audio sea muy sensible, el riesgo de identificación sea alto, o necesites precisión alta para citas y análisis finos. También cuando tu CEI/IRB no acepte procesamiento en la nube o exija controles que la herramienta no ofrece.

¿Cómo gestiono entrevistas con varias personas (focus groups)?

Define reglas de nombrado (“Moderador”, “P1”, “P2”), limita la distribución del audio y revisa con especial cuidado los tramos donde alguien menciona a terceros o datos de salud. Si puedes, informa al grupo de que evite decir nombres y datos identificativos durante la sesión.

¿Qué guardo para poder auditar el proceso?

Guarda: versión final de la transcripción, registro de quién la revisó, fechas de subida/descarga/borrado, y el diagrama del flujo de datos. Mantén los logs y la tabla de códigos en un entorno seguro y con acceso mínimo.

Elegir un enfoque práctico: matriz rápida de decisión

Si necesitas decidir rápido, usa esta matriz simple basada en sensibilidad y restricciones del CEI/IRB. No reemplaza la revisión ética, pero te ayuda a justificar el “por qué” de tu elección.

  • Bajo riesgo (sin datos sensibles, muestra amplia): IA con retención mínima + revisión humana ligera.
  • Riesgo medio (identificadores indirectos, temas personales): IA + redacción previa + acceso muy limitado + revisión humana de segmentos críticos.
  • Alto riesgo (salud, menores, violencia, contexto pequeño): transcripción en entorno controlado, minimizando terceros; revisión humana completa; y medidas extra de pseudonimización.

Si tu equipo combina IA con un flujo de trabajo más controlado, puede interesarte una solución de transcripción automática para el primer borrador, seguida de corrección y redacción antes de análisis.

Conclusión

La transcripción con IA no es “sí o no” en investigación con participantes humanos, sino un equilibrio entre eficiencia y riesgo. Si describes bien el flujo de datos y aplicas controles claros (herramienta aprobada, redacción previa, acceso restringido, retención mínima y revisión humana), aumentarás la probabilidad de que tu CEI/IRB lo vea como un proceso responsable.

Si necesitas convertir audio en texto con un proceso más controlado o combinar IA con revisión, GoTranscript puede ayudarte a elegir el enfoque adecuado y a ejecutar el trabajo con professional transcription services.