Blog chevron right Guías prácticas

Desidentificación segura antes de usar IA (checklist + reglas de redacción)

Michael Gallagher
Michael Gallagher
Publicado en Zoom abr. 15 · 18 abr., 2026
Desidentificación segura antes de usar IA (checklist + reglas de redacción)

Para usar herramientas de IA sin exponer datos personales, primero debes desidentificar el contenido: elimina o sustituye PII (datos de identificación personal) y otros identificadores sensibles con marcas de redacción consistentes.

En esta guía tienes un checklist práctico, reglas claras de redacción y un flujo de “dos versiones” para que puedas procesar con IA solo lo necesario y mantener una copia segura y completa fuera del entorno de IA.

Palabra clave principal: desidentificación antes de IA.

Key takeaways

  • Usa un flujo de dos versiones: una copia “original” protegida y una copia “para IA” desidentificada.
  • Redacta con marcadores estándar (por ejemplo, [NOMBRE], [TELÉFONO], [ID]) para no perder contexto.
  • No subas nunca a IA credenciales, documentos de identidad completos, datos bancarios o salud identificable salvo que tengas base legal y controles sólidos.
  • Haz una revisión final con búsqueda de patrones (emails, teléfonos, IBAN) y una segunda persona si el riesgo es alto.

Qué es la desidentificación y por qué importa antes de usar IA

La desidentificación es el proceso de eliminar o sustituir datos que identifican a una persona (directa o indirectamente) antes de compartir el contenido con terceros o con una herramienta.

Importa porque, si subes PII a una plataforma de IA, puedes perder control sobre quién accede al dato, dónde se almacena y cuánto tiempo permanece disponible.

PII, datos sensibles y “identificadores indirectos”

La PII incluye datos que identifican a alguien por sí solos (como un DNI) o combinados (como “cargo + empresa pequeña + fecha exacta”).

Además, hay datos especialmente delicados (salud, menores, biometría) que exigen más cuidado y, a menudo, no deberían salir de tu entorno.

Anonimización vs seudonimización (en simple)

Seudonimizar es sustituir identidades por códigos (por ejemplo, “Paciente 3”), pero tú conservas la llave para revertirlo.

Anonimizar busca que nadie pueda reidentificar a la persona, ni siquiera combinando fuentes, lo cual es difícil de garantizar en la práctica.

Checklist rápido antes de subir contenido a una herramienta de IA

Usa este checklist como “puerta de salida”: si algo falla, no subas el archivo hasta corregirlo.

1) Decide si realmente necesitas IA y qué parte del contenido

  • Define el objetivo: resumir, clasificar, extraer temas, redactar un email, etc.
  • Recorta: comparte solo el fragmento mínimo necesario (principio de minimización).
  • Elimina anexos y metadatos innecesarios (propiedades de documento, comentarios, historial de cambios).

2) Identifica PII y datos sensibles (escaneo manual + patrones)

  • Nombres y apellidos, alias, nombres de familiares.
  • Emails y nombres de usuario.
  • Teléfonos (móvil, fijo, extensiones internas si identifican a una persona).
  • Direcciones (domicilio, trabajo, ubicaciones concretas) y geolocalización.
  • Números de documento: DNI/NIE/pasaporte, permiso de conducir.
  • Identificadores internos: nº de empleado, nº de cliente, historial, expediente, ticket.
  • Datos financieros: IBAN, tarjeta, cuenta, nómina, facturas con datos personales.
  • Datos de salud y cualquier información médica asociada a una persona.
  • Menores: colegio, curso, tutor, datos de contacto, fotos o voces identificables.

3) Redacta usando marcadores estándar (y no “borres” el contexto)

  • Sustituye, no elimines sin más: mantén la estructura del texto para que la IA entienda el caso.
  • Usa el mismo marcador para el mismo tipo de dato (consistencia).
  • Si hay varias personas, numera: [PERSONA_1], [PERSONA_2].

4) Revisión final y prueba de “reidentificación”

  • Busca patrones: @, +34, 9 dígitos, “DNI”, “IBAN”, “ES”.
  • Lee el texto y pregúntate: “¿Podría alguien saber quién es con esto y una búsqueda rápida?”
  • Si el riesgo es alto, aplica revisión por segunda persona (doble control).

5) Control de archivos: nombres, rutas y capturas

  • Renombra archivos: evita “Entrevista_AnaGarcía_Despido_2026-04-01.mp3”.
  • Revisa capturas y pantallazos: suelen incluir nombres, notificaciones y reloj/ubicación.
  • Si subes audio/vídeo, considera que la voz puede identificar.

Reglas de redacción: marcadores estándar y ejemplos

Los marcadores te ayudan a ocultar el dato sin romper el significado del texto.

Evita poner asteriscos al azar o “XXX” sin tipo: dificultan la revisión y generan errores aguas abajo.

Marcadores recomendados (plantilla)

  • [PERSONA_1], [PERSONA_2] (nombres y apodos)
  • [EMPRESA], [CENTRO] (organizaciones si identifican)
  • [EMAIL]
  • [TELÉFONO]
  • [DIRECCIÓN], [CIUDAD], [CÓDIGO_POSTAL] (según necesidad)
  • [DNI], [NIE], [PASAPORTE]
  • [ID_INTERNO] (nº empleado/cliente/expediente)
  • [FECHA] o [FECHA_APROX] (p. ej., “marzo de 2026”)
  • [IMPORTE] (si no hace falta el número exacto)
  • [IBAN], [TARJETA] (mejor: no subir; ver sección “nunca”)

Cómo mantener utilidad sin revelar de más

  • Si el análisis necesita contexto, conserva rangos: “[EDAD: 30-40]” en lugar de “37”.
  • Generaliza ubicaciones: “[CIUDAD]” en lugar de calle y número.
  • Normaliza fechas: “[FECHA: 2026-04]” en lugar de día exacto si no es clave.

Ejemplo rápido (antes/después)

Antes: “Hola, soy Marta Ríos. Mi DNI es 12345678Z y vivo en Calle Mayor 14, 3ºB. Escríbeme a marta.rios@ejemplo.com o llámame al +34 600 123 456.”

Después: “Hola, soy [PERSONA_1]. Mi [DNI] es [DNI] y vivo en [DIRECCIÓN]. Escríbeme a [EMAIL] o llámame al [TELÉFONO].”

Flujo de dos versiones (recomendado): original protegido + versión para IA

Este flujo reduce errores porque separa lo que necesitas conservar por motivos legales u operativos de lo que puedes compartir para procesar con IA.

Versión A: “Original” (completa y restringida)

  • Guárdala en un entorno con control de acceso (solo quien lo necesite).
  • Evita reenviarla por email o adjuntarla en chats si no es imprescindible.
  • Define un responsable y un periodo de retención.

Versión B: “Para IA” (mínima y desidentificada)

  • Incluye solo el contenido necesario para el objetivo.
  • Aplica los marcadores estándar y una tabla de sustituciones si hace falta coherencia.
  • Elimina metadatos: autor del documento, comentarios, nombres de archivo, rutas.

Tabla de correspondencias (si la necesitas, mantenla fuera de la IA)

  • Si debes relacionar [PERSONA_1] con una persona real, guarda esa “llave” aparte.
  • No subas la tabla a la herramienta de IA.
  • Limita su acceso y registra cambios para evitar confusiones.

Qué no deberías subir nunca a herramientas de IA (guía práctica)

Esta lista es conservadora a propósito, porque el coste de un error puede ser alto.

Si necesitas procesar algo de esta lista, consulta primero a tu equipo legal/seguridad y usa herramientas con acuerdos, controles y configuración adecuados.

  • Credenciales: contraseñas, códigos 2FA, tokens API, claves privadas, frases semilla.
  • Datos de pago: número completo de tarjeta, CVV, datos de banca online, extractos con identificadores.
  • Identidades oficiales completas: DNI/NIE/pasaporte escaneado, fotos del documento, nº + letra junto con otros datos.
  • Datos de salud identificables: informes, diagnósticos, medicación con nombre de paciente o detalles que lo identifiquen.
  • Información de menores: nombres, centros, horarios, localización, imágenes o audio.
  • Datos biométricos: huella, reconocimiento facial, plantillas de voz, imágenes para identificación.
  • Información confidencial de empresa: secretos industriales, claves de cliente, acuerdos con NDA, estrategias no publicadas.

Ojo con estas “filtraciones invisibles”

  • Cabeceras de email con firmas completas.
  • Documentos con comentarios, revisiones y nombres de usuario en el historial.
  • Audio con nombres dichos en voz alta y referencias a lugares específicos.
  • Imágenes con pizarras, pantallas de CRM o listas de alumnos.

Errores comunes y cómo evitarlos

La mayoría de fallos ocurren por prisa o por falta de un método repetible.

Error 1: “Borrar nombres” pero dejar combinaciones que identifican

  • Problema: “Directora financiera de [PYME] en [pueblo] el 12/03/2026” puede señalar a una persona.
  • Solución: generaliza rol/fecha/ubicación: [CARGO], [CIUDAD], [FECHA_APROX].

Error 2: usar marcadores distintos para lo mismo

  • Problema: “Ana”, “A.”, “ARíos” y “la paciente” rompen la coherencia.
  • Solución: define un diccionario: “Ana Ríos” → [PERSONA_1] y aplícalo en todo.

Error 3: subir el archivo original “solo para probar”

  • Problema: el contenido ya salió de tu control.
  • Solución: crea una plantilla de versión “para IA” y úsala siempre, aunque sea un test.

Error 4: olvidar el nombre del archivo y los metadatos

  • Problema: el nombre del archivo puede contener PII y los metadatos pueden revelar autor o empresa.
  • Solución: renombra con un ID neutro y exporta a un formato limpio cuando sea posible.

Error 5: no documentar qué se ha redactado

  • Problema: luego no sabes qué significa [ID] o quién es [PERSONA_2].
  • Solución: añade una nota al inicio de la versión “para IA” con los marcadores usados y sus reglas.

Plantilla lista para copiar: protocolo de desidentificación antes de IA

Copia este bloque en tu proceso interno y ajústalo a tu caso.

  • Objetivo del uso de IA: ____________________
  • Contenido mínimo a compartir: ____________________
  • Versión A (original): ubicación segura ____________________
  • Versión B (para IA): nombre de archivo neutro ____________________
  • Marcadores: [PERSONA_#], [EMAIL], [TELÉFONO], [DIRECCIÓN], [ID_INTERNO], [FECHA/FECHA_APROX]
  • Generalización aplicada: edades/rangos, fechas aproximadas, ubicaciones por nivel.
  • Revisión de patrones: emails, teléfonos, IBAN, DNI, URLs internas.
  • Control de metadatos: propiedades del documento, comentarios, historial.
  • Verificación final: lectura + prueba de reidentificación.
  • Aprobación: responsable ____________________ fecha ____________________

Common questions

¿Es suficiente con tapar el nombre y el email?

No siempre, porque puedes identificar a alguien por combinaciones de datos como cargo, empresa pequeña, fechas exactas y ubicaciones concretas.

Aplica también generalización de contexto y revisa identificadores indirectos.

¿Puedo usar iniciales en lugar de marcadores?

Mejor usa marcadores como [PERSONA_1] porque las iniciales a veces siguen siendo identificables y generan inconsistencias.

Los marcadores también te permiten automatizar revisiones y mantener el sentido del texto.

¿Qué hago si necesito que la IA distinga entre varias personas?

Numera entidades: [PERSONA_1], [PERSONA_2], y mantén esa numeración estable en todo el documento.

Si necesitas correspondencia con personas reales, guarda la tabla fuera de la IA.

¿Cómo trato las fechas en entrevistas o casos legales?

Si el día exacto no es imprescindible, usa [FECHA_APROX] o mes y año.

Si sí es imprescindible, redáctalo todo lo demás con más rigor y limita el fragmento compartido.

¿La voz cuenta como dato personal?

Puede identificar, así que trata audio y vídeo como material de riesgo si aparece una voz reconocible.

Cuando puedas, trabaja con transcripciones desidentificadas en lugar de audio original.

¿Qué pasa con los metadatos de un Word o un PDF?

A menudo incluyen autor, organización, comentarios y rutas internas.

Antes de subir, exporta a un formato limpio o elimina propiedades y comentarios.

¿Debo seguir alguna norma o ley específica?

Si tratas datos personales en España/UE, normalmente necesitas cumplir el RGPD y aplicar medidas como minimización y seguridad.

Puedes revisar los principios en el texto del RGPD para entender obligaciones generales y vocabulario.

Cuándo te conviene transcribir y desidentificar antes (en vez de subir audio crudo)

Subir audio crudo puede exponer voces, nombres dichos en alto y detalles del entorno.

Una transcripción te permite redactar con precisión, hacer búsquedas de patrones y compartir solo el texto mínimo.

  • Si vas a resumir una reunión, comparte una versión “para IA” ya redactada.
  • Si necesitas subtítulos o accesibilidad, separa el trabajo de texto del material original.

Si parte de tu proceso incluye convertir audio o vídeo a texto, puedes combinar desidentificación y control de calidad con servicios especializados como revisión y corrección de transcripciones o, cuando el riesgo sea bajo y el contenido esté limpio, con transcripción automática.

Cuando quieras reducir riesgos antes de usar IA, GoTranscript puede ayudarte a preparar texto y entregables de forma ordenada, para que trabajes con la versión adecuada en cada paso mediante sus professional transcription services.