Blog chevron right Transcripciones

Archivar historias orales (audio y transcripciones): checklist de formatos y metadatos

Matthew Patel
Matthew Patel
Publicado en Zoom feb. 22 · 22 feb., 2026
Archivar historias orales (audio y transcripciones): checklist de formatos y metadatos

Para archivar historias orales con seguridad y que sigan siendo útiles dentro de años, necesitas tres cosas: formatos de archivo estables, metadatos claros y una rutina de verificación (checksums) con una estructura de carpetas consistente. Si lo haces bien desde el principio, reduces pérdidas, confusiones y problemas de acceso en entrevistas restringidas.

En esta guía tienes un checklist completo para preparar audio, transcripciones y materiales asociados antes de entregarlos a un archivo, una biblioteca o un repositorio interno.

Palabra clave principal: archivar historias orales

Key takeaways

  • Guarda un máster en WAV sin compresión y crea copias de acceso en MP3/AAC.
  • Usa una estructura de carpetas por entrevista y nombres de archivo consistentes.
  • Incluye metadatos mínimos (quién, qué, cuándo, dónde, derechos) y metadatos técnicos (formato, duración, tasas).
  • Genera checksums (por ejemplo, SHA-256) y repite controles de integridad.
  • Define desde el inicio niveles de acceso para entrevistas restringidas (embargos, anonimización y roles).

1) Qué significa “preparar” una historia oral para archivar

Preparar una historia oral no es solo “guardar el audio” en una carpeta. Consiste en organizar, describir y proteger los ficheros para que otra persona (o tú mismo dentro de años) pueda encontrarlos, entenderlos y usarlos sin romper permisos.

En la práctica, vas a crear un “paquete” por entrevista con versiones máster y de acceso, documentación, metadatos y controles de integridad.

Qué materiales conviene incluir

  • Audio máster (la mejor calidad disponible).
  • Audio de acceso (más ligero para consulta).
  • Transcripción (idealmente en formatos editables y de preservación).
  • Consentimientos y cesiones (si existen).
  • Notas de entrevista (contexto, incidencias, listado de temas).
  • Material extra (fotografías, documentos escaneados, índices de temas).

2) Formatos recomendados (máster, preservación y acceso)

El objetivo es separar “lo que preservas” de “lo que facilitas para consulta”. Así no sacrificas calidad por comodidad y evitas editar el máster por error.

Audio: qué guardar y en qué formato

  • Máster de preservación: WAV (PCM) sin compresión.
  • Acceso/consulta: MP3 o AAC (más pequeños para escuchar en web o intranet).
  • Evita como máster: formatos con pérdida como MP3.

Si puedes elegir parámetros de grabación, prioriza consistencia entre entrevistas. Si ya tienes audios heterogéneos, documéntalo en metadatos técnicos en vez de “arreglarlo” con conversiones repetidas.

Transcripciones: formatos útiles para archivo

  • Edición: DOCX u ODT para revisión.
  • Preservación y lectura estable: PDF/A cuando necesites un documento cerrado.
  • Datos reutilizables: TXT o HTML para búsquedas y extracción.

Si trabajas con subtítulos o tiempo-código, guarda también una versión en formato de subtitulado (por ejemplo, SRT o VTT) como material de acceso.

Escaneos e imágenes (consentimientos, fotos)

  • Preservación: TIFF (sin compresión o con compresión sin pérdida).
  • Acceso: JPEG o PDF para consulta rápida.

Un apunte sobre estándares

Si entregas el material a una institución, pregunta qué estándar de preservación sigue y ajusta formatos y metadatos a su flujo. Para orientarte, puedes consultar recomendaciones generales como las de la Library of Congress sobre formatos sostenibles.

3) Metadatos: campos mínimos que te ahorran problemas

Los metadatos describen el contenido, el contexto y las condiciones de uso. Cuanto más consistente seas, más fácil será buscar, filtrar y respetar restricciones.

Metadatos descriptivos (para encontrar y entender)

  • Identificador único: código de entrevista (por ejemplo, OH_2026_001).
  • Título: “Entrevista a [Nombre] (tema/proyecto)”.
  • Entrevistado/a: nombre completo (y alias si aplica).
  • Entrevistador/a: nombre completo.
  • Fecha: ISO 8601 (YYYY-MM-DD) y zona horaria si importa.
  • Lugar: ciudad, provincia, país (o “online”).
  • Idioma(s): principal y secundarios.
  • Resumen: 3–6 líneas con el contenido clave.
  • Temas/keywords: lista controlada si puedes (para consistencia).
  • Personas/organizaciones mencionadas: si tu política lo permite.

Metadatos técnicos (para conservar y reproducir)

  • Formato: WAV/MP3/PDF/A, etc.
  • Códec: PCM, AAC, etc.
  • Frecuencia de muestreo y bit depth (si es audio).
  • Canales: mono/estéreo.
  • Duración: tiempo total.
  • Tamaño del archivo: útil para controles y transferencias.
  • Software/equipo: grabadora o plataforma (si es relevante).

Metadatos administrativos y de derechos (para usar sin riesgos)

  • Derechos: quién es el titular y qué licencias existen.
  • Consentimiento: existe/no existe y dónde está el documento.
  • Restricciones: público, interno, restringido, embargo hasta fecha.
  • Condiciones de cita: cómo atribuir la entrevista.
  • Datos personales sensibles: si requiere tratamiento especial.

Si trabajas en España o con residentes en la UE, revisa tus obligaciones de protección de datos. Como referencia normativa, puedes consultar el RGPD (Reglamento General de Protección de Datos) para entender principios como minimización y limitación de acceso.

Dónde guardar los metadatos

  • En un fichero por entrevista: metadata.json, metadata.xml o metadata.csv.
  • En un inventario general: una hoja de cálculo maestra para todo el proyecto.
  • En el repositorio: si tu archivo tiene un formulario o sistema (mejor, porque fuerza consistencia).

Evita depender solo de metadatos incrustados en un DOCX o en propiedades de archivo. Guarda siempre una copia “visible” y exportable.

4) Checksums (sumas de verificación): cómo y cuándo usarlos

Un checksum te dice si un archivo cambió, aunque el nombre sea el mismo. Es una de las formas más simples de detectar corrupción, errores de copia o cambios accidentales.

Qué algoritmo elegir

  • Recomendado: SHA-256 (ampliamente usado y robusto).
  • Evita como única opción: MD5, porque ya no se considera fuerte para ciertos usos.

Cuándo generarlos y verificarlos

  • Al cerrar la edición: cuando declares “esta es la versión final máster”.
  • Tras cada transferencia: si mueves a disco externo, servidor o nube.
  • En revisiones periódicas: según tu política (por ejemplo, anual o semestral).

Cómo guardarlos

  • Crea un fichero checksums.sha256 dentro de cada carpeta de entrevista.
  • Incluye la ruta relativa del archivo para evitar ambigüedades.
  • Registra la fecha de generación y la herramienta usada en un README.

Si tu repositorio institucional ya calcula checksums al ingresar, conserva aun así los tuyos para comparar durante la transferencia.

5) Estructura de carpetas y nombres de archivo (plantilla lista para usar)

Una buena estructura evita que el proyecto dependa de una sola persona. También simplifica automatizar copias, verificaciones y controles de acceso.

Estructura recomendada por entrevista

  • /Coleccion_HistoriasOrales/
    • /OH_2026_001_ApellidosNombre/
      • /01_master/ (solo máster, sin editar)
      • /02_access/ (copias para consulta)
      • /03_transcripts/ (DOCX/ODT, TXT, PDF/A)
      • /04_metadata/ (JSON/CSV, formularios exportados)
      • /05_rights_restrictions/ (consentimientos, embargos)
      • /06_derivatives/ (clips, extractos, subtítulos)

Convención de nombres (ejemplo)

  • Identificador + fecha + tipo + versión
  • Ejemplos:
    • OH_2026_001_2026-02-22_audio_master.wav
    • OH_2026_001_2026-02-22_audio_access.mp3
    • OH_2026_001_2026-02-22_transcript_editable.docx
    • OH_2026_001_2026-02-22_transcript_preservation.pdf
    • OH_2026_001_metadata.json
    • OH_2026_001_checksums.sha256

README por entrevista (muy recomendable)

  • Qué contiene la carpeta y qué no.
  • Qué versión es la “oficial” de cada tipo de archivo.
  • Restricciones de acceso y contacto responsable.
  • Historial de cambios si hubo ediciones (por ejemplo, anonimización).

6) Checklist de preservación a largo plazo y controles de acceso

Este checklist te ayuda a cerrar el paquete antes de depositarlo. También te sirve para auditorías internas y para que el equipo trabaje igual.

Checklist: preservación

  • He guardado un audio máster en WAV (PCM) y no lo uso para editar.
  • He creado audio de acceso (MP3/AAC) con un nombre distinto.
  • He guardado transcripción en editable (DOCX/ODT) y en lectura (PDF/A o PDF).
  • He incluido un README con decisiones y versiones.
  • He generado checksums (SHA-256) para todos los ficheros finales.
  • He verificado checksums tras copiar a la ubicación final.
  • He guardado los ficheros en una estructura estable y consistente por entrevista.
  • He creado un inventario del proyecto (tabla general con identificadores).
  • He revisado que no hay duplicados confusos ("final_final_v3").
  • He definido un plan de copias (al menos dos ubicaciones distintas).

Checklist: acceso y entrevistas restringidas

  • He marcado el nivel de acceso: público, interno, restringido o bajo embargo.
  • He documentado la base de la restricción (consentimiento, riesgo, acuerdo).
  • He definido quién puede acceder (roles, no personas) y cómo se autoriza.
  • He separado físicamente (o por permisos) los ficheros restringidos en una carpeta controlada.
  • He creado una versión de acceso anonimizada o redactada si hace falta.
  • He registrado una fecha de revisión de la restricción (por ejemplo, al terminar un embargo).
  • He comprobado que el repositorio donde se publica respeta permisos y logs.

Criterios prácticos para decidir si restringir

  • La entrevista incluye datos personales sensibles o terceros identificables.
  • El entrevistado pidió anonimato o límites de uso.
  • Hay riesgos para seguridad, reputación o contexto político.
  • Hay derechos de autor o de imagen no resueltos.

Si dudas, prioriza una opción intermedia: conservar el máster con acceso restringido y crear una copia de acceso editada con las partes sensibles protegidas.

Common questions

¿Debo limpiar el audio antes de archivarlo?

Si haces limpieza, guarda siempre el audio original y documenta la edición. Lo más seguro es archivar el original como máster y la versión tratada como derivado para acceso.

¿Qué pasa si solo tengo el audio en MP3?

Puedes archivarlo, pero no lo “mejoras” convirtiéndolo a WAV, porque no recuperas calidad. En ese caso, conserva el MP3 como máster disponible y documenta el origen y parámetros en metadatos.

¿Es mejor una transcripción literal o editada?

Depende del objetivo, pero suele ayudar guardar ambas si puedes. Una literal facilita investigación y citas; una editada mejora legibilidad y acceso público, siempre que documentes criterios.

¿Cómo gestiono nombres con tildes o caracteres especiales?

Para nombres de archivo, usa un estilo simple (A-Z, 0-9, guiones y guion bajo) y evita espacios. Guarda los nombres correctos con tildes en los metadatos, que sí deben respetar la ortografía.

¿Necesito timecodes en la transcripción?

No siempre, pero ayudan mucho a la búsqueda y a la verificación. Si el proyecto prevé reutilización en vídeo, extractos o subtítulos, incorpora marcas de tiempo (cada minuto o por cambios de tema).

¿Cómo comparto entrevistas restringidas sin perder el control?

Usa un sistema con permisos por rol, acceso con registro y enlaces no públicos. Además, comparte versiones redactadas cuando sea posible y evita enviar másters por correo.

¿Qué hago con consentimientos en papel?

Escanéalos y guárdalos como parte del paquete (en la carpeta de derechos), con acceso restringido si contienen datos personales. Registra en metadatos dónde está el original físico.

Siguiente paso: transcripciones y copias listas para archivar

Cuando el audio y las transcripciones están bien preparados, el archivo gana en acceso, control y preservación. Si necesitas convertir entrevistas en texto, revisar una transcripción o generar formatos de acceso, GoTranscript puede ayudarte con professional transcription services para que tu colección quede lista para conservar y consultar.

También puede interesarte: revisión de transcripciones y closed caption services.