Blog

Investigación

Estructura de carpetas para audio y transcripciones de investigación (plantilla de laboratorio)

Christopher Nguyen

Publicado en Zoom abr. 7 · 10 abr., 2026

Estructura de carpetas para audio y transcripciones de investigación (plantilla de laboratorio)

Una buena estructura de carpetas para investigación con audio y transcripciones evita pérdidas de archivos, errores de versiones y accesos indebidos en proyectos de entrevistas y grupos focales. La forma más segura y práctica es separar “materia prima” (audio y transcripción literal) de “derivados” (limpieza, codificación y publicaciones), y controlar el acceso por niveles. Abajo tienes una plantilla lista para usar, con permisos y ejemplos de nombres para que todo siga encontrándose incluso años después.

La clave: define un ID de participante, un ID de sesión y una convención de nombres estable; después, usa carpetas fijas para raw, clean, coded, consentimientos/IRB y entregables.

Keyword principal: estructura de carpetas para investigación

Key takeaways

Separa siempre raw (original) de clean (editado) y de coded (analítica).
Usa un sistema de nombres con Proyecto + Método + ID + Fecha + Versión y no lo cambies.
Define niveles de permisos (mínimo privilegio) para audio, transcripciones y documentos sensibles.
Guarda consentimientos/IRB en una zona restringida y enlaza con IDs, no con nombres reales.
Documenta cambios con un changelog y controla versiones para evitar sobrescrituras.

Plantilla de estructura de carpetas (lista para laboratorio)

Esta plantilla funciona bien para entrevistas y focus groups porque separa captura, procesamiento, análisis y publicación. Puedes copiarla tal cual y adaptarla a tu institución.

00_ADMIN/
- 00_README_proyecto.md
- 01_Contactos_equipo.md
- 02_Calendario_y_logistica/
- 03_Plantillas/ (guiones, emails, hojas de información)
- 04_Registro_cambios/ (changelog)
01_IRB_CONSENT/
- 01_IRB_aprobaciones/
- 02_Modelos_consentimiento/
- 03_Consentimientos_firmados/
- 04_Clave_IDs/ (tabla de correspondencia; acceso ultra restringido)
02_DATA_RAW/
- 01_Audio_raw/
- 02_Notas_campo_raw/
- 03_Transcripcion_raw/ (literal, con marcas de tiempo si aplica)
- 99_Import_checksum/ (hashes, logs de importación)
03_DATA_PROCESSED/
- 01_Audio_processed/ (normalizado, recortado, sin alterar el raw)
- 02_Transcripcion_clean/ (limpia, anonimizada según criterios)
- 03_Traducciones/ (si hay)
- 04_QA_validacion/ (listas de control, incidencias)
04_ANALYSIS/
- 01_Codebook/ (diccionario de códigos, definiciones)
- 02_Coding_outputs/ (NVivo/Atlas.ti/MAXQDA, etc.)
- 03_Memos/
- 04_Exports_figuras_tablas/
05_PUBLICATIONS/
- 01_Borradores/
- 02_Submisiones/
- 03_Suplementos/ (materiales, anexos)
- 04_Datasets_compartibles/ (solo lo permitido)
99_ARCHIVE/
- 01_Cierres_proyecto/
- 02_Entregables_finales/
- 03_Archivado_legal/

Si tu laboratorio gestiona varios estudios a la vez, crea una carpeta raíz por proyecto, por ejemplo: PROJ2026_EmpleoJoven/, y dentro usa la misma plantilla para que todo el equipo trabaje igual.

Convención de nombres (para encontrar archivos en proyectos de varios años)

Una convención sólida te salva cuando cambian miembros del equipo o cuando necesitas auditar decisiones. Evita nombres como “entrevista_final_final2.wav”.

Reglas simples (y muy útiles)

Formato fijo: PROJ–MÉTODO–ID–FECHA–ARTEFACTO–VERSIÓN.
Fecha: YYYY-MM-DD (ordena bien en carpetas).
IDs: usa IDs sin datos personales (P001, FG03, INT12).
Versión: v01, v02… (no uses “final”).
Sin espacios raros: usa guiones o guiones bajos.
Idioma: añade ES/EN si hay traducción.

Ejemplos listos para copiar

Audio raw: PROJ2026_INT_P001_2026-03-14_AUDIO_RAW_v01.wav
Transcripción raw: PROJ2026_INT_P001_2026-03-14_TRN_RAW_v01.docx
Transcripción limpia (anonimizada): PROJ2026_INT_P001_2026-03-14_TRN_CLEAN_ES_v02.docx
Traducción: PROJ2026_INT_P001_2026-03-14_TRN_CLEAN_EN_v01.docx
Salida de codificación: PROJ2026_CODEBOOK_v03.xlsx
Export NVivo/Atlas.ti: PROJ2026_CODING_EXPORT_2026-05-02_v01.xlsx
Memo: PROJ2026_MEMO_TemaConfianza_2026-05-10_v01.md

Consejo práctico: guarda un fichero “00_ADMIN/00_README_proyecto.md” con estas reglas, y enlázalo en la documentación del laboratorio.

Permisos por niveles (quién puede ver qué, y por qué)

En investigación cualitativa, el riesgo principal no suele ser “perder” un archivo, sino compartir de más. Define niveles y aplica el principio de mínimo privilegio: cada rol solo accede a lo que necesita.

Ejemplo de 4 niveles de permisos

Nivel 0 (Público/externo): publicaciones, anexos, datasets compartibles y materiales aprobados para difusión en 05_PUBLICATIONS/.
Nivel 1 (Equipo ampliado): transcripciones limpias/anonimizadas, codebook, memos y salidas de codificación en 03_DATA_PROCESSED/ y 04_ANALYSIS/.
Nivel 2 (Equipo núcleo): audio raw, transcripciones raw, notas de campo con detalle y cualquier material que aún no esté anonimizado en 02_DATA_RAW/.
Nivel 3 (PI/gestión ética): consentimientos firmados, correspondencia ID↔identidad y documentación IRB en 01_IRB_CONSENT/, especialmente 04_Clave_IDs/.

Evita enviar audio o consentimientos por email o mensajería sin control, y usa almacenamiento institucional con registro de accesos si tu organización lo ofrece. Si trabajas con datos personales en la UE, revisa obligaciones de privacidad y seguridad en el texto del RGPD.

Cómo aplicar los permisos a la carpeta (sin complicarte)

Restringe 01_IRB_CONSENT/ a muy pocas personas (Nivel 3).
Restringe 02_DATA_RAW/ (Nivel 2) y crea un flujo claro para generar 03_DATA_PROCESSED/ (Nivel 1).
Publica solo desde 05_PUBLICATIONS/ (Nivel 0), con revisión final.
Documenta quién tiene acceso a qué en 00_ADMIN/ (una lista simple con roles).

Flujo de trabajo recomendado: de la grabación a la publicación

La estructura funciona mejor si el equipo sigue siempre el mismo camino. Así reduces errores y facilitas auditorías internas.

1) Ingesta del audio (día de la sesión)

Copia el audio a 02_DATA_RAW/01_Audio_raw/ y no lo edites.
Registra un “log de importación” en 02_DATA_RAW/99_Import_checksum/ (quién, cuándo, desde qué dispositivo).
Asigna el ID de sesión (por ejemplo, INT_P001_2026-03-14) y úsalo en todo.

2) Transcripción (raw) y control de calidad

Guarda la transcripción literal en 02_DATA_RAW/03_Transcripcion_raw/.
Si usas transcripción automática, marca el archivo como “AUTO” y planifica revisión humana.
Guarda incidencias (audio malo, solapamientos, partes inaudibles) en 03_DATA_PROCESSED/04_QA_validacion/.

Si quieres una opción rápida para borradores, puedes usar transcripción automática y después pasar a revisión o limpieza, según el nivel de calidad que necesites.

3) Limpieza y anonimización (clean)

Genera una copia en 03_DATA_PROCESSED/02_Transcripcion_clean/ y nunca edites el raw.
Define reglas de anonimización en el README (p. ej., [NOMBRE], [EMPRESA], [CIUDAD]).
Si sustituyes nombres por pseudónimos, guarda la tabla solo en 01_IRB_CONSENT/04_Clave_IDs/.

4) Codificación y outputs

Congela una versión “lista para codificar” (p. ej., TRN_CLEAN_v02) antes de empezar.
Guarda el codebook en 04_ANALYSIS/01_Codebook/ y versiona cada cambio.
Exporta resultados (matrices, citas, recuentos) a 04_ANALYSIS/04_Exports_figuras_tablas/.

5) Publicación y compartición

Crea una carpeta por artículo o informe dentro de 05_PUBLICATIONS/.
Incluye un archivo “LEEME_comparticion.md” con qué se puede compartir y qué no.
Solo comparte transcripciones o datos si tu consentimiento y tu aprobación ética lo permiten.

Errores comunes (y cómo evitarlos)

Mezclar raw y clean: termina en “ediciones invisibles”; solución: carpetas separadas y permisos distintos.
Usar nombres con datos personales: “Entrevista_Maria_Garcia.wav”; solución: IDs y tabla separada en zona restringida.
No versionar: dos personas editan el mismo archivo; solución: v01/v02 y registro de cambios.
Guardar outputs sin contexto: “export.xlsx”; solución: fecha, versión del codebook y método en el nombre.
Carpetas por persona en vez de por proceso: se fragmenta el proyecto; solución: plantilla común y roles claros.
Consentimientos junto a datos: eleva el riesgo si hay filtración; solución: 01_IRB_CONSENT/ separado y restringido.

Common questions

¿Debo guardar el audio original si ya tengo la transcripción?

Sí, si tu aprobación ética y tus políticas lo permiten, porque el audio es la fuente y puede resolver dudas de interpretación. Guárdalo en 02_DATA_RAW/ y limita el acceso.

¿Cuándo puedo borrar el audio?

Depende del consentimiento, de la aprobación del comité y de la política de retención de tu institución. Documenta la decisión en 00_ADMIN/ y aplica una regla uniforme.

¿Qué diferencia hay entre “transcripción raw” y “clean”?

La raw suele ser literal y con el mínimo de intervención (incluye muletillas, solapamientos o marcas). La clean aplica criterios de lectura, corrección, formato y, a menudo, anonimización.

¿Cómo organizo un focus group con varios participantes?

Usa un ID de sesión (FG01) y marca hablantes como S1, S2, MOD, etc. Por ejemplo: PROJ2026_FG_FG01_2026-04-02_TRN_RAW_v01.docx.

¿Qué hago si tengo varias grabadoras o pistas?

Guárdalas todas en audio raw con un sufijo de pista (T1, T2) y documenta en el log cuál es la principal. Si haces una mezcla, colócala en 03_DATA_PROCESSED/01_Audio_processed/.

¿Qué formato de archivo es mejor para transcripciones?

DOCX facilita revisión con cambios, y TXT/CSV ayuda a importar en herramientas de análisis. Lo importante es que elijas un estándar y lo documentes en el README.

¿Cómo gestiono revisiones de transcripción sin perder el historial?

Combina versiones (v01, v02) con “control de cambios” en el documento o un registro de cambios en 00_ADMIN/04_Registro_cambios/. Evita sobrescribir.

Checklist rápida para implantar la plantilla en tu laboratorio

Crea la carpeta raíz del proyecto y copia la plantilla completa.
Escribe el README con: convención de nombres, reglas de anonimización y permisos.
Define IDs (P001, INT01, FG01) y crea la tabla de correspondencia en zona restringida.
Decide qué será “raw” y qué será “processed” (y quién puede editar cada cosa).
Añade un registro de cambios y úsalo desde el día 1.

Si además necesitas subtítulos o accesibilidad en vídeo, la creación de closed captions puede ayudarte a publicar resultados en formatos más inclusivos, siempre respetando permisos y anonimización.

Cuando quieras convertir audio en texto con un flujo claro (raw → clean → análisis), GoTranscript puede ayudarte con soluciones que encajan con esta plantilla, desde borradores hasta revisiones, y con opciones que complementan tus procesos de investigación. Puedes revisar nuestras professional transcription services para integrarlas en tu sistema de carpetas y control de versiones.

Haz tu pedido ahora