Para importar o exportar transcripciones en ELAN sin romper los timecodes, trabaja siempre con formatos que conserven la alineación temporal (EAF/CSV con tiempos) y verifica codificación, separadores y estructura de tiers antes de reimportar. Cuando uses TXT/CSV, incluye columnas de inicio/fin en milisegundos, evita editores que cambien saltos de línea y valida el resultado con una revisión rápida de segmentos. Si tu objetivo es análisis o archivo, exporta también el EAF original y una copia del medio para poder reconstruir la sincronía.
Palabra clave principal: importar y exportar transcripciones en ELAN.
Key takeaways
- No uses TXT “plano” como formato de ida y vuelta si necesitas conservar timecodes y tiers.
- Para intercambio seguro, prioriza EAF y, para análisis, CSV con columnas de tiempo (inicio/fin) y un ID estable.
- Antes de reimportar, fija codificación (UTF-8), separador (coma o tabulador) y la unidad de tiempo (ms).
- Evita desalineaciones bloqueando la tasa de muestreo del audio/vídeo y no recortando el medio sin actualizar ELAN.
- Archiva EAF + medios + notas de versión para que el proyecto sea reproducible.
Qué formatos soporta ELAN y cuál elegir (sin perder tiempos)
ELAN trabaja de forma nativa con archivos .EAF, que guardan tiers, relaciones y alineación temporal. Si tu prioridad es no romper nada, el EAF es tu “máster” y debe ser el centro del flujo.
Para exportar o importar texto y tablas, ELAN permite salidas tipo CSV o texto, pero su seguridad depende de que incluyas tiempos y mantengas la estructura que ELAN espera al volver a entrar.
Recomendación rápida por objetivo
- Edición dentro de ELAN: usa EAF y evita ida y vuelta a TXT.
- Análisis en Excel/R/Python: exporta a CSV con inicio/fin, nombre de tier y (si puedes) un identificador de anotación.
- Intercambio con otros anotadores: comparte EAF + medios (o rutas relativas consistentes).
- Archivo a largo plazo: EAF + medios + exportación de tabla (CSV) como “copia legible”.
Qué se pierde con un TXT “plano”
- Relaciones entre tiers (p. ej., dependencias).
- Estructura (quién habla, glosas, traducción, notas).
- En muchos casos, los timecodes o su precisión si no exportas explícitamente los tiempos.
Flujo seguro de exportación (para análisis o revisión) sin romper timecodes
Exporta siempre desde el EAF “limpio” y decide si necesitas un CSV orientado a análisis o un TXT solo para lectura. El objetivo es que el archivo exportado sea estable y fácil de validar.
Paso a paso recomendado
- 1) Guarda una copia del EAF antes de exportar (control de versiones).
- 2) Normaliza tiers: nombres consistentes (sin duplicados), y evita cambios de última hora en jerarquías.
- 3) Decide la unidad de tiempo: milisegundos suele ser lo más robusto para CSV.
- 4) Exporta a CSV incluyendo: tier, inicio, fin, valor de anotación y (si está disponible) un ID.
- 5) Abre el CSV en un editor que respete UTF-8 y comprueba caracteres (tildes, ñ, IPA si aplica).
- 6) Valida con una “prueba de 10 segmentos”: compara 10 anotaciones al azar con ELAN y confirma tiempos y texto.
Qué columnas debería tener tu CSV (mínimo viable)
- tier (nombre exacto del tier en ELAN)
- start_ms (inicio en milisegundos)
- end_ms (fin en milisegundos)
- value (texto de la anotación)
Si vas a reimportar, añade también una columna annotation_id o un índice estable para poder detectar cambios y duplicados.
Checklist de exportación para análisis
- Incluí inicio/fin en ms (no solo tiempos “bonitos” tipo 00:01:02.3).
- Incluí nombre de tier y, si hay varios hablantes, una columna de speaker o tiers separados por hablante.
- Confirmé separador (coma o tabulador) y que no choca con el texto (p. ej., comas dentro de la transcripción).
- Guardé el archivo en UTF-8.
- Documenté versión del EAF y fecha de exportación.
Checklist de exportación para archivo (reproducible)
- EAF final (máster) + una copia previa (backup).
- Medios (audio/vídeo) con el mismo archivo que se usó al anotar (sin recortes).
- Exportación CSV legible con inicio/fin.
- Notas: idioma, convenciones de transcripción, nombres de tiers y su significado.
Flujo seguro de importación (CSV/TXT) manteniendo alineación y tiers
La importación es donde más se rompen los proyectos, porque un cambio pequeño en separadores, codificación o tiempos genera segmentos corridos. Tu objetivo es que ELAN reciba datos “limpios” y que tú puedas verificar rápido.
Antes de importar: prepara el archivo
- Codificación: guarda el CSV/TXT en UTF-8 para evitar símbolos raros.
- Separador: usa tabulador si tu texto contiene muchas comas.
- Saltos de línea: evita que el editor convierta saltos de línea dentro de celdas en nuevas filas.
- Unidad de tiempo: no mezcles segundos con milisegundos.
- Rangos: inicio < fin, sin valores negativos, sin fin “vacío”.
Cómo preservar la estructura de tiers
La estructura se pierde cuando el archivo no dice “a qué tier pertenece cada fila” o cuando cambias nombres a mitad del flujo. Mantén el nombre del tier como una clave y no lo edites en la hoja de cálculo salvo que lo vayas a cambiar también en ELAN.
- Usa una columna tier con el nombre exacto.
- Si trabajas con tiers dependientes, evita reconstruir jerarquías desde CSV si no es imprescindible.
- Si necesitas editar texto masivamente, hazlo sin reordenar filas y sin “limpiar” espacios que separen etiquetas.
Cómo preservar la alineación temporal
- Usa tiempos de inicio/fin como números (ideal: ms enteros).
- No redondees tiempos en Excel a menos decimales.
- No recortes el audio/vídeo después de anotar, porque desplaza todos los timecodes.
Si tienes que recortar el medio, crea un nuevo proyecto o actualiza la referencia del medio de forma controlada y revisa el alineado desde el primer segmento.
Errores comunes al importar/exportar y cómo arreglarlos
Estos fallos aparecen incluso en equipos expertos, porque muchas herramientas “ayudan” cambiando formatos sin avisar. La solución suele ser simple si detectas el origen.
1) Segmentos desalineados (todo va tarde o pronto)
- Causa típica: el medio cambió (recorte, nuevo render, distinto inicio) o cambió la tasa de muestreo.
- Arreglo: vuelve a enlazar el medio original o usa exactamente el mismo archivo usado al anotar.
- Comprobación: revisa el primer minuto y el último minuto para confirmar que el desfase no crece.
2) Segmentos “corridos” por el separador del CSV
- Causa típica: el texto contiene comas y el CSV usa coma sin comillas consistentes.
- Arreglo: exporta/importa con tabulador o asegúrate de que los campos con comas van entrecomillados.
3) Caracteres raros (tildes rotas, símbolos extraños, IPA corrupto)
- Causa típica: el archivo no está en UTF-8 o el programa abre en otra codificación.
- Arreglo: reexporta/guarda como UTF-8 y abre con una herramienta que respete la codificación.
4) Pérdida de estructura de tiers (todo cae en un solo tier)
- Causa típica: falta la columna tier o los nombres no coinciden con ELAN.
- Arreglo: normaliza nombres de tiers y repite la importación con una columna tier correcta.
5) Timecodes con precisión distinta (redondeo)
- Causa típica: Excel muestra segundos con pocos decimales y guarda valores redondeados.
- Arreglo: trabaja en milisegundos enteros o configura la hoja para no redondear.
6) Filas partidas por saltos de línea dentro del texto
- Causa típica: pegaste texto con saltos de línea en una celda y el CSV lo interpretó como nueva fila.
- Arreglo: reemplaza saltos de línea por un marcador (p. ej., “\n”) antes de exportar.
Criterios para elegir entre CSV, TXT y EAF (y cuándo no hacer “ida y vuelta”)
Si necesitas conservar timecodes y tiers, el CSV o el TXT suelen ser formatos de trabajo temporal, no el origen de verdad. Usa estos criterios para decidir.
Elige EAF cuando…
- Vayas a seguir anotando o corrigiendo en ELAN.
- Necesites tiers dependientes y relaciones complejas.
- Quieras compartir el proyecto con otro anotador.
Elige CSV cuando…
- Necesites análisis cuantitativo (conteos, duraciones, turnos).
- Vayas a limpiar texto en bloque, pero sin cambiar tiempos.
- Vayas a integrar con scripts (Python/R) o bases de datos.
Elige TXT cuando…
- Solo necesitas lectura humana o revisión ligera.
- No necesitas reimportar ni conservar estructura.
Si el plan es editar y reimportar, evita TXT y usa un CSV bien definido con tiempos y claves.
Common questions
- ¿Puedo editar un CSV en Excel y reimportarlo sin problemas?
Sí, si mantienes los tiempos como números (ideal: ms), no reordenas filas y controlas separador y codificación. - ¿Por qué mis timecodes cambian al exportar?
Suele pasar por redondeo, por una unidad de tiempo distinta o porque el programa con el que abres el archivo cambia el formato. - ¿Cómo sé si he perdido la estructura de tiers?
Si al reabrir ves que todo aparece en un solo tier o faltan tiers, revisa nombres exactos y que el archivo incluya la columna tier. - ¿Qué hago si el audio no coincide con las anotaciones?
Comprueba que usas el mismo archivo de audio/vídeo y que no cambió su duración, inicio o tasa de muestreo desde la anotación. - ¿Es mejor guardar tiempos en hh:mm:ss o en milisegundos?
Para intercambio y análisis, milisegundos suele ser más estable y evita pérdidas por formato y redondeo. - ¿Cómo preparo exportaciones para archivado?
Guarda EAF + medios + un CSV con tiempos + notas de convención para que otra persona pueda reconstruir el proyecto.
Un flujo simple y seguro (plantilla)
Si quieres un proceso fácil de repetir, usa esta plantilla como estándar de equipo. Reduce errores y facilita auditoría.
- 1) Máster: trabaja siempre sobre un EAF versionado.
- 2) Exportación: genera un CSV para análisis con start_ms, end_ms, tier, value.
- 3) Edición: edita solo la columna value si no quieres tocar tiempos.
- 4) Validación: prueba 10 segmentos y revisa caracteres especiales.
- 5) Archivo: empaqueta EAF + medios + CSV + notas.
Si además necesitas pasar de audio a texto antes de entrar en ELAN, puedes combinar una transcripción inicial con revisión y luego alinearla en tiers. Para un primer borrador rápido, puede ayudarte una opción de transcripción automática, y si ya tienes texto pero quieres pulirlo, existe un servicio de corrección de transcripciones.
Cuando tu prioridad sea mantener consistencia, trazabilidad y un resultado usable para análisis, GoTranscript puede aportar soluciones adecuadas para transcripción y entregables listos para trabajar, incluyendo professional transcription services.