Une bonne convention de nommage pour interviews et transcriptions doit être stable, lisible et unique. La méthode la plus robuste consiste à inclure, dans le même ordre, l’ID de l’étude, l’ID du participant, la vague/session, la date (format AAAA-MM-JJ) et une version (RAW/CLEAN/CODED). Avec ces règles, vous retrouvez vite le bon fichier, vous évitez les doublons et vous facilitez l’analyse et l’archivage.
Mot-clé principal : convention de nommage de fichiers.
Key takeaways
- Gardez le même ordre de champs : Étude → Participant → Session → Date → Version.
- Utilisez un format de date non ambigu : AAAA-MM-JJ.
- Choisissez un seul séparateur (souvent le tiret bas _) et tenez-vous-y.
- Standardisez la version : RAW (brut), CLEAN (nettoyé), CODED (codé).
- Prévenez les erreurs avec des IDs uniques, un “zéro padding” (01, 02…), et une mini-checklist.
Pourquoi une convention de nommage est essentielle (et à quoi elle sert)
Un nom de fichier sert d’étiquette, mais aussi de mini-base de données. Il doit vous dire “quoi, qui, quand, où en est le document” sans ouvrir le fichier.
Une convention claire aide surtout quand vous avez beaucoup de sources : audio, vidéo, notes, transcriptions, exports d’analyse, versions corrigées. Elle réduit aussi les erreurs quand plusieurs personnes travaillent sur le même dossier.
Ce que votre nom de fichier doit permettre
- Retrouver un entretien en quelques secondes, même sans moteur de recherche.
- Trier automatiquement par étude, participant, session, date, et état d’avancement.
- Partager un fichier sans perdre le contexte (par e-mail, drive, outil d’analyse).
- Auditer le travail : savoir si un fichier est brut, nettoyé ou déjà codé.
Les règles de base d’une convention de nommage robuste
La clé est la répétition : même structure, mêmes séparateurs, mêmes codes, mêmes longueurs d’ID. Vous devez pouvoir deviner le nom du prochain fichier sans y réfléchir.
Règle 1 : un ordre fixe des champs
Adoptez un ordre unique et logique, puis ne le changez plus. Pour des interviews, un bon ordre est :
- StudyID (ID étude)
- ParticipantID (ID participant)
- Wave/Session (vague ou session)
- Date (AAAA-MM-JJ)
- Version (RAW/CLEAN/CODED)
Règle 2 : un seul séparateur, sans espaces
Choisissez un séparateur et gardez-le partout. Le tiret bas _ marche bien et évite des confusions avec les dates.
- Évitez les espaces, car certains outils et scripts les gèrent mal.
- Évitez les caractères spéciaux : / \ : * ? " < > | (interdits sous Windows et souvent problématiques ailleurs).
Règle 3 : des IDs courts, stables et anonymisés
Pour les études avec des participants, évitez les noms et prénoms dans les noms de fichiers. Préférez des identifiants comme P001, P002, etc.
Cette approche aide aussi la confidentialité, car un nom de fichier circule facilement. Pour un rappel de bonnes pratiques, vous pouvez vous appuyer sur les principes de protection des données (ex. présentation du RGPD par la CNIL).
Règle 4 : une date non ambiguë
Utilisez le format AAAA-MM-JJ (ex. 2026-04-13). Il trie bien et évite les confusions entre 03/04/2026 (3 avril ou 4 mars).
Règle 5 : une version standard, avec un sens clair
Les versions doivent être peu nombreuses et comprises par tout le monde. Une grille simple :
- RAW : fichier brut (audio original, première transcription).
- CLEAN : transcription relue et nettoyée (typos, noms de fichiers, format).
- CODED : fichier avec codes, tags, ou annotations d’analyse.
Si vous avez des corrections multiples, ajoutez une révision : r01, r02, etc., à la fin.
Modèle recommandé (avec structure et exemples concrets)
Voici un modèle simple et complet pour une convention de nommage de fichiers en recherche qualitative et gestion de transcriptions :
Modèle :
StudyID_ParticipantID_Session_Date_Version.ext
Exemples (audio, vidéo, transcript)
- Étude : STU24, Participant : P007, Session : W01, Date : 2026-04-13
- Audio brut : STU24_P007_W01_2026-04-13_RAW.wav
- Vidéo brute : STU24_P007_W01_2026-04-13_RAW.mp4
- Transcription nettoyée : STU24_P007_W01_2026-04-13_CLEAN.docx
- Transcription codée : STU24_P007_W01_2026-04-13_CODED.docx
- Export pour analyse : STU24_P007_W01_2026-04-13_CODED.txt
Exemples avec plusieurs sessions le même jour
Si vous faites deux entretiens le même jour (ou deux parties), ajoutez un numéro de session court :
- STU24_P007_S01_2026-04-13_RAW.wav
- STU24_P007_S02_2026-04-13_RAW.wav
Exemples avec révisions
- Nettoyé, révision 1 : STU24_P007_W01_2026-04-13_CLEAN_r01.docx
- Nettoyé, révision 2 : STU24_P007_W01_2026-04-13_CLEAN_r02.docx
Exemples pour fichiers associés (consentement, notes, guide d’entretien)
Si vous devez stocker des documents liés, gardez la même structure et changez seulement le “type” ou la version.
- Notes d’entretien : STU24_P007_W01_2026-04-13_NOTES.docx
- Guide d’entretien (étude) : STU24_GUIDE_v01.docx
- Liste des codes (étude) : STU24_CODEBOOK_v01.xlsx
Mettre en place la convention : étapes simples (équipe, dossiers, contrôle)
Une convention marche si elle est facile à appliquer et facile à vérifier. Visez un système que tout le monde peut suivre après 5 minutes d’explication.
1) Décider des champs et des formats
- StudyID : STU24, STUDY01, etc. (choisissez une longueur fixe si possible).
- ParticipantID : P001, P002, etc. (ajoutez des zéros pour trier correctement).
- Session/Wave : W01 (vague), ou S01 (session).
- Date : AAAA-MM-JJ.
- Version : RAW/CLEAN/CODED (+ r01 si besoin).
2) Écrire une mini charte (1 page)
- Un modèle officiel de nom.
- Une table des codes autorisés (versions, types).
- 3 à 5 exemples “corrects”.
- 3 exemples “interdits” avec explication.
3) Standardiser l’arborescence des dossiers
Votre convention devient plus forte avec une structure de dossiers cohérente. Exemple simple :
- STU24/01_RAW_AUDIO/
- STU24/02_TRANSCRIPTS_CLEAN/
- STU24/03_TRANSCRIPTS_CODED/
- STU24/04_EXPORTS/
4) Ajouter un contrôle qualité rapide
- Avant partage : vérifier StudyID, ParticipantID, date, version.
- Avant analyse : vérifier que chaque audio a une transcription correspondante.
- Avant archivage : vérifier qu’il n’existe qu’un “CLEAN final” par entretien.
Si vous utilisez un mélange IA + relecture humaine, vous pouvez aussi prévoir une étape dédiée de relecture. Voir : services de relecture de transcriptions.
Prévenir les erreurs courantes (et comment les corriger)
La plupart des problèmes viennent de trois sources : IDs non uniques, dates ambiguës, et séparateurs incohérents. Une convention robuste les empêche dès le départ.
1) IDs en double (duplicate IDs)
- Cause : deux personnes créent P007 sans se coordonner.
- Prévention : tenir un registre unique des participants (un fichier maître) et attribuer les IDs dans un seul endroit.
- Correction : renommer de façon globale (audio + transcript + notes) et garder une table de correspondance.
2) Dates ambiguës
- Cause : format JJ/MM/AAAA ou MM/JJ/AAAA selon l’outil ou la personne.
- Prévention : imposer AAAA-MM-JJ dans la charte.
- Correction : renommer les fichiers en masse et ajouter la date correcte à partir de votre agenda/registre.
3) Séparateurs incohérents
- Cause : un jour “-”, un autre “_”, parfois des espaces.
- Prévention : choisir _ et l’utiliser partout, y compris dans les dossiers.
- Correction : appliquer une règle de remplacement (ex. “ ” → “_”) puis vérifier les collisions de noms.
4) Tri qui casse (P2 après P10)
- Cause : pas de zéros : P1, P2, …, P10.
- Prévention : “zéro padding” : P001, P002, …, P010.
5) Mélange de langues, majuscules et abréviations
- Cause : “Nettoyé”, “clean”, “final”, “OK”.
- Prévention : une liste courte de termes autorisés (RAW/CLEAN/CODED).
Choisir entre RAW, CLEAN, CODED : critères et bonnes pratiques
Ces trois niveaux couvrent la plupart des besoins, sans créer trop de variantes. Vous pouvez les adapter, mais gardez des définitions écrites.
RAW (brut)
- À utiliser pour : fichier original, export direct d’enregistreur, première transcription.
- À éviter : modifier le contenu, car vous perdez la trace de l’original.
CLEAN (nettoyé)
- À utiliser pour : corrections d’orthographe, harmonisation des tours de parole, anonymisation si vous la faites au texte.
- Astuce : si vous anonymisez, indiquez-le dans la charte (et dans le contenu), pas forcément dans le nom.
CODED (codé)
- À utiliser pour : ajout de codes qualitatifs, thèmes, étiquettes, segments.
- Astuce : conservez une copie CLEAN non codée, car le codage change souvent.
Si vous hésitez entre transcription automatique et humaine, vous pouvez consulter : transcription automatique.
Common questions
Faut-il mettre le nom du participant dans le fichier ?
En général, non, surtout si le fichier circule. Un ID participant (P001…) réduit les risques et reste plus stable.
Dois-je inclure la durée de l’entretien dans le nom ?
Ce n’est pas nécessaire dans la plupart des cas. Gardez plutôt la durée dans les métadonnées, une feuille de suivi, ou le contenu du fichier.
Quel format de fichier pour les transcriptions ?
DOCX est pratique pour la relecture et les commentaires, et TXT est utile pour certains outils d’analyse. Vous pouvez garder les deux si votre équipe en a besoin.
Comment gérer les interviews de groupe (plusieurs participants) ?
Utilisez un ID de groupe (ex. G001) et gardez une liste des participants dans un document séparé. Exemple : STU24_G001_S01_2026-04-13_CLEAN.docx.
Que faire si je dois renommer des centaines de fichiers ?
Commencez par écrire la règle finale, puis faites un test sur une copie du dossier. Ensuite, renommez par lots avec un outil de renommage ou un script, et vérifiez les doublons.
Comment éviter qu’un fichier “final” soit remplacé ?
Évitez le mot “final” et utilisez plutôt CLEAN_r02, CLEAN_r03, etc. Vous pouvez aussi verrouiller l’accès en écriture sur le dossier d’archives.
Dois-je inclure le lieu ou le canal (Zoom, téléphone) ?
Seulement si cela change votre analyse ou votre process. Si vous l’ajoutez, utilisez un code court (ex. ZOOM, TEL) et placez-le juste avant la version.
Conclusion : une convention simple qui tient dans le temps
Une convention de nommage efficace ne cherche pas à tout dire. Elle doit surtout être cohérente, non ambiguë et adaptée à votre flux : collecte → transcription → nettoyage → codage → archivage.
Si vous voulez gagner du temps entre l’audio et un texte prêt à analyser, GoTranscript peut vous aider avec des professional transcription services, ainsi que des options de relecture et de formats adaptés à vos besoins.