Pour bien analyser des données linguistiques, il faut présenter les exemples de façon stable et lisible : une ligne originale, une ligne de gloss morphème par morphème, puis une traduction libre. Ce format aide votre équipe à comparer des phrases, repérer la grammaire et citer les données sans ambiguïté. Dans cet article, vous trouverez un modèle prêt à copier, des exemples, et une petite liste d’abréviations pour garder la même logique dans tous vos transcrits.
Mot-clé principal : glossage linguistique
Key takeaways
- Utilisez toujours 3 lignes : original → gloss → traduction libre.
- Segmentez les morphèmes avec des tirets, et marquez les clitiques avec « = ».
- Gardez des abréviations cohérentes (idéalement basées sur les Leipzig Glossing Rules).
- Ajoutez un mini glossaire d’abréviations dans chaque projet pour éviter les variantes (ex. PST vs PAST).
- Numérotez les exemples et gardez une mise en page alignée pour faciliter la relecture et les citations.
Qu’est-ce qu’un exemple glossé, et à quoi ça sert ?
Un exemple glossé est une courte séquence de parole ou de texte, présentée avec une segmentation morphologique et des étiquettes grammaticales. Il sert à montrer clairement comment une phrase est construite, pas seulement ce qu’elle veut dire.
Dans un mémoire, un article ou un rapport, le glossage linguistique permet de :
- rendre vos données vérifiables (un lecteur peut suivre la forme et le sens) ;
- comparer des structures (temps, accord, cas, ordre des mots) ;
- réduire les malentendus quand plusieurs personnes transcrivent et traduisent.
Les 3 lignes standard
- Ligne 1 : la forme originale (orthographe, phonétique, ou transcription adaptée au projet).
- Ligne 2 : le gloss morphème par morphème (segmentation + abréviations).
- Ligne 3 : la traduction libre (idiomatique) dans la langue de rédaction.
Règles de format essentielles (segmentation, alignement, ponctuation)
Avant de choisir vos abréviations, fixez des règles simples et appliquez-les partout. Le but n’est pas d’être “parfait”, mais d’être cohérent.
1) Segmentez de façon stable
- Utilisez un tiret pour séparer les morphèmes dans un même mot :
parl-ais,mang-e-rai. - Utilisez le signe égal pour les clitiques :
donne=le,je=l’(si votre analyse les traite comme clitiques). - Utilisez un point dans les gloss pour les catégories fusionnées :
1SGou1.SG
2) Alignez par mots, pas au caractère près
L’alignement parfait caractère par caractère devient vite fragile dans Word, Google Docs, ou dans un CMS. Alignez surtout par unités (mots/morphèmes) et gardez des espaces réguliers.
- Dans un document : utilisez une police monospace pour les exemples si possible.
- Dans un tableur : mettez « original / gloss / traduction » sur trois lignes, ou trois colonnes si vous préférez.
- Dans LaTeX : des outils comme
gb4eouexpexaident, mais la règle reste la même.
3) Gérez la ponctuation et les phénomènes de parole
- Gardez la ponctuation surtout sur la ligne originale et la traduction libre.
- Si vous notez des pauses, chevauchements ou hésitations, définissez une convention séparée (et ne mélangez pas tout dans le gloss grammatical).
- Pour des données orales, vous pouvez ajouter une ligne “notes” optionnelle (ex. rire, bruit, coupure), mais gardez les 3 lignes de base.
Modèle (template) à copier-coller pour vos transcriptions
Voici un modèle simple, qui marche dans la plupart des contextes. Vous pouvez le coller dans votre guide d’équipe et l’adapter.
- Exemple (n°) : numérotation continue ou par chapitre (ex. 12, 13, 14).
- Source : optionnel (fichier audio, minute, locuteur).
Template minimal
(1) [Source: ___] L1 TEXTE_ORIGINAL L2 segmentation-morphologique GLOSS.ABBR=CL ... L3 “Traduction libre idiomatique.”
Template avec infos de corpus (utile en équipe)
(1) [Corpus: ___ | Fichier: ___ | Timecode: 00:00:00–00:00:00 | Locuteur: ___] L1 TEXTE_ORIGINAL L2 segment-ation ABBR-ABBR mot=CL L3 “Traduction libre.” Notes (optionnel) ___
Checklist de cohérence (à mettre en haut de votre guide)
- Les abréviations sont-elles toutes en majuscules ? (ex. PST, PL, DAT)
- La même catégorie a-t-elle toujours la même forme ? (ex. PST, pas parfois PAST)
- La segmentation utilise-t-elle tirets et clitiques « = » de façon stable ?
- Les guillemets de traduction sont-ils uniformes ? (ex. “ ”)
- Chaque exemple a-t-il un numéro et une source si nécessaire ?
Exemples complets (avec segmentation, gloss et traduction)
Les exemples ci-dessous illustrent le format, pas une langue en particulier. Adaptez les choix d’abréviations à votre analyse.
Exemple 1 : temps passé + accord personne
(1) L1 na-kala buku L2 1SG-take.PST book L3 “J’ai pris le livre.”
- Point clé : le gloss indique la personne (
1SG) et le temps (PST). - Astuce : si votre équipe hésite entre
PSTetPAST, choisissez-en un et mettez-le dans le glossaire.
Exemple 2 : clitique objet avec « = »
(2) L1 mi see=am L2 1SG see=3SG.OBJ L3 “Je l’ai vu.”
- Point clé :
=montre queamest attaché comme clitique. - Variante possible : si vous préférez, vous pouvez glossser
3SG.OBJcomme3SG.ACC, mais restez cohérent.
Exemple 3 : négation + aspect
(3) L1 ta no go yet L2 3SG NEG go PFV L3 “Il/elle n’est pas encore parti(e).”
- Point clé : la traduction libre ajoute “encore” pour être naturelle, même si l’ordre des mots diffère.
- Choix d’analyse : vous pouvez glossser
yetcommeIPFVou une autre valeur selon votre système, mais documentez-le.
Exemple 4 : cas et ordre des mots
(4) L1 dom-um puell-a vid-et L2 house-ACC girl-NOM see-PRS.3SG L3 “La fille voit la maison.”
- Point clé : le gloss rend visible le cas (
NOM,ACC), même si la traduction française ne l’exprime pas. - Convention : combinez personne et temps comme
PRS.3SGou séparez enPRS 3SG, mais gardez une seule méthode.
Créer un glossaire d’abréviations (pour la cohérence d’équipe)
Un glossaire d’abréviations est votre “contrat” interne. Il évite les corrections infinies et accélère la relecture.
Bonnes pratiques
- Gardez les abréviations courtes et standard quand c’est possible.
- Notez les choix non standard (ex. votre définition de
PFVou un marqueur propre à la langue). - Décidez d’une règle pour les catégories combinées :
PRS.1SGvs1SG.PRS. - Centralisez le glossaire dans un fichier unique (Google Doc, README, wiki interne) et datez les changements.
Mini glossaire de départ (à adapter)
Cette liste couvre des besoins fréquents dans les transcriptions linguistiques. Pour une référence plus complète, appuyez-vous sur les Leipzig Glossing Rules.
- Personne / nombre : 1, 2, 3, SG (singulier), PL (pluriel)
- Temps : PST (passé), PRS (présent), FUT (futur)
- Aspect : PFV (perfectif), IPFV (imperfectif), PROG (progressif)
- Mode : IND (indicatif), SBJV (subjonctif), IMP (impératif)
- Polarité : NEG (négation)
- Cas : NOM (nominatif), ACC (accusatif), DAT (datif), GEN (génitif), LOC (locatif)
- Rôles/valence : CAUS (causatif), PASS (passif), REFL (réfléchi)
- Détermination : DEF (défini), INDF (indéfini), DEM (démonstratif)
- Accord / genre : M (masc.), F (fém.), N (neutre)
- Fonctions : OBJ (objet), SUBJ (sujet), POSS (possessif)
Format recommandé pour votre glossaire
ABBR = Signification (FR) | Remarques / exemples PST = passé | utilisé pour -ta, -ed... PFV = perfectif | à distinguer de PRF si utilisé 3SG = 3e personne SG | peut être 3.SG selon convention
Pièges fréquents et comment les éviter
La plupart des problèmes viennent d’un manque de règles partagées. Une fois votre standard posé, la qualité monte vite.
Piège 1 : changer d’abréviation au milieu d’un projet
- Symptôme : PST / PAST / PASS se mélangent.
- Solution : verrouillez une liste officielle et faites une recherche globale lors des mises à jour.
Piège 2 : gloss trop “traduction”
- Symptôme : la ligne 2 ressemble à une traduction mot à mot en français.
- Solution : la ligne 2 doit montrer des catégories (temps, cas, accord), même si ce n’est pas “joli”.
Piège 3 : segmentation instable
- Symptôme : un même morphème est parfois séparé, parfois collé.
- Solution : créez un mini lexique des morphèmes courants (affixes, clitiques) et imposez une écriture.
Piège 4 : pas de source ou de contexte
- Symptôme : impossible de retrouver l’extrait audio ou le locuteur.
- Solution : ajoutez au moins un identifiant de fichier et un timecode, surtout en travail d’équipe.
Common questions
1) Faut-il toujours faire trois lignes ?
Oui, dans la plupart des travaux, c’est le minimum utile : forme, gloss, traduction. Vous pouvez ajouter une ligne de notes, mais gardez la structure stable.
2) Est-ce que je dois suivre exactement les Leipzig Glossing Rules ?
Vous n’êtes pas obligé de tout suivre à la lettre, mais c’est une bonne base commune. Le plus important est d’expliquer vos choix et de rester cohérent.
3) Comment choisir entre tiret « - » et égal « = » ?
Utilisez souvent « - » pour les affixes et « = » pour les clitiques. Si votre équipe n’est pas d’accord sur le statut, choisissez une convention pratique et notez-la dans le guide.
4) Puis-je glossser en français ?
Oui, mais les abréviations grammaticales restent souvent en anglais/latin (PST, NOM, PL) pour rester standards. Évitez les traductions longues dans la ligne 2.
5) Comment gérer les mots inconnus ou inaudibles ?
Définissez un marqueur unique, par exemple [inaud.] ou XXX, et utilisez-le partout. Gardez le marqueur sur la ligne originale, et notez l’impact sur le gloss si nécessaire.
6) Que faire si la traduction libre s’éloigne beaucoup de l’ordre des mots ?
C’est normal, surtout entre langues très différentes. La ligne 2 garde la structure, et la ligne 3 doit rester naturelle pour le lecteur.
7) Comment présenter des exemples dans un tableau ou un logiciel d’annotation ?
Gardez les trois lignes comme trois champs (ou trois colonnes) avec le même ordre. Ajoutez un champ “source” (fichier, timecode, locuteur) pour pouvoir citer et vérifier.
Si vous préparez des transcriptions avec segmentation, gloss et traduction, un bon flux de travail fait gagner du temps : audio propre, conventions écrites, relecture et mise en forme stable. GoTranscript peut vous aider à passer de l’audio au texte, puis à produire des livrables cohérents pour la recherche, y compris la préparation de transcriptions et la relecture, via ses professional transcription services.
Pour aller plus loin sur la combinaison humain + outil, vous pouvez aussi comparer une première ébauche via transcription automatisée puis une vérification, ou demander une relecture de transcription quand la cohérence de format est critique.