Étiquetage

À partir de la séquence Le petit garde la montre (cf. Fuchs, 1996, p. 95), dont l’interprétation syntaxique est double (« Le petit gardien la désigne », « Le petit enfant conserve le bracelet-montre ») un étiqueteur morphologique fournit les résultats morphologiques que nous résumons dans le tableau suivant :

Séquence

Lemme

Informations morphologiques

Catégorie

le

le

Masc+SG+Def

Det

le

Acc+Masc+SG+P3

PC

petit

petit

Adv

petit

Masc+SG

Adj

petit

Masc+SG

Noun

garde

garder

Imp+SG+P2

Verb

garder

IndP+SG+P3

Verb

garder

SubjP+SG+P3

Verb

garder

IndP+SG+P1

Verb

garder

SubjP+SG+P1

Verb

garde

Fem+SG

Noun

garde

InvGen+SG

Noun

garde

Masc+SG

Noun

la

la

Masc+InvPL

Noun

le

Fem+SG+Def

Det

le

Acc+Fem+SG+P3

PC

montre

montrer

Imp+SG+P2

Verb

montrer

IndP+SG+P3

Verb

montrer

SubjP+SG+P3

Verb

montrer

IndP+SG+P1

Verb

montrer

SubjP+SG+P1

Verb

montre

Fem+SG

Noun

Tableau 1

Les résultats indiqués dans le tableau 1 montrent, hors contexte syntaxique, que :

Il est important de garder présent à l’esprit qu’un analyseur morphologique ou un étiqueteur ne peut pas effectuer une désambiguïsation syntaxique. Chaque élément est considéré d’une manière individuelle. Au niveau morphologique, les unités indiquées dans le tableau 1 sont ambiguës. Il se trouve que la séquence Le petit garde la montre est également ambiguë sur le plan syntaxique, mais cela ne concerne pas l’étape morphologique. Toutes les informations morphologiques doivent être générées à ce stade, afin qu’aucune hypothèse ne puisse être écartée ultérieurement pendant l’analyse syntaxique. Par exemple, c’est primordial de savoir que « le » peut être déterminant ou pronom selon le contexte phrastique ; cette information morphologique et de catégorisation doit être maintenue en mémoire pour la désambiguïsation syntaxique : dans la phrase il le lui donne, « le » est évidemment pronom clitique, alors que dans le bureau est en entrant à gauche, « le » est incontestablement un déterminant.

Comment fonctionne l’analyseur morphologique ? L’attribution d’une catégorie grammaticale repose essentiellement sur l’élaboration d’une liste de terminaisons (flexions ou suffixes). Par exemple, « ez » est une flexion potentielle pour quelque 35 000 formes verbales du français (7 000 verbes x 5 conjugaisons différentes). Par ailleurs, des règles d’exception sont incorporées. Par exemple, « nez » est une exception à la règle de la terminaison verbale. Parfois des unités sont ambiguës ; c’est le cas pour conseiller (à la fois verbe et nom). Ensuite intervient la phase de lemmatisation et l’attribution des propriétés (genre, nombre pour les noms et les adjectifs, mode, temps, nombre, personne pour les verbes).

Exemples :

« admirent »

Le verbe fléchi est d’abord comparé à un dictionnaire où est recensé tout homographe assimilable à plus d’un verbe. Notre exemple doit y figurer, en tant que verbe, fléchi, pluriel, troisième personne, pouvant être :

Un autre type de dictionnaire recense certains types de conjugaisons particulièrement complexes, qui échappent à un découpage lemmatique standard. Par exemple, le verbe « aller » se conjugue sur des radicaux : all/, ir/, v/…

Puis, les verbes fléchis restants, ayant passé les tests évoqués ci-dessus, sont examinés par une liste contenant l’ensemble des désinences verbales sous le mode fléchi, avec leurs caractérisations respectives. Par exemple, « -issaient » (à partir du verbe « plisser ») correspond à un pluriel, 3e personne, indicatif, imparfait. Les différents groupes verbaux sont traités (infinitifs en –re, -oir, -ir, puis –er) avant l’affectation d’un lemme.

Exercices en autonomie :

En vous servant de Fuchs, 1996, déterminez la différence entre les homographes, les homonymes, les homophones, les homographes homonymes, les homographes non homophones, etc.

Les dictionnaires électroniques ne sont pas identiques à des dictionnaires classiques. Essayez de retrouver de l’information à partir du réseau Internet pour comprendre cette différence.