top of page

Amélioration et valorisation de la ressource morphologique Morfetik

Morfetik est un dictionnaire morphologique du français contemporain incluant un moteur de flexion XML et MySQL, des interfaces de consultation et des outils NLP d'exploitation. Morfetik permet d'obtenir, pour n'importe quelle entrée lexicale du français, l'ensemble de ses formes (pluriel des noms, féminin et pluriel des adjectifs, formes conjuguées des verbes), ou bien, réciproquement, d'identifier le mot (la forme de base) correspondant à n'importe quelle forme fléchie. Il comprend actuellement près de 800 000 formes distinctes. La ressource peut soit être consultée via un moteur de recherche, soit téléchargée dans un format XML (sous licence LGPL-LR). Enfin, l'interface est connectée à celles de Wikipédia et de FranceTerme1.



Le recensement lexical a fait appel à de nombreuses sources lexicographiques mais l’inventaire n’est pas clos. Il se poursuit actuellement par l’ajout de néologismes et l’intégration de nouvelles spécialités mais également par la précision de la description comme : le traitement approprié des noms à genre variable (un(e) élève; un instituteur, une institutrice) ; le développement des marques relatives à la fréquence (possibilité́ de prise en compte d’indicateurs statistiques de présence en corpus) ; l’explicitation du lien entre variantes graphiques ; le traitement plus fin des relations entre formes et emplois ; etc.




Comments


Post: Blog2_Post
bottom of page