× Description Téléchargement Publication(s) Contact
 Retourner à Logiciels et Ressources

Alexina

Lexiques morphologiques (parfois syntaxiques) y compris le Lefff

Description

Alexina est le framework ALMAnaCH pour l'acquisition et la modélisation d'informations lexicales de niveaux morphologique et syntaxique. Le premier lexique Alexina, également le plus avancé dans son développement, est le Lefff, lexique morphologique et syntaxique du français.

Les lexiques Alexina reposent sur une architecture à deux niveaux:

  • Le lexique intensionnel, qui décrit pour chaque entrée lexicale son lemme (forme canonique + table de flexion) et des informations de syntaxe profonde (cadre de sous-catégorisation en fonctions syntaxiques profondes et réalisations possibles + constructions/reformulations/diathèses admissibles); il est associé à une grammaire morphologique et une grammer des restructurations
  • Le lexique extensionnel, compilé automatiquement à partir du lexique intensionnel ; ce processus de génération comporte une phase de flexion, en fonction de la classe morphologique associée à l’entrée intensionnelle, puis une phase de construction de la structure syntaxique associée à chacune des formes fléchie obtenues (les informations syntaxiques variant d’une forme à une autre, en particulier pour les formes infinitives et participiales, et en fonction de chaque construction associée à l'entrée).

Les informations lexicales présentes dans le Lefff sont issues de divers travaux, et notamment:

  • acquisition automatique (avec validation manuelle) à l'aide de techniques statistiques appliquées sur des corpus bruts (Clément, Sagot et Lang 2004; Sagot 2005),
  • acquisition automatique (avec validation manuelle) d'informations syntaxiques atomiques (cf thèse de Sagot, 2006, ch 7)
  • correction et ajout manuel ou guidé par des techniques automatiques, comme par exemple la fouille d'erreurs dans les sorties d'analyseurs syntaxiques (Sagot et de La Clergerie, 2006),
  • comparaison avec d'autres ressources:
    • intégration d'informations extraites des Tables du Lexique-Grammaire: constructions impersonnelles, adverbes en -ment, quelques classes d'expressions verbales figées (Sagot et Danlos 2006; Danlos et Sagot 2007; Sagot et Danlos 2007; Sagot et Fort 2007);
    • fusion avec l'intégralité du Dicovalence, avec validation manuelle de toutes les entrées concernant les 100 lemmes les plus fréquents ainsi que de toutes les entrées dont le résultat de la fusion contenait plus d'entrée qu'il y en avait dans le Lefff d'une part et dans Dicovalence d'autre part;
    • un certain nombre des noms et adjectifs viennent initialement du lexique morphologique Multext pour le français (Véronis 1998).

Téléchargement

Pour des raisons techniques (migration d'une GForge à un GitLab), les liens de téléchargement direct pour les autres lexiques et les anciennes versions du Lefff ne sont temporairement plus disponibles.

Lefff (Licence Cecill-C)

Dernière version (3.4)

  • Lefff intensionnel — sa compilation en lexique extensionnel nécessite au préalable l'installation des alexina-tools
  • Si vous ne voulez pas avoir à recompiler le Lefff:

  • Citation et publication(s)

    Si vous utilisez ce travail, merci de citer :

    The Lefff, a freely available and large-coverage morphological and syntactic lexicon for French

    Benoît Sagot. 2010. 7th international conference on Language Resources and Evaluation (LREC 2010). Valletta, Malta.
    HAL PDF
    @inproceedings{sagot_The-Lefff,-a-freely_2010,
     address = {Valletta, Malta},
     author = {Sagot, Beno{\^i}t},
     title = {{The Lefff, a freely available and large-coverage morphological and syntactic lexicon for French}},
     year = {2010}
     booktitle = {{7th international conference on Language Resources and Evaluation (LREC 2010)}},
     url = {https://hal.inria.fr/inria-00521242},
     pdf = {https://hal.inria.fr/inria-00521242/file/lrec10lefff.pdf},
    }

    Contact

    Pour plus d'informations ou pour poser une question, merci de contacter Benoît Sagot

    Benoit.Sagot[at]inria.fr