Approches computationnelles pour la recherche archivistique sur l'Holocauste.
Digital Research Infrastructure for the Arts and Humanities.
Plateforme de veille axée sur la protection de la vie privée destinée à la prédiction du terrorisme violent et de la criminalité, à la contre-radicalisation et à la protection des citoyens.
Le projet MaTOS (Machine Translation for Open Science) vise à développer de nouvelles méthodes pour la traduction automatique (TA) intégrale de documents scientifiques, ainsi que des métriques automatiques pour évaluer la qualité des traductions produites.
Réseaux de neurones socio-inspirés.
Traduire avec de grands modèles de langue.
Formation virtuelle aux compétences comportementales pour la prise de parole en public.
Développement d'un algorithme de simplification de textes et d'un outil accessible facilitant la production de textes en FALC (« Facile à Lire et à Comprendre »).
Reconnaissance d'entités nommées dans dans les instruments de recherche XML-EAD, une norme d’encodage des instruments de recherche archivistiques.
Linguistique empirique au sens large, y compris la linguistique computationnelle et le TAL.
Problématiques linguistiques dans les technologies du langage.
Très grande infrastructure de recherche (TGIR) visant à faciliter le tournant numérique de la recherche en sciences humaines et sociales.
Le DIM « Matériaux anciens et patrimoniaux » (MAP) est le réseau de recherche francilien dédié à l’étude des matériaux anciens et patrimoniaux.
Numérisation et exploitation des premières éditions du Petit Larousse.
Extraction automatique de la structure logique de catalogues de vente.
Standardisation et structuration de données de santé relatives au cancer.
Ressources et outils pour les langues de France.
Transformer l'enseignement et la recherche interdisciplinaires au service de nos démocraties en pleine évolution.
Généralisation des modèles HTR à travers la production de données pour les langues romanes su des manuscrits médiévaux.
Le projet Universal Dependencies est un effort communautaire ouvert avec plus de 300 contributeurs produisant près de 200 jeux de données annotés en syntaxe dans plus de 100 langues.
Generation et reconnaissance de personalité pour agents conversationnels.