Axe 5 : Analyse sémantique computationnelle
Responsable : Thierry Charnois, LIPN Paris 13
Co-responsable : Benoît Crabbé LLF Université de Paris
Dans le champ de la linguistique computationnelle, l’axe 5 met l’accent sur l’analyse sémantique et son application dans divers outils d’accès au contenu (ex. extraction d‘information, indexation, résumé), qui peuvent reposer sur des représentations sémantiques différentes. Des modèles, des méthodes et calculs et – dans certains cas – des outils ont été proposés pour décrire et modéliser différents phénomènes sémantiques mais ces phénomènes ont généralement été considérés isolément et avec des modèles de calculs hétérogènes. Le défi consiste à évaluer ces différents modèles sémantiques, à les opérationnaliser et à les intégrer pour produire des analyses sémantiques riches, couvrantes et cohérents, de la même manière que l’on a pu produire des analyseurs syntaxiques à la fois robuste et de bonne qualité.
L’objectif est d’intensifier la recherche sur l’intégration des modèles et méthodes sémantiques par la collaboration de différentes équipes de linguistique computationnelle (Alpage, Lattice, LIPN, LPP-P3) et la confrontation de leurs résultats hétérogènes sur l’analyse syntaxique, l’analyse textuelle, l’analyse et le traitement de corpus, le raisonnement inférentiel basé sur les textes, l’acquisition de connaissances à partir de textes, l’apprentissage automatique et les outils d’accès aux contenus textuels.
L’axe 5 met l’accent sur l’analyse du français mais une attention particulière est portée à l’identification de méthodes indépendantes de la langue qui permettent d’analyser une large palettes de langues pour lesquelles des ressources sont disponibles. C’est en effet une approche prometteuse pour équiper des langues peu outillées qui sont utilisées dans les axes 2 et 3.
L’axe s’intéresse à la langue écrite et orale. Les besoins d’analyse de la langue parlée augmentent et l’un des défis à relever consiste à intégrer dans l’analyse sémantique des traits de l’oral comme les dysfluences pour compenser la faiblesse de la qualité des résultats obtenus sur des transcriptions de l’oral.
L’axe comporte 6 sous-axes :
-
Perspective historique et réflexive (HP)
-
Constitution et annotation de corpus pour l’analyse sémantique (IA)
-
Apprentissage semi-supervisé pour l’analyse syntaxique profonde (SSL)
-
Analyses et traitements sémantiques spécifiques (SSP)
-
Méthodes d’acquisition de connaissances (KA)
-
Applications: vers un accès enrichi aux contenus textuels (APP)
Opérations de l’Axe 5 (2020-2024)
SSL5 Shallow semantic analysis
Marie Candito (LLF) – Joseph Leroux (LIPN)
SSL6 Semi-supervised Semantic Analysis
Joseph Leroux (LIPN)
SSL7 MetaSem: Towards more semantic metagrammars
Djamé Seddah – Eric de la Clergerie
SPP6 Word sense disambiguation and sense induction
Lucie Barque – Marie Candito (LLF)
SPP7 Computational and Cognitive modeling of the processing of syntactic and semantic information
Benoît Crabbé (LLF)
KA2/APP2 Extraction of semantic relations and applications
Haïfa Zargayouna (LIPN)
APP4 RENFO: Expert research on the web through semantic extraction of bio-professional traces from the web
Jorge Garcia Flores (LIPN)
APP5 When Aliens meet Predators : Building Context-Enhanced NLP Tools
Djamé Seddah
APP6 Geo-NN: Geolocalisation in Social Media using Deep Neural Networks
Davide Buscaldi (LIPN)
APP7 Legal rule analysis
Adeline Nazarenko (LIPN)
HRP2 Graph-based semantic analysis
Adeline Nazarenko (LIPN)
KA5 Cross-lingual and multilingual alignment of semantic Resources
Haïfa Zargayouna (LIPN)