A Pattern Dictionary for Natural Language Processing 论文

2005Revue française de linguistique appliquée引用 253
Natural Language Processing TechniquesTopic ModelingLinguistics and Discourse Analysis

详细信息

发表期刊/会议
Revue française de linguistique appliquée
发表日期
2005-09-01
发表年份
2005

关键词

Natural Language Processing TechniquesTopic ModelingLinguistics and Discourse Analysis

摘要

Résumé Cet article passe en revue de façon succincte trois des ressources principales utilisées actuellement pour la désambiguïsation lexicale (WordNet, FrameNet et les classes de Levin), et propose une approche alternative, en prenant comme point de départ les verbes et leurs valences. Cette nouvelle approche ne tente pas de rendre compte de tous les usages possibles d’un mot, mais plutôt de tous ses usages normaux (les ‘normes’). Les patrons normaux d’utilisation des verbes sont dégagés par une méthode que nous appelons Corpus Pattern Analysis (CPA, analyse des patrons basée sur les corpus). A chaque patron se trouve associé un sens (une ‘implication principale’). Les patrons sont ensuite utilisés comme des étalons par rapport auxquels on peut mesurer le sens probable de n’importe quelle phrase. Nous abordons aussi le statut des usages anormaux ou inhabituels (les ‘exploitations’). Nous reconnaissons aussi trois types d’alternance : les alternances syntaxiques liées à la diathèse, les alternances de type sémantique et les alternances lexicales.