A Pattern Dictionary for Natural Language Processing 论文
详细信息
- 发表期刊/会议
- Revue française de linguistique appliquée
- 发表日期
- 2005-09-01
- 发表年份
- 2005
关键词
摘要
Résumé Cet article passe en revue de façon succincte trois des ressources principales utilisées actuellement pour la désambiguïsation lexicale (WordNet, FrameNet et les classes de Levin), et propose une approche alternative, en prenant comme point de départ les verbes et leurs valences. Cette nouvelle approche ne tente pas de rendre compte de tous les usages possibles d’un mot, mais plutôt de tous ses usages normaux (les ‘normes’). Les patrons normaux d’utilisation des verbes sont dégagés par une méthode que nous appelons Corpus Pattern Analysis (CPA, analyse des patrons basée sur les corpus). A chaque patron se trouve associé un sens (une ‘implication principale’). Les patrons sont ensuite utilisés comme des étalons par rapport auxquels on peut mesurer le sens probable de n’importe quelle phrase. Nous abordons aussi le statut des usages anormaux ou inhabituels (les ‘exploitations’). Nous reconnaissons aussi trois types d’alternance : les alternances syntaxiques liées à la diathèse, les alternances de type sémantique et les alternances lexicales.