Download PDF

Traitement Automatique des Langues Naturelles (TALN), Date: 2013/06/17 - 2013/06/21, Location: Sables d'Olonne

Publication date: 2013-01-01
Pages: 126 - 139
ISSN: 978-2-7462-3138-2

Actes de la conférence TALN-RÉCITAL 2013

Author:

Bertels, Ann
Speelman, Dirk

Keywords:

analyse de cooccurrences, cooccurrents de deuxième ordre et de troisième ordre, mesures d’association, métriques de distance, positionnement multidimensionnel

Abstract:

Cet article présente la méthodologie adoptée pour l’exploration visuelle de la proximité sémantique entre les cooccurrents d’un mot-pôle dans un corpus technique. Nous procéderons à des analyses de positionnement multidimensionnel dans le but de compléter des analyses sémantiques quantitatives et de mieux comprendre les phénomènes d’homogénéité et d’hétérogénéité sémantiques. Nous discuterons les aspects méthodologiques pour le regroupement et la visualisation des cooccurrents de premier ordre d’un mot-pôle technique hétérogène (tour). Le regroupement de ces cooccurrents se fait en fonction des cooccurrents de deuxième et troisième ordre qu’ils partagent. Les questions méthodologiques les plus importantes portent sur les mesures d’association, les métriques de distance pour la matrice de dissimilarité et les seuils inférieurs et supérieurs. Elles permettront de trouver la meilleure configuration de paramètres, la plus fiable et la plus efficace, pour l’interprétation sémantique.