EDP Sciences logo
Web of Conferences logo
Open Access
Numéro
CMLF 2008
2008
Numéro d'article 178
Nombre de pages 13
Section Sémantique
DOI https://doi.org/10.1051/cmlf08202
Publié en ligne 9 juillet 2008
Congrès Mondial de Linguistique Française, Paris, France, 2008
DOI: 10.1051/cmlf08202

Automatiser et quantifier l’analyse sémantique du français technique

A. Bertels

ann.bertels@ilt.kuleuven.be

Publié en ligne le 9 juillet 2008

Résumé
Cet article présente la méthodologie mise en œuvre pour automatiser et quantifier l’analyse sémantique du vocabulaire spécifique d’un corpus en français technique. Les textes du corpus relèvent du domaine technique des machines-outils pour l’usinage des métaux. L’objectif principal de l’étude est de vérifier si les unités lexicales (les plus) spécifiques de ce domaine technique sont (les plus) monosémiques. Comme l’analyse sémantique porte sur quelque 5000 unités lexicales du corpus technique, l’automatisation et la quantification s’imposent. A cet effet, nous avons développé une mesure de monosémie, en implémentant la monosémie en termes d’homogénéité sémantique. La mesure de monosémie est basée sur le recoupement formel des cooccurrents de deuxième ordre d’un mot de base, en l’occurrence d’une unité lexicale spécifique. Dans cet article, nous expliquons la méthodologie de l’analyse des cooccurrences et son intérêt pour le développement de la mesure de monosémie. Nous discutons les premiers résultats de l’analyse sémantique quantitative, ainsi que les résultats de l’analyse statistique qui vise à répondre à la question principale de corrélation entre les unités lexicales spécifiques et les unités lexicales monosémiques. Finalement, nous procédons à une mise au point de la mesure de monosémie, en y intégrant des informations linguistiques supplémentaires, telles que des indications de classe lexicale.



© Institut de Linguistique Française 2008