Numéro |
CMLF 2008
2008
|
|
---|---|---|
Numéro d'article | 178 | |
Nombre de pages | 13 | |
Section | Sémantique | |
DOI | https://doi.org/10.1051/cmlf08202 | |
Publié en ligne | 9 juillet 2008 |
DOI: 10.1051/cmlf08202
Automatiser et quantifier lanalyse sémantique du français technique
A. Bertels ann.bertels@ilt.kuleuven.bePublié en ligne le 9 juillet 2008
Résumé
Cet article présente la méthodologie mise en uvre pour automatiser et quantifier lanalyse sémantique du vocabulaire spécifique dun corpus en français technique. Les textes du corpus relèvent du domaine technique des machines-outils pour lusinage des métaux. Lobjectif principal de létude est de vérifier si les unités lexicales (les plus) spécifiques de ce domaine technique sont (les plus) monosémiques. Comme lanalyse sémantique porte sur quelque 5000 unités lexicales du corpus technique, lautomatisation et la quantification simposent. A cet effet, nous avons développé une mesure de monosémie, en implémentant la monosémie en termes dhomogénéité sémantique. La mesure de monosémie est basée sur le recoupement formel des cooccurrents de deuxième ordre dun mot de base, en loccurrence dune unité lexicale spécifique.
Dans cet article, nous expliquons la méthodologie de lanalyse des cooccurrences et son intérêt pour le développement de la mesure de monosémie. Nous discutons les premiers résultats de lanalyse sémantique quantitative, ainsi que les résultats de lanalyse statistique qui vise à répondre à la question principale de corrélation entre les unités lexicales spécifiques et les unités lexicales monosémiques. Finalement, nous procédons à une mise au point de la mesure de monosémie, en y intégrant des informations linguistiques supplémentaires, telles que des indications de classe lexicale.
© Institut de Linguistique Française 2008