Numéro |
CMLF 2008
2008
|
|
---|---|---|
Numéro d'article | 082 | |
Nombre de pages | 12 | |
Section | Discours, pragmatique et interaction | |
DOI | https://doi.org/10.1051/cmlf08155 | |
Publié en ligne | 9 juillet 2008 |
DOI: 10.1051/cmlf08155
Méthodologie exploratoire outillée pour l'étude de l'organisation du discours
L.-M. Ho-Dac and M.-P. Péry-Woodley hodac@univ-tlse2.frpery@univ-tlse2.fr
Publié en ligne le 9 juillet 2008
Résumé
Cette étude présente une méthodologie exploratoire outillée qui permet de porter un regard nouveau sur l'organisation des textes. L'objectif principal est de se donner les moyens d'une approche configurationnelle pour étudier la complexité des structures discursives. Cette approche se base sur l'hypothèse forte que la signalisation de structures discursives repose généralement non pas sur la seule occurrence dexpressions lexicales spécifiques, dites « marqueurs discursifs », mais sur des configurations d'indices. Nous mettons en uvre cette approche sur un corpus conséquent en nous centrant sur lexamen des éléments en position initiale, « point de départ de lénoncé ». Les indices impliqués dans les configurations recherchées relèvent alors du lexique (les éléments repérés en position initiale), mais également de la position textuelle des expressions (début de section, de paragraphe, phrase intraparagraphique), et du type de texte.
Notre méthode, qui s'inscrit pleinement dans les linguistiques de corpus et fait appel à des traitements automatiques, se base sur de grandes quantités de données pour mettre au jour des corrélations entre traits linguistiques. Nous montrons que les profils de début de phrase varient significativement selon la position textuelle et le type de texte. Nos résultats nous permettent de mettre en lumière le rôle essentiel joué par la structure du document (prise en compte à travers la position textuelle) dans le fonctionnement de certains « marqueurs discursifs ». Par ailleurs, les corrélations établies entre « marqueurs » et structure du document mettent au jour des modes de développement à même de caractériser des types de texte différents.
© Institut de Linguistique Française 2008