Numéro |
2010
|
|
---|---|---|
Numéro d'article | 139 | |
Nombre de pages | 16 | |
Section | Syntaxe | |
DOI | https://doi.org/10.1051/cmlf/2010201 | |
Publié en ligne | 12 juillet 2010 |
tu veux couper là faut dire pourquoi. Propositions pour une segmentation syntaxique du français parlé
1
Université Nancy 2, 44, avenue de la Libération, 54063 Nancy, France
2
Université de Louvain, place Blaise Pascal, 1, 1348 Louvain-la-Neuve, Belgique
3
Paris 3, 19, rue des Bernardins, 75005 Paris, France
4
Modèles, Dynamiques, Corpus, Université Paris 10
bâtiment A - Bureau 402 A
200, Avenue De La République
92001 Nanterre Cedex
5
Université Paris Ouest Nanterre, xxx, 92001 Nanterre, France
6
Université de Provence, 29, Avenue Robert Schuman, 13621 Aix-en-Provence cedex 1, France
Contact : anne.dister@uclouvain.be
Cet article s’intéresse à une question théorique majeure : la segmentation de transcriptions de français parlé en unités syntaxiques. Nous avons abordé cette question de manière pratique dans le cadre d’un projet d’annotation syntaxique et prosodique de français parlé, le projet ANR Rhapsodie. Dans cet article, nous décrivons l’élaboration de critères reproductibles et opératoires utilisés pour la segmentation des transcriptions brutes du corpus. Dans un premier temps, nous présentons nos trois unités d’analyse, à savoir l’unité rectionnelle (UR), l’unité illocutoire (UI) et l’énoncé mais aussi ce qui nous a conduits à choisir trois unités maximales plutôt qu’une seule. Nous étudions ensuite différents types d’énoncés complexes, notamment les questions-réponses, l’instanciation, le discours rapporté, la greffe, le parallélisme entre énoncés ou encore les énoncés discontinus. Nous présentons la segmentation proposée et quelques-uns des problèmes que nous avons rencontrés au cours de l’élaboration du manuel d’annotation.
© Owned by the authors, published by EDP Sciences, 2010