EDP Sciences logo
Web of Conferences logo
Open Access
Numéro
CMLF 2008
2008
Numéro d'article 115
Nombre de pages 14
Section Lexique(s)
DOI https://doi.org/10.1051/cmlf08169
Publié en ligne 9 juillet 2008
Congrès Mondial de Linguistique Française, Paris, France, 2008
DOI: 10.1051/cmlf08169

DicoPerec

V. Montemont

veronique.montemont@uhp-nancy.fr

Publié en ligne le 9 juillet 2008

Résumé
L’œuvre de Perec, depuis la mort de l’écrivain en 1982, connaît une fortune critique qui ne cesse de grandir et qui a suscité de nombreuses approches thématiques, caractérisées par leur diversité. L’étude de la langue perecquienne se trouve néanmoins relativement fractionnée, car l’écrivain a été l’un des manipulateurs les plus experts de la langue française, ce qui rend complexe une appréhension globale du style ou des aspects rhétoriques : les romans regorgent de mots rares, de xénismes, de néologismes plus ou moins avoués, de vocabulaire technique et scientifique. Compte tenu de cette relation fascinée entretenue par l’écrivain avec la langue, il nous est apparu que la rédaction d’un dictionnaire Perec pouvait offrir un outil de travail utile à la communauté scientifique. La difficulté était de trouver un point d’équilibre entre un dictionnaire de pure élucidation lexicographique, qui paraissait insuffisant à rendre compte de la richesse de l’œuvre, et, à l’autre extrémité, une approche simplement thématique, qui aurait fait du « dictionnaire », comme il est fréquent dans la tradition littéraire, un index notionnel. L’informatique, et en particulier la base Frantext, donne une possibilité inédite : celle de traiter les listes dans leur globalité, à partir d’un corpus de 8 œuvres romanesques représentant 518 000 mots et environ 24000 lemmes. Quatre rédacteurs dépouillent ces listes, qui ont été lemmatisées et désambiguïsées, et y choisissent 2500 lemmes, retenus à divers titres : haute fréquence, utilisation en hapax, rareté nécessitant une élucidation sémantique, mais aussi lien avec les thèmes fondateurs de la poétique perecquienne (sociologie, autobiographie, formel, romanesque). Une structure de définition et un système de marqueurs métalexicographiques ont été testés et validés sur une dizaine de lemmes-tests ; par ailleurs, un format de saisie aux normes de la TEI a été développé, pour permettre la migration ultérieure du dictionnaire, conçu pour une publication papier, vers une version en ligne. L’objectif de cette communication est d’exposer la problématique de la langue perecquienne, en particulier dans son rapport à la lexicographie, puis de détailler le traitement des listes de vocabulaire. La structuration de la définition (établissement de la nomenclature, regroupement par hyperonymes, balises métalexicographiques) sera exposée, puis complétée par l’exemple d’une définition et des problèmes concrets qu’elle a soulevés.



© Institut de Linguistique Française 2008