LU Yuanfeng | 陆源峰
Caractérisation des styles littéraires par l’extraction automatique des patrons syntaxiques dans des romans français du 19ème siècle


Sujet de thèse :
Caractérisation des styles littéraires par l’extraction automatique des patrons syntaxiques dans des romans français du 19ème siècle
Direction : Thierry POIBEAU
Laboratoire : LATTICE |
论文题目:
通过自动提取19世纪法国小说中的句法结构探析文学风格的特征
导师 : Thierry POIBEAU
实验室: LATTICE |
Résumé : Comment l’analyse syntaxique automatique peut-elle être utile pour identifier et caractériser les styles littéraires ? Dans cette thèse, nous proposons de répondre à cette question en considérant les patrons syntaxiques comme des marqueurs stylistiques performants pour identifier, mais aussi caractériser les styles littéraires dans les romans français du 19ème siècle. Un parcours des notions de style, stylistique et stylométrie est présenté au début de la thèse pour mieux situer nos recherches dans la stylistique. Les extractions de patrons syntaxiques (ainsi qu’une méthode originale permettant de mesurer la complexité syntaxique d’un corpus) se fondent sur l’analyse syntaxique en dépendances fournie par le système UDPipe. La méthode d’extraction des patrons caractérisants (à savoir les figures de style d’ordre syntaxique) et la méthode d’extraction des patrons identificatoires (dont la spécificité est de nature purement statistique) sont appliquées à l’œuvre romanesque de Victor Hugo d’une part, et à un corpus plus grand, constitué des romans de Chateaubriand, Flaubert, Hugo et Stendhal d’autre part. Les résultats d’application démontrent la robustesse de notre méthode à caractériser les styles littéraires. Cette méthode, fondée sur des patrons plus précis et plus interprétables que ceux produits par les méthodes précédentes, permet de mener à bien l’analyse stylistique des auteurs du corpus. Notre méthode combinatoire accomplit à la fois la tâche d’identification et de caractérisation de la stylistique, mêlant analyse quantitative et analyse qualitative des patrons identifiés. Elle démontre la capacité satisfaisante des patrons syntaxiques à différencier les styles littéraires, et permet de confirmer (ou au contraire, parfois, de contredire) les observations passées sur les auteurs visés.
Contact :yuanfeng.lu@ens.psl.eu |
摘要: 自动句法分析如何能够识别和描述文学风格?在这篇论文中,我们提出将句法结构视为有效的文体标记,以识别和描述19世纪法国小说的文学风格。在论文的开头,我们对文体、文体学的概念进行了回顾,以便更好地将我们的研究置于文体学中。句法结构的提取(以及衡量语料库句法复杂性的原创方法)是基于UDPipe系统提供的句法依赖分析。提取特征结构(即基于句法的修辞手法)的方法和提取辨别性结构(其特殊性具有纯粹的统计性质)的方法一方面应用于维克多-雨果的小说,另一方面也应用于更大的语料库,包括夏多布里昂、福楼拜、雨果和司汤达的小说。应用结果证明了我们的方法在描述文学风格方面的有效性。这种方法基于比以前的方法更精确和更具有阐释能力的模式,使我们有可能对语料库中的作者进行文体分析。我们的组合方法既完成了识别文体的任务,也完成了文体的特征分析,把对句法结构的定量和定性分析结合起来。它证明了句法机构在区分文学风格方面令人满意的能力,并使我们有可能证实(或者推翻)过去对有关作者风格的文学研究。
联系:yuanfeng.lu@ens.psl.eu
|