《巴纳比·拉奇》的语料库分析

(整期优先)网络出版时间:2024-07-31
/ 2

《巴纳比·拉奇》的语料库分析

田原

(四川师范大学 外国语学院,四川 成都610068)

摘要: 为了研究《巴纳比·拉奇》的内在涵义,作者对《巴纳比·拉奇》的英文文本进行语料库分析,包括统计分析、词频分析和词汇聚类分析。

关键词: 语料分析; 巴纳比·拉奇; 词频分析

《巴纳比·拉奇》是英国小说家查尔斯·狄更斯发表的第五部小说,完成于1841年。小说描写的是1780年在英国爆发的一场反天主教的动乱,也这是狄更斯的第一部历史小说,被评论家认为是狄更斯最被忽视但最有价值的小说之一。我们对《巴纳比·拉奇》的英文文本[1]进行了语料库分析。

一,统计分析

使用统计工具WordSmith Tools,我们得到了《巴纳比·拉奇》的文本统计数据。以下是统计结果的部分摘要。

NOverall1

text fileBarnaby Rudge.txt

1-letter words8,750

2-letter words44,001

3-letter words61,461

4-letter words50,471

5-letter words29,030

6-letter words21,057

7-letter words16,981

8-letter words10,958

9-letter words6,917

10-letter words3,830

11-letter words1,801

12-letter words954

13-letter words476

14-letter words98

15-letter words6363

二,词频分析

词频分析(Word Frequency Analysis)是文本分析的重要手段,它的基本原理是通过词出现频次多少的变化,来确定热点及其变化趋势。因此,我们对文本进行了词频分析。诸如that, for, but等功能词具有高频率,因此省略了这些功能词。以下是按照降序排列的高频率的主要实义词。

NWordFreq.%

21SAID1,4550.57

44MR8470.33

51MAN7590.30

65SIR5500.21

71GOOD4540.18

76GREAT4420.17

77KNOW4400.17

82NIGHT4170.16

84JOHN4120.16

90LITTLE3910.15

91HAND3830.15

93Barnaby3600.14

从这个频率表中,我们可以看到:出现频率最高的几个名词是Mr.,Man,Sir,John和Barnaby,这反映了《巴纳比·拉奇》的一大特点:狄更斯作品中罕见的开篇就抛出的双线索。第一条线索是英国历史上的一次民众暴动,即发生在1780年的“戈登暴动”。第二条线索是发生在海德家中的一宗谋杀案。案中遇害者有两人,一个是男主人,另一个是家里的管家。警方断定杀人凶手是看园人,并将其逮捕关入大牢。看园人的妻子在谋杀案发生的第二天生下一个儿子,名叫巴纳比·拉奇。巴纳比长大后,由于参与戈登暴动而被捕入狱,他在牢房中见到了自己的父亲,最终解开了多年前的谋杀案之谜,而巴纳比因为参与暴动被判处了绞刑。

三,词汇聚类分析

词聚类分析是通过文献聚类统计的方法,计算词之间的联系密切程度,并将距离较近的主题词聚集在一起,“形成一个个概念相互独立的类团,使得类团内属性相似性最大”[2]。使用单词聚类分析,我们发现与小说主题直接相关的频率最高的三个词是Man、Night和Hand。

NWordFreq.

51MAN759

71GOOD454

76GREAT442

82NIGHT417

91HAND383

Man出现了759次,Night出现了417次,Hand出现了383次。词汇类聚分析能够揭示出作者的写作特征。仔细查看数据,我们发现:作品的主人公巴纳比·拉奇是一个好心的简单的人,小说是从巴纳比的观察角度,描写了气势磅礴的大规模民众暴动的场面。Man表明“人”的主体作用,Night表明了故事发生的时间是“夜晚”,Hand是民众进行反抗的“双手”。作品中较大篇幅的现实主义描写以及流血冲突,使得读者难免有心情沉重之感。但另一方面,Good和Great却给作品的整体氛围带来了一定的光明之感,因为Good和Great都是高频的褒义词,在作品中对人物言行进行修饰和刻画,这充分表明了狄更斯在这部作品中表现出对动乱者一定的同情心。

下面是Hand和Great的同现集(concordance set)的一些样本。

NConcordance  Set of HAND

1roof, that the man stayed his hand in the very act of striking

2and passed from hand to hand with such rapidity

3mass bore, each man in his hand, a blazing brand.

NConcordanceSet of GREAT

1the noiseless breaking of great beams of wood, which

2make of the spoil they bore, a great bonfire, near at hand

3you know?' retorted John with great dignity. 'You're a

总之,《巴纳比·拉奇》是狄更斯一部容易被忽视但却富含价值的优秀作品。从题材内容上看,狄更斯以此尝试了历史小说的体裁;从写作手法上看,其开篇就抛出双线索模式,更好地展现了历史事件的宏大场面和叙述的多维度性;从思想批判上看,狄更斯通过这部小说从一定程度上揭露了资本主义社会存在的一些重大社会问题,彰显了该作品厚重的现实主义关怀。

参考书目:

[1]Dickens, Charles. Barnaby Rudge. Wordsworth Editions Ltd, 1998.

[2]Ullmann, Stephen. The Principles of Semantics. Glasgow: Jackson, 1957.

附:英文标题、摘要、关键词、作者简介

The Corpus Analyses of the Text of Barnaby Rudge

TIAN Yuan

(School of Foreign Languages,Sichuan Normal University, Chengdu, Sichuan 610068, China)

Abstract: For the potential implications of Barnaby Rudge, corpus analyses of the text are performed: statistics analysis, Word frequency analysis and Word cluster analysis.

Key words: corpus analysis, Barnaby Rudge, Word frequency

作者简介:田原(1977―),男,汉族,四川内江市人,四川师范大学 外国语学院副教授,英语语言文学硕士,研究方向为英语语言学、文本分析。