欢迎访问文稿网!

语料库语言学

范文之家 分享 时间: 加入收藏 我要投稿 点赞

语料库语言学

    6.1.2 语料库语言学

    与计算词典学不同的是,语料库语言学并不只是为词典编纂服务,它在语言研究、语言教学研究、翻译研究、机器翻译研究及词典编纂等方面都有广泛的应用。那么,何谓语料库?

    语料库是语言产出的真实(authentic)示例的收集,包括口语和书面语。利用真实的语言资料来研究语言一直是语言学的传流,传统的语料库完全倚赖手工搜集语料并记录在卡片上。James Murray等编纂《牛津英语大词典》,从开始到结束的70多年中曾用手工方式积累真实语言素材,共制卡片500多万张;17卷本的《现代俄罗斯标准语词典》从1884年开始耗时17年,共制作卡片600多万张,而据此编纂的词典直到1965年才完成;而德国格林兄弟的词典竟编了整整一百年。荷兰的英语语法学家Poutsma和Kruisinga以及《现代英语语法》作者、著名语言学家Jesperson也曾以很原始的方法积累真实语言素材,并基于这些素材发现语言规律和解释语言现象。我国的传统词典编纂手段也是如此,《词源》主要编纂者吴泽炎亲手摘录卡片达60万张,《英汉大词典》收集制作资料卡片共计50万张,全靠手工摘录(陆谷孙,1998:41)。不得不承认的是,这种手段一方面工程巨大,浩如烟海,搜集、整理和加工卡片艰难繁复,无异于约翰逊博士所说的“苦役”,拖长了词典的编纂周期,词典的时效性较差,搜集到的语料难免会过时;另一方面由于资料搜集缺乏客观性和系统性,传统手段的局限性不可避免地会引起释义、设例上的偏颇。在信息膨胀、计算机技术日新月异的今天,传统的语料库有待于被新型的基于计算机技术的语料库所替代。

    然而在20世纪五六十年代,随着Chomsky生成语法学派的兴起,“基于语料”的语言描述方法曾遭到批评。Chomsky曾批评说任何自然语言语料都是偏颇的,他们认为语料是语言行为(performance)的取样,与人们的语言能力(competence)完全是两回事。因此,分析真实语篇对解释语言的语法不可能起任何作用,更不用说形成一种普遍的语言理论。到了60年代初,语言学家由语感(intuition)或诱发(elicitation)所得到的语言使用例子成了语言学研究的主要数据来源,人们对真实语言素材的兴趣降到极点。(Chomsky,1962;崔淑珍,2001:29)

    1959年,Quirk不畏压力,宣布创建“英语用法调查语料库”(The Survey of English Usage Corpus,即SEU),用于搜集大量不同文体的英语素材,开始了语料库的研究工作。SEU的建立标志着语料库由传统手工收集方式过渡到计算机化语料库。(王小海,2001:15)此后1961年,Francis和Kucera在美国布朗大学建成了世界上第一个机读的Brown语料库(Brown University Standard Corpus of Present-day American English),后被应用于《美国传统英语词典》的编纂。1970年,英国的兰喀斯特大学在挪威同行的帮助下,建成了LOB语料库(Lancaster/Oslo-Bergen Corpus of British English)。1980年,柯林斯出版公司和伯明翰大学在Sinclair主持下建立了COBUILD大型语料库。1990年代后语料库的规模越建越大,英国国家语料库(British National Corpus,BNC)和英语语料库(Bank of English),收词都超过一亿,COBUILD于1991年起建的BOE(Bank of English)英语库截至1998年容量已达到3.29亿。

    40多年来,随着建立语料和语言研究手段的不断完善,语料库语言学逐步得到发展。与传统的语言结构研究相比,语料库语言学的主要研究方法的最大特征在于通过考察相关的“联结模式”(association patterns)研究语言的使用。联结模式既表现为量的关系,也表现为质的关系。定量分析表示语言特征及不同形式与语境之间的联结程度,定性分析则对此做出功能的解释。

    语料库语言学研究方法的主要特点是:

    1)具有实验性,分析自然语言文本中语言使用的实际模式;

    2)以语料库为分析研究的基础;

    3)使用计算机的自动与互动技术进行分析;

    4)使用定量与定性分析的技术。

    (潘永樑,2000:389)

    语料库语言学可以应用于很多方面的语言研究,包括词典编纂、词汇、语法、语篇、语域、文体、语言习得、语言的历时与共时研究,等等。

221381
领取福利

微信扫码领取福利

微信扫码分享