常用的英语语料库
2022/10/27 17:07:41 阅读:448 发布者:
1.英国国家语料库(BNC)
网站地址:
natcorp.ox.ac.uk/
英国国家语料库(British National Corpus)是目前世界上非常有代表性的当代英语语料库之一,由英国牛津出版社、朗文出版公司、牛津大学计算机服务中心、兰卡斯特大学英语计算机中心以及大英图书馆等联合开发建立。以来源广泛的书面语和口语为样本,呈现了20世纪后期以来的英式英语。其中词容量超过一亿,书面语占90%,口语占10%。
BNC包含了各个年龄段、各个社会阶层的语言,覆盖英国语言的方方面面。整个语料库包含4054篇文本取样,每篇抽样文本的长度不超过45000词。
2.美国当代英语语料库(COCA)
网站地址:
english-corpora.org/coc
美国当代英语语料库,简称COCA,是目前最大的免费英语语料库,它由包含 5.2 亿词的文本构成,这些文本由口语、小说、流行杂志、报纸以及学术文章五种不同的文体构成。从 1990 年至 2015 年间语料库以每年增加两千万词的速度进行扩充,以保证语料库内容的时效性。因此,美国当代英语语料库被认为是用来观察美国英语当前发展变化的最合适的英语语料库。
3.美国国家语料库(ANC)
网站地址:
anc.org/
美国国家语料库(American National Corpus)记录了20世纪90年代以来,2200万美式英语的口语和书面语词汇。它是目前规模最大的关于美式英语使用现状的语料库,也极大地促进了语料库语言学的发展。
4.柯林斯英语语料库(BOE)
网站地址:
collinslanguage.com/wor
柯林斯语料库为目前世界三大著名语料库之一,该语料库(The Bank of English)为英国伯明翰大学与Harper Collins出版社合作建立的COBUILD语料库的一部分,目前固定在4.5亿词的规模,可以在线检索。
柯林斯英语语料库是从20世纪80年代开始在John Sinclair教授指导下建立的,主要应用与词典编撰的一个大规模语料库。目前Haper Collins出版社已根据该语料库编撰出版了多本非常有影响的英语词典。
转自:“中小学英语教学研究”微信公众号
如有侵权,请联系本站删除!