You are here

News

The DEAP (Database of English for Academic Purposes) Corpus

The DEAP Corpus: An EAP corpus for China

-->Size of the DEAP Corpus as of 6 August, 2019: 20 million words<--
-->DEAP学术英语语料库当前规模(截止2019年8月6日):2000万词次<--

CQPweb in Korea

http://cqpweb.kr

 

This website is mainly for researchers who are working on Korean, English, and German Corpora. Prof. Minhaeng LEE, Yonsei University has developed and is managing this website in cooperation with Prof. Seung-Shik KANG, Kookmin University 

rstWeb - Browser Annotation of Rhetorical Structure Theory

https://corpling.uis.georgetown.edu/rstweb/info/

 

rstWeb is an open source, browser based annotation tool for discourse analyses in Rhetorical Structure Theory. It is meant to support collaborative, online annotation projects using just a web browser, without the need to install software for annotators.

New: Version 3 is now out, supporting discourse relation signal annotation! For more information.

Do RST: Online — Collaborative — Browser Based!

《语料库与话语研究》配套网页 Corpora and Discourse Studies Companion Website

许家金,2019,《语料库与话语研究》。北京:外语教学与研究出版社。

第一章:概述

刘海涛教授计量语言学报告

2019年6月18日下午16:00-18:00,浙江大学刘海涛教授在110期语料库沙龙上做了题为“大数据时代语言研究的思考与践行”的学术报告。

刘教授以大数据为人类生活创造了前所未有的可量化维度为背景,提出大数据带给语言研究的机遇,计量语言学越来越受到学界青睐。同时,刘教授也向大家展示了基于语言大数据研究的挑战,即自然语言处理界对于语言学家作用及贡献的争议。随后,刘教授介绍了基于多语言依存距离进行的相关研究,展示了大数据时代计量语言学研究的最新成果,包括通过对依存距离的计算,揭示认知规律及语言普遍性、生态多样性与语言多样性之间的关系等。

报告后,刘教授与现场师生就大数据分析在商务文本中的应用、翻译文本质量测量、以及依存距离与短时记忆之间关系的研究等问题展开了讨论与互动。

 

张克定教授谈非现实位移事件

2019年5月24日下午15:00-16:30,河南大学张克定教授在109期语料库沙龙上做了题为“非现实位移事件的主观性与客观性”的学术报告。 张教授首先对现实位移事件、非现实位移事件、主观性与客观性的定义及研究现状进行介绍和梳理。基于此,张教授指出非现实位移事件与客观事实不相符,具有主观性;人作为认知主体,基于自身特点及客观经验,对非现实位移事件进行识解及编码。编码必须包括位移事件的所有四个要素: 位移主体、参照实体、位移和路径,缺一不可。现实位移事件和非现实位移事件所呈现出不同程度的客观性和主观性形成一种相对性连续统。报告后,张教授与现场师生就非现实位移事件中各要素的界定标准、主体对非现实位移事件进行识解编码的步骤及范围等问题展开了讨论与互动。 

要新乐博士谈澳大利亚英语语法演变

         2019年5月14日下午14:00-15:30,中国人民大学要新乐博士在第108期语料库沙龙上做了题为“用“聚集法”研究语法演变:以20世纪澳大利亚英语为例”的学术报告。
         要新乐博士对20世纪澳大利亚英语语法整体发展进行了研究。研究使用聚类分析、多维标度等“聚集法”,基于“AusBrown”语料库从69个语法特征的分布情况对澳大利亚英语四个不同时期的发展进行了探讨,并与同时期基于“BLOB”、“LOB”、“FLOB”和“BE06”语料库的英国英语和“BBrown”、“Brown”、“Frown”、“AE06”语料库的美国英语进行了对比研究,发现20世纪60年代至90年代是澳大利亚英语发展的关键时期,这一时期之后呈现了三种语言变体结合的特征。报告后,要博士与现场师生就语料的选取、研究方法的拓展等问题展开了讨论与互动。   

MedDEAP corpus (5M words) available

     The MedDEAP corpus is now freely available at http://www.corpuscloud.cn on a registration basis. Please go to the Settings (设置)-Display Settings (显示设置) and check the box [MedDEAP] before you can view the corpus on the main page.

 

刘泽权教授报告“《源氏物语》六个中译本的对比研究

 

2019年4月24日下午15:10-17:00,河南大学刘泽权教授在第107期语料库沙龙上做了题为“《源氏物语》六个中译本多变量对比考察”的报告。

刘教授首先简要介绍了日本长篇小说《源氏物语》及其六个中译本的概况,并指出目前相关研究存在碎片化、主观化等问题。随后刘教授基于自建的《源氏物语》六个全译本语料库,从词汇使用(标准类/形符比、词汇密度、报道动词、连词、语气词、“爱恨”类情感词)、平均句长、和歌翻译和文本相似度(聚类、余弦和编辑距离分析)等多个层面考察了六个中译本的异同。翔实的量化数据,辅以文本分析,为重译本之间的沿袭关系提供了有力支撑。

报告后,刘泽权教授与现场师生就考察变量的选取、名著重译的价值等问题进行了热烈讨论。

 

 

iWriteBaby Corpus 1.0 beta available

    iWriteBaby Corpus 1.0 beta is now freely available at http://www.corpuscloud.cn on a registration basis. Please go to the Settings (设置)-Display Settings (显示设置) and check the box [iWriteBaby Corpus 1.0 beta] before you can view the corpus on the main page.

Pages

Subscribe to News