The Corpus Linguistics Group of Beijing Foreign Studies University is pleased to announce the launch of an academic English corpus initiative. The project calledDEAP – Database of English for Academic Purposes– aims to collect texts of 100 million words from different disciplines.
A workshop was organised at Beijing Foreign Studies University on 10 July 2016 to negotiate among the project participants the guiding principles of data collection for the Phase 1 of the project.
Co-Principal Investigators
Professor Maocheng Liang
Professor Wenzhong Li
Professor Jiajin Xu
Professor Wenxin Xiong
Disciplines and Prticipants of the DEAP Project
DEAP 01: Economics and Management (Kevin Feng Jiang)
DEAP 02: Education (Li Wang)
DEAP 03: Information Science (Computer Science) (Yaocheng Deng)
DEAP 04: Life Science (Gong Peng)
DEAP 05: Linguistics (Zhanting Bu)
DEAP 06: Literature (Tao Yu)
DEAP 07: (Clinical) Medicine (Xin Feng)
DEAP 08: Military Science (Xiaolei Ma)
DEAP学术英语语料库建设项目启动
2016年7月10日,中国外语教育研究中心语料库语言学团队主持创建的DEAP学术英语语料库项目(Database of English for Academic Purposes,DEAP)项目在北京外国语大学正式启动。该项目得到中国英汉语比较研究会专门用途英语专业委员会、外语教学与研究出版社、汇智明德(北京)教育科技有限公司的学术、资金和技术支持。DEAP语料库项目由梁茂成教授、李文中教授、许家金教授、熊文新教授统筹策划。
DEAP学术英语语料库设计规模为不少于1亿词次。项目一期工程立项8个学科门类的学术英语语料库,每个学科门类规模为500万词次。各语料库按统一的取样方案、建设流程进行。
此次立项的8个子语料库分别为:
经济与管理学术英语语料库(哈尔滨师范大学/香港大学,姜峰)
语言学学术英语语料库(青岛大学,布占廷)
文学学术英语语料库(江苏师范大学,于涛)
医学(临床)学术英语语料库(福建医科大学,冯欣)
信息科学(计算机科学)学术英语语料库(大连海事大学,邓耀臣)
教育学学术英语语料库(南通大学,王丽)
生命科学学术英语语料库(中国科学院大学,彭工)
军事学术英语语料库(国防科技大学,马晓雷)。
梁茂成、李文中、许家金、熊文新四位教授同8位子课题负责人就语料搜集、源文下载、文本转换与清理、语料库标记(元信息编码)、语料库入库、说明文档的制作等设计及技术问题进行了研讨并制订了详细工作方案。在项目实施过程中,四位教授将为8个课题组提供全程技术指导。
目前福建医科大学外国语学院主持建设的临床医学学术英语语料库初期100万词子语料库已建成。详见http://111.200.194.212/cqp/。后续将在此基础上扩容至至少500万词规模。基于该语料库的相关语言学及应用语言学研究也将同时展开。