所在位置: 首页  学术研究  科研动态
应用语言学科研团队暑期科研系列报道(三):参加“语料库在外语教学与研究中的应用研修班”
发布时间:2022-08-23 8:51:00浏览次数:0

818-19日,外国语学院应用语言学研究科研团队全体教师在线参加了外研社2022年暑期全国高等学校外语学科中青年骨干教师高级研修班第十期——“语料库在外语教学与研究中的应用研修班。本期研修班特邀北京外国语大学许家金教授、刘鼎甲博士和徐秀玲博士主讲,详细介绍了语料库语言学的基本概念、当前主流的语料库资源、语料库创建与加工的方法、通用语料库工具的核心功能、R语言在语料库研究中的应用、数据驱动学习的原则与方法等内容,并通过操作演示,帮助来自全国近300所院校的500余名参班教师和研究人员掌握语料分析与统计工具,精进语言研究与教学能力,提高科研效率。 

研修主要包括三大部分:

一、厘清语料库基本概念,认识语料库类型与功能

许家金教授系统梳理了国内外不同类型的主流语料库,主要包括通用语料库、专用语料库、自建语料库、本族语语料库与非本族语语料库等。随后,许教授以Brown CorporaCQPwebDEAP Corpus为例,详细介绍了在线通用语料库的建设历程、代表人物及研究用途。

然后许教授演示了通用语料库工具的核心功能,主要包括列表(含词表、短语表及主题词表)和检索功能(简单检索、高级检索及搭配分析),用AntConc语料库工具分别展示了Crown美国英语语料库和DEAP学术英语语料库的使用方法,并以DEAP语料库中的AgriDEAP子库为例,分析了农业英语的词汇特色,为参班教师提供了相关研究的选题思路和建议。除了在线语料库资源之外,许老师还展示了一些需要下载的语料库工具(WordSmithAntConcMonoConcPowerConc)。 

二、学习语料库创建,探究语料库应用实践

为帮助参班教师了解语料库的创建与加工过程,刘鼎甲老师先讲解了语料库的设计思路和语料的取样原则,之后介绍了TreeTaggerUSAS English semantic taggerStanza等语料库加工工具,并带着参班教师分步进行元信息标记、词性标注和句法标注、文件转码和批量更改文件名等操作。


    徐秀玲老师以当前一些主流的中英文在线语料库平台,如多语种在线语料库检索平台BFSU CQPweb、语料天涯(Corpora A-Z)、BCC语料库(北京语言大学现代汉语语料库)、绍兴文理学院开发的中国汉英平行语料大世界、COCA等为例,详细演示了如何通过正则表达式在语料库中进行词汇检索,以此来找到更常见、更地道的词汇表达,帮助参班教师更好地利用语料库资源开展语言研究和教学活动。

三、认识R语言统计方法,领悟数据解读与分析

针对RRStudio的安装步骤,刘鼎甲老师做了一步步详细拆解,耐心解答参班教师在安装过程中出现频率较高的问题。为更好地将语言研究与R语言统计方法衔接起来,徐秀玲老师通过带领参班教师解读R语言在语料库研究领域的论文案例,帮助各位老师初步了解翻译语言研究中的条件推断树方法和语法研究中逻辑斯蒂回归建模方法。

随后,徐秀玲老师带领参班教师一步步地进行条件推断树和逻辑斯蒂回归建模的操作,包括用Rstudio打开代码、导入text文本、更改数据类型、数据汇总、加载程序包、绘图与图形解析、建模评估等步骤,详细解析了衡量模型拟合度的指标(模型的总体分类准确度和模型的C值),并结合案例中的固定效应和随机效应数据对模型评估结果进行解读。由于R语言的统计方法对于部分参班教师而言具有一定难度,徐秀玲老师还推荐了一些R语言入门书籍,并鼓励各位老师课后多阅读相关文献。



徐老师正在讲解Ctree

这次培训激发了应用语言学科研团队教师深入学习语料库的兴趣,启发了大家应用语料库进行外语教学与科研的思路。各位老师表示,今后一定多阅读、多积累相关文献,夯实理论基础、提高实践能力,拓展语料库相关的教学、科研思路。

 

图文:潘红

审核:余玉秀



上一篇:下一篇:
  • 地址:海南省三亚市吉阳区学院路191号南区书知一号楼
  • 学院办公室电话:0898-88386795 团委办公室电话:0898-88567253
  • 传真:0898-88386795 电子邮箱:2227186390@qq.com
  • 三亚学院外国语学院 版权所有
  • Copyright © 2024 University Of Sanya. All Rights Reserved.
  • Design By Taoyuan
    • USY外国语学院
      官方抖音号

    • USY外国语学院
      微信公众号

    • USY外国语学院
      官网手机版