词汇是语言的基石,在语言学习中具有举足轻重的作用,词汇教学与测试近些年来越来越受到国内外语言教学界和研究界的重视。随着信息化、全球化的推进,英语教材词汇是否能够满足学生的学习及信息交流需求,是一个值得探索的问题。智慧教育时代的到来不仅对语言测试提出了新的要求,也为语言测试指明了方向。
本书主要内容包括:语料库概述、英文网页语料库的构建过程、基于语料库的中小学英语词汇分析、基于语料库的词汇试题自动生成。全书共9章,回顾了语料库在自然语言处理领域和语言研究领域的相关应用,尤其是在教材词汇研究和语言测试中的应用,梳理了试题自动生成和句子难度评估的相关文献,介绍了英文网页语料库的构建过程,在语料库的基础上对以中小学英语为例的教材词汇和词汇试题自动生成展开了分析和研究,并给出了相应的实验结果。本书是语言与计算机的跨学科研究方面的专著,为今后基于计算机技术的词汇和语言测试研究奠定了一定的基础,为同类研究提供了参考。
本书可作为从事语料库语言学、自然语言处理、智慧教育研究的科研人员的参考书,也可供高等院校语言学、智能科学与技术类、计算机和语言的跨学科研究类的相关研究生及本科生使用。
为了弥补国内中小学英语教材词汇研究的不足,同时为人工智能和英语教学搭建桥梁,本书拟以动态的视角对中小学英语教材词汇进行多维度的、科学的分析,并对服务于词汇学习的试题自动生成进行研究。主要研究内容如下:(1)面向教材词汇分析和更新的大规模英文网页语料库的构建;(2)基于语料库的中小学英语教材词汇分析和建议补充词表的提出及验证;(3)基于语料库的个性化词汇试题自动生成研究。
肖文艳,江西井冈山人,文学博士。现为江西理工大学基础课教学部讲师,硕士生导师。主要研究领域为计算语言学、教材与词汇研究、二语习得等。
第1章 绪论
1.1 研究背景
1.2 本书的研究内容
1.3 词汇计数单位界定
1.4 本书的指导理论与方法
1.4.1 指导理论
1.4.2 研究方法
1.5 研究意义与创新点
1.5.1 研究意义
1.5.2 本研究的创新点
1.6 本书的组织结构
第2章 语料库及其应用
2.1 语料库概述
2.1.1 语料库定义
2.1.2 语料库发展历史
2.1.3 语料库类型
2.2 语料库应用
2.2.1 语言学研究领域
2.2.2 自然语言处理领域
2.3 本章小结
第3章 语料库与词汇、测试研究
3.1 语料库与词汇研究
3.2 语料库与教材词汇研究
3.3 语料库与语言测试研究
3.4 本章小结
第4章 试题自动生成研究
4.1 概述
4.2 多项选择题的自动生成研究
4.2.1 题干生成
4.2.2 干扰项生成
4.2.3 试题质量评价
4.2.4 国内相关研究
4.3 试题自动生成研究小结
4.4 本章小结
第5章 句子难度评估研究
5.1 文本可读性
5.2 句子难度评估
5.2.1 句子难度评估的必要性
5.2.2 句子难度评估方法及使用特征
5.2.3 汉语句子难度评估
5.2.4 文本和句子难度评估的新进展
5.2.5 句子难度评估研究小结
5.3 本章小结
第6章 语料库的构建
6.1 引言
6.2 英文网页语料库的构建
6.2.1 语料库构建概述
6.2.2 英文网页语料库的总体设计和规划
6.2.3 语料收集
6.2.4 语料预处理和加工
6.2.5 基本数据
6.3 本研究使用的其他语料库
6.3.1 BNC语料库
6.3.2 英文字幕语料库
6.4 本章小结
第7章 基于语料库的中小学英语教材词汇分析
7.1 引言
7.2 词表及相关指标
7.2.1 中小学英语教材词表
7.2.2 语料库词频表
7.2.3 相关指标与术语
7.3 小学英语教材词汇分析
7.3.1 实验设置
7.3.2 实验结果和分析
7.3.3 小学英语教材词汇分析小结
7.4 中学英语教材词汇分析
7.4.1 实验设置
7.4.2 实验结果和分析
7.4.3 补充词表的提出及评估
7.4.4 中学英语教材词汇分析小结
7.5 本章小结
第8章 基于语料库的试题自动生成
8.1 引言
8.2 数据集和试题自动生成方法
8.2.1 数据集
8.2.2 题干生成方法
8.2.3 干扰项的自动生成
8.3 评估和分析
8.3.1 题干句难度评估
8.3.2 干扰项评估
8.4 本章小结
第9章 总结、建议与展望
9.1 本书总结
9.2 研究启示和建议
9.2.1 本研究的理论启示
9.2.2 本研究对中小学英语教材选词的建议
9.2.3 本研究对中小学英语词汇教学和测试的建议
9.3 研究展望
参考文献
附 录
附录Ⅰ:Dell'Orletta et al(2014)句子可读性特征
附录Ⅱ:EWC词频表前90个单词信息
附录Ⅲ:小学英语建议补充词表
附录Ⅳ:中学英语建议补充词表1
附录Ⅴ:中学英语建议补充词表2
附录Ⅵ:未覆盖的new-GSL词汇
附录Ⅶ:介词表
附录Ⅷ:自动生成的介词多项选择题
后记