2025年5月22日,上海外国语大学语言科学研究院蕾蕾教授做客中国外语战略研究中心“语言与未来讲坛”,做了题为《汉语文本可读性研究:测量与应用》的学术讲座。本次讲座由上海外国语大学语言科学研究院李晶洁教授主持,数百名师生线上参加了本次讲座。
讲座伊始,雷蕾教授首先追溯可读性研究的历史脉络,指出自 20 世纪 50 年代以来,文本可读性评估在教育领域需求迫切,如教材编写、语言水平测试等场景均需科学的难度控制方法。除教育外,医学、金融、信息科学等领域也对文本难度测量有实际需求,例如医院知情同意书的易读性优化、上市公司年报的可读性与股市表现关联等。他强调,现有研究多聚焦英文,汉语研究虽起步较早,但仍以词汇、句法层面的浅层指标为主,语义和语篇层面的深入分析较少。针对现有研究不足,雷教授团队开发了汉语可读性评估工具Alpha Readability Chinese。该工具突破传统,构建了包含词汇、句法、语义的多维度指标体系,即词汇与句法、语义、语篇。
讲座中,雷蕾教授通过三个案例展示工具的应用价值。国际中文教育场景:对《博雅汉语》150 篇教材文本的分析显示,工具对初、中、高级文本的分类准确率达 83.6%,为教材分级提供数据支撑;学科差异研究:对比理工科与人文社科论文摘要发现,理工科文本虽因术语密集导致词汇难度较高,但句法和语篇连贯性更优,可读性整体更易;文学文本分析:对金庸、古龙小说的计量研究表明,金庸作品因词汇复杂度和语义丰富度更高,可读性显著低于古龙作品,验证了工具在文学风格区分中的适用性。
在讲座的互动环节,雷教授就 “英语指标迁移汉语的可行性”“文本片段分割计算” 等问题回应称,汉语独特的话题优先、语义模糊等特征需定制化指标,工具通过分词、词性赋码等预处理实现汉语适配,且支持文本片段滑动窗口计算以消除长度偏差。他透露,团队正开发基于机器学习的难度分类模型,未来将进一步提升工具的智能化水平。
本次讲座系统展现了汉语可读性研究的学术深度与应用潜力,雷蕾教授团队开发的工具为汉语教育、文本生成、跨学科研究提供了高效的量化分析工具,助力构建更科学的汉语语言评估体系。





撰稿:尹春敏
审定:朱晔
终审:赵蓉晖