施建军、王大钊:基于汉文体计量特征的《日本书纪》各卷分类研究

发布者:中国外语战略研究中心发布时间:2024-11-21浏览次数:278

标题:基于汉文体计量特征的《日本书纪》各卷分类研究

作者:施建军(上海外国语大学语言研究院)、王大钊(上海外国语大学日本文化经济学院)

来源:《日语学习与研究》2024年4期

摘要:《日本书纪》是日本现存最早用汉字和汉文编纂的史书。从语言的角度来看,该书各卷所使用的汉文体呈现出了不同的特点。前人根据万叶假名的汉字及音韵系统、天皇即位和定都的叙事风格、天文天象的记载情况、语言表达的语法问题等尝试对该书各卷进行划分,但是这种分类不能够系统反映各卷的汉文体特点,也无法对第1卷、第2卷、第30卷进行划分。常用字词的使用和分布可反映文章的行文特点,本文利用无指导机器学习技术对这些汉文体语言特征进行聚类分析并和《隋书》进行对比发现,《日本书纪》30卷的汉文体可以分成4类,部分结果和前人研究结果一致。新的发现是,《日本书纪》第1、2、3卷的汉文体和《隋书》一致;第14卷至30卷(第23卷除外)和《隋书》相似;第5卷至13卷以及第23卷和《隋书》差距较大;第4卷的行文不但和《隋书》不同,也和《日本书纪》其他各卷有很大差距。通过对《日本书纪》和《古事记》汉文体的研究也证明,前沿的语言智能技术可以在古文献研究中发挥作用。

关键词:日本书纪;隋书;汉文体;文本聚类

引用格式(GB/T 7714—2015):施建军,王大钊.基于汉文体计量特征的《日本书纪》各卷分类研究[J].日语学习与研究,2024,(04):12-25.DOI:10.13508/j.cnki.jsr.2024.04.008.

 

 

        

关闭