不同于信息爆炸的现代,传世文献中的经典文本边界是相对清晰的,然而其体量对于专注于某一选题或领域的研究者依然难以全体掌握 。基于大数据技术的古代文学经典文本分析,既着眼于经典文献,又以海量的基础文献为基础,希望在较短时间内用高效、全面的数据挖掘,来进行准确有效的文本分析 。传统古典学研究中的结论多通过个人有限阅读过程中的观察、思索、领悟等方式获得,这类方式往往具备一定的主观性乃至先验色彩 。大数据的汇聚和计算分析 *** 的运用,能够使既出人意表又允执厥中的结论“自动涌现” 。
利用大数据将以往被分裂和隔绝的事物重新连接,改变了我们对文献、文本、知识的认识路径和把握尺度 。仅从字/词频统计这一大数据手段的微小切面入手,我们便已初步获得了以一种新方式探测经史、语言学、文学等领域文献的体验 。与用不同技术手段、不同结构化方式、不同颗粒度重构的集成式文献知识库相比,以上工作或许只是一份小尝试 。相信随着统计数据的累积、叠加和映射,古籍和传统文化研究一定能够焕发出更多生机和活力 。
《光明日报》( 2022年03月23日11版)
来源: 光明网-《光明日报》
推荐阅读
- read的过去式,read的过去式和过去分词形式
- 2021年9月6日出生的男宝宝名字怎样取 诗词中大气的字
- 2021年9月24日出生的男宝宝名字怎样取 诗词中大气的字
- 冉怎么读拼音 冉怎么读
- 高朋满座近义词是什么 高朋满座近义词
- 喟叹拼音 叹拼音
- 形容受益匪浅的近义词 受益匪浅的近义词
- 2021年10月7日出生的男孩最佳取名 诗词论语
- 2021年9月5日出生的男宝宝名字怎样取 诗词中大气的字
- 2021年9月18日出生的男孩最佳取名 诗词论语