录组词拼音 录组词组( 二 )


文章插图
字频统计中,考虑到虚字和实字的不同属性和阐释功能,二者通常被分别计算 。虚词在汉语史等领域的研究中经常被作为特征数据使用,同时也是作品风格比对的标志性参数,虚词的使用比重本身便构成不同作者间的风格标识 。“五经”之中,参照后世“文笔之辨”,《诗》为有韵之文,因而与其他几部书相比,高频词中实词比重更大,古人“实字多则健,虚字多则弱”的诗论观点或滥觞于此 。以高频字的虚实映射“文笔之辨”的 *** 可推及后世,普遍而言,在诗歌与词曲等文体中,实词作为高频词的概率大于散文文体 。
作为“五经”中成书年代最早的《尚书》,其虚字运用特征同样保存了上古汉语的流变痕迹 。《尚书》中频次居首者是极具上古色彩的虚词“惟”,这不仅与其中许多篇目的记言性质有关,也体现了早期汉语与后来“之乎者也于”时代的分野 。以相同视角观照近古作品,可以窥见汉语史上的另一重大变革 。对话是小说中的重要元素,表达说话行为的动词自然享有高频地位,在《三国演义》与《聊斋》中体现为“曰”,而《西游记》和《水浒传》中则体现为“道”,这是后一组作品文言色彩减弱的重要标志 。而真正的白话转型发生在《红楼梦》身上,“的”首次取代语法功能相同的“之”而上榜,成为第二高频词 。《红楼梦》中居首的高频词是另一个极具白话特征的虚词“了”,这也是《水浒传》中的之一高频词 。
与虚词相反相成的实词是文献内容和主题的映射,其背后涉及反映观念史演变的重大命题 。同样以“五经”为例,《诗》《书》《礼》《易》《春秋》中的之一高频实词分别为“我”“王”“人”“象”“子” 。《诗经》具有最强的主体抒 *** 彩,恰如《毛诗序》所谓“以一国之事,系一人之本” 。《尚书》为上古三代帝王典、谟、训、诰、誓、命等文献记载,以记录“王”之言行为核心 。孔子以“克己复礼”来约束人,“礼”是人内在品质的外化,因此谈“礼”不基于人则会失去根基 。“象”作为《周易》的解读对象是不言自明的 。“古者庖牺氏之王天下也,仰则观象于天,俯则观法于地,观鸟兽之文与地之宜,近取诸身,远取诸物,于是始作《易》八卦,以垂宪象 。”《说文解字序》中的这段话,说明“象”不仅是《周易》的关键,也是汉字造字观念及中华文化思维的体现 。《春秋左传》中首位高频字为“子”,其中包含第二人称单数与诸侯国君称谓双重意义 。后者是《春秋》叙事的核心所在,孔子作《春秋》,正是为了以微言大义记录“礼乐征伐自诸侯出”的非常时代,作为编年体史书,各诸侯国君臣的秩序与道德选择构成了其潜在的纬线 。
用数据来表征“诗分唐宋”
钱钟书《谈艺录》以“诗分唐宋”开篇,影响甚广 。此说实承续前人而来,宋代严羽论诗便有“本朝人尚理,唐人尚意兴”之说 。唐宋诗之别在于体格性分,相对较为玄妙 。通过量化分析,可对其语言层面的特征作出细致把握 。通过对《全唐诗》五万七千余首和《全宋诗》二十五万四千余首的词频统计显示,居于前十位的高频词分别为:不知、何处、万里、千里、不见、不可、白云、今日、春风、不得(《全唐诗》);不知、春风、平生、不可、万里、千里、人间、不见、十年、何处(《全宋诗》 。下文中词频位序将在括号中注出,故不再一一说明) 。
将统计扩展至前一百位,有关唐宋诗风之辨的许多命题都能够在语词的褶皱中被展开 。作为严羽论断的例证,在前一百位中,唐诗里比兴尚意的写景语汇更居前列,如排名第7的“白云”与第11的“明月”,虽只是词汇片段,唐人气象俨若可见 。作为参照,这两个意象在《全宋诗》词频统计中分别降至19与23位 。严羽“本朝尚理”的观点同样能在统计数据中获得佐证:宋诗中“平生”(第3位)、“人间”(第8位)等哲思人生的“理语”排位较唐代(分别居于第30、13位)又有上升 。另一点值得玩味的是,宋人虽崇尚自守慎独、内求于心的理学,诗中却不乏唐人所极少写到的“功名”(36)、“富贵”(78),而唐诗中常见的“惆怅”(15)、“相思”(22)等与“理语”相对的“情语”在宋诗词频列表中跌出了前一百位 。
唐诗偏重空间,而宋诗偏重时间 。敻绝的宇宙意识和无垠的空间,从《全唐诗》词频前五位中(不知、何处、万里、千里、不见)可见一斑 。日本汉学家吉川幸次郎曾提出,唐诗是凝视着人生贵重瞬间的燃烧,所注视的只是对象的顶点 。而宋诗是时间性的,诗人视人生为漫长的持续 。以语词的统计来衡量这一观点,唐诗排序更高的时间词是“今日”(8),时空与情感凝注于此一点,而宋诗中居首的是“十年”(9),继而是“今日”(12)与“百年”(20) 。吉川将“燃烧与持续”的说法推进至意象选用的对比方面,夕阳是燃烧的景象,雨是持续的景象,于是有了“唐人写夕阳宋人写雨”的经典论断 。词频统计恰也验证了这点,《全唐诗》词频居于前列的“落日”(55)、“日暮”(59)、“夕阳”(69),在宋诗中都排在九十位之后 。

推荐阅读