汉字经历了漫长的演变历程而没有中断使用,以形表意属性具有连续性,在周边民族地区和国家间存在着广泛的传播影响,这在世界各种文字体系中是独一无二的。一般说来,与具体实现剥离,有助于逻辑抽象;而汉字形体结构,直接参与区别语义,则天然地具有易与事物建立同构关联的属性。汉字的发展,形成了种种错综复杂的关系,以至于汉语学者工作者在记录语言的符号系统的各种文本关系里面摸索,就要穷气尽力,基本无暇进入科学的语言文字系统建设。长期以来,汉字发展史研究的现状,停留在一般文献学水平,整体落后于语言学研究,也落后于其他人文基础学科。相对于高校中已开设数十年的“文学发展史”(包括各体文学发展史)、“批评发展史”、“逻辑发展史”、“哲学发展史”、“思想发展史”、“艺术发展史”等基础课程,“汉字发展史”则基本阙如。这种局面,对于文字发展的认知、文字使用的需要、文字标准的制定,甚至汉字学科体系的教材建设,都形成了显而易见的制约。
从上个世纪到现在,随着考古材料的大量公布,特别是各类文字资源库的建设,断代的文字调研逐渐成为可能。文字发展断代描写,主要涉及文字的数量消长——不同时代社会用字所增加、所消亡的情况;文字的体制变迁——不同时期书体类型及形体变化情况;文字的使用生态——不同时期社会使用及制约影响文字使用变化的媒体介质传播技术等因素。比如说,对于大量文字形体,整理者甚至还无法准确回答它们的出现年代以及使用环境,客观上只能说断代的文字调研平台尚不具备。文字发展到今天,其调研平台不够完善,数据分析不能穷尽,文字发展断代描述基本上不能置一词,一定要硬着头皮去作笼统描述,实际上也是徒劳无补的。
各个时期断代的汉字发展调查,至少要回答:汉字体制基本属性,由基本属性所规定的特定研究对象研究范围即学科基础在哪里;某个时段里社会上使用了多少字以及哪些字形,这些字在体制上体现了哪些历史特点;还要进一步回答一个时期使用增加了多少字、哪些字形,这些此消彼长背后的时代性因素(包括技术、媒介、文化、体制等)是什么。呈现这些消长变化,还得进行跨时段的对比统计分析。否则,所谓发展就无从谈起。因此,断代的文字使用调查,其实是件困难的事情。基于相对穷尽性量化数据分析,进行断代调查和描写;依据文字使用事实,探究文字发展理论;真实呈现各个重要时间段落文字特点和一般发展规律,关注发展的系统性,以及影响发展的因素和环境:形成《中国文字发展史》断代各卷的描写特色。依据教育部人文社会科学研究重点基地“汉字断代调查与汉字发展史(13JJD770031)”规划,基于各类文字数据库,在字形结构、使用频率、构件成分等相对穷尽统计基础上,在先秦(包括商代、西周春秋、战国)、秦汉(包括秦国、秦代、两汉)、魏晋南北朝、隋唐五代等文字发展阶段(唐宋之际及唐宋以降的印刷文字、汉字规范及汉字处理,宜单独分卷描述),计划分期分批完成断代汉字发展史描写若干卷,包括受到汉字发展影响的少数民族文字卷。根据系列重大课题及文字数据库加工的实际,第一期首批完成先秦、隋唐五代及少数民族部分,其余将发展为第二批。就是说,基于漫长的汉字发展使用历史,《中国文字发展史》调查与描写,呈现为开放性体系,相对充分成熟部分,将陆续发展。《民族文字》比较卷、《先秦文字》发展卷、《秦汉文字》转型卷、《魏晋南北朝文字》过渡卷、《隋唐五代文字》定型卷等,仅从选题来看,就不难发现,虽说是断代层次的描写,但也是相对而言的。每个断代专题,其实跨越了历史时段,都会涉及单位书体发展历程考察。
文字发生问题,实质是属于所谓“跨学科”问题。单纯依赖文字学领域,总显得力不从心。一向因材料不充分、相关科际学术资源整合的困难,汉字发生研究成为文字学领域被长期搁置的课题。但是,搁置实属无可奈何。这个问题不能深入讨论,甚至连文字性质等问题的深入认识也不能不受影响。
在有关论场合,我们曾提出分层次讨论的观点。就是关于汉字的发生问题,有必要考虑符合认知规律的文字类型学划分。在汉字发生阶段,符合实际的分类,成为基本前提;不同类型,发生时间自然会存在出入。汉字发生研究建立在某种类型学基础上,即不同结构类型汉字的发生是有阶段性的。因此,笼统的汉字发生研究难以深入。即使最具图画意味的汉字,其抽象程度也大大高于图像。表意结构,既然是历史积累的结果,同样存在一个时代性问题:如果较早期发生的表意字形,与语段文字、图画文字有关的话,跟后来派生的会意之类表意结构属于什么关系?结构源于某种仪式,使用于特定场合,也是早期汉字发生现象之一。在汉字认知领域,汉字作为视知觉对象,进行习得观察,其关键环节,往往也就是进行符合视知觉规律的分类。
关于汉字的发生,文字学界以往比较审慎的评估,基本上都是以现存殷墟甲骨文字为基础的。这批以龟甲和兽骨为载体的古文,则是已成熟的文字,属于距今3000多年前的商代晚期的成体系文字。正如有的研究者所指出:“一些学者坚持两个标准,一个是字形本体的标准:与商代的象形文字如甲骨文、金文等形体相似者,就认为是文字,否则就不是;一个是功能标准:如果这些已知的史前图形、符号具有记录语言的功能,就是文字,否则就不是。”“但这两个标准都值得商榷。第一,字形标准不够全面,因为人们无法证明商代文字的字形就是最早的汉字的唯一形式。第二,根据现有的资料,无从直接证明史前图符是否具有记录语言的功能。”
何崝《中国文字起源研究》,专题讨论中国文字发生及其机制问题。作者认为,在世界范围内,从旧石器时代晚期开始就陆续出现了图画和符号,但这些并不是都能发展为文字体系。而所谓文字体系,是有不同层次的,有关研究者把文字体系划分为巫师文字和通行文字。巫师文字主要是在巫术中用于人神交流,其本质是巫术精致化的表现;而通行文字则是运用于人际交流的书面符号系统,可以应用于社会各个方面。巫师文字和通行文字是两个不同层次的文字体系,后者是在前者的基础上发展而成的。
《中国文字起源研究》,特别着力于文字生成机制,强调大规模贸易活动是文字发展为通行文字的必要条件。有关考古学研究表明,文字的生产大致分为三个阶段:第一阶段,图画和符号的出现;第二阶段,巫师文字形成;第三阶段,通行文字的形成。由图画和符号发展为巫师文字,需要有一定程度发展的农业经济基础,由巫师文字发展为通行文字,则需要具备开展较大规模贸易的条件,包括相当发展程度的农业、畜牧业和手工业,需要有优越的地理条件,需要能利用畜力和使用车辆之类的运载工具,需要在同一时期多个文明的并起,而由此开展的较大规模贸易,则是通行文字形成的原动力。
基于上述,何崝根据文字生成机制的三阶段理论,对中国新石器时代的文字符号的性质作出判断:中国新石器时代的文字符号都已经是文字,但都属于巫师文字,而尚未成为通行文字。因为这些文字符号都是在农业经济的基础上产生的,都毫无例外地还不具备较大规模的贸易条件:在同一时期多个较高程度的文明还没有出现,还未能利用畜力和使用车辆之类的运载工具,成规模的畜牧业、手工业还未出现,等等。准此,研究者认为,夏代不可能形成通行文字,夏代的文字符号,仍然处于巫师文字阶段。商代已经形成了一个社会通行的文字体系,这早已得到学术界的公认。但学者大都认为在商代文字之前还有更早的文字。通过前面的讨论,关于商代文字之前是否有更早的文字,可以明确地回答说,商代之前是有文字的,但基本上是处于巫师文字阶段,这些巫师文字都没有发展为通行文字。
所谓“巫师文字”,如何纳入文字发生系统考察,自然存在若干有待研究的课题。但是,如果从原始文字功能考虑,如不能适当顾及文字结构与巫术仪式之间的宛密关联,对于若干古文字形的理解,看似“坐实”,其实大类南辕北辙,有望形附会的危险。跨学科研究课题,需要不断积累。随着地下考古资料的陆续发掘,关于该领域的调查研究,也将不断深入。
迄今为止,商代文字依然是现存最早的成体系的文字。调查商代文字材料,有甲骨文(或称契文)、金文、陶文等。其中尤以甲骨文数量为最多,因此,文字学界将甲骨文作为商代文字的代表,一般将甲骨文分为下列五个发展分期:一期:盘庚、小辛、小乙、武丁时期;二期:祖庚、祖甲时期;三期:廪辛、康丁时期;四期:武乙、文丁时期;五期:帝乙、帝辛时期。
由于书写载体和写刻工具的缘故,龟甲兽骨上面的文字似乎不如铭铸在青铜器和陶器上面的字形更加接近书写用笔原貌。甲骨文是契刻文字,往往书写之后再施以契刻。甲骨上也有用毛笔留下的朱墨痕迹,但数量很少。甲骨文属于宫廷档案公文,基本用于占卜祭祀,构成当时文字传播使用的主要范围。
两周时期是历史上汉民族在民族融合、政治体制、商贸经济、文化艺术诸方面第一个大繁荣时期,该时期文字使用功能扩大,文字系统获得长足发展,达到古文字阶段的最高水平。两周时期主要文字载体发生了很大转变,现存主要式样是铸刻在青铜器上的铭文,这些铸刻在青铜器上的铭文,其书写程序是先刻写于范坯,再经烧铸而成。由于范坯质地柔软属性,便于书写、修饰加工,书写者更加得心应手。因此,金文线条的艺术表现力要比甲骨文空间丰富些。
春秋战国时期文字使用范围日趋广泛,文字形态、书写材料丰富多样。其中,金文资料仍然占有相当比重。此外,简牍、丝帛、玺印、泉布、玉器、石刻、陶器等材质,也都是当时实用文字载体。特别是春秋晚期的侯马盟书、战国时期的楚帛书、战国中晚期的楚简,保存了大量用软笔书写的文字。
通常将先秦文字分为殷商、西周春秋和战国三个时段。所谓古文字发展史,主要也就是这几个时段。最近几年,大批战国楚系文字的简牍材料陆续整理公布,吸引了众多古文献古文字学者。商周文字到战国简牍字符,无论从文字功能的使用范围,还是从文字本体的调查统计来看,都获得了空前发展。但是,真正对该时段文字发展状况进行较为彻底梳理和描述,有待于先秦古文字资源库建设。殷商西周春秋战国文字发展,就是以基于数字化的定量方式,从字集、字频、异体、构件、结构、体态等角度来描述先秦出土文字的发展演变状况,将首次完成先秦汉字发展史的断代研究。
商周各个时段各类材料到底有多少字?殷商基本字集——甲骨文字集,得到的甲骨文字形数为6227个;殷商金文字集,得到殷商金文字形总量1507个。西周春秋基本字集——西周金文的字集,统计出《金文编》收录西周金文2302个,统计出西周金文的字形数量为2870;春秋金文的字集,从25083字量的春秋金文用字中统计出单字1458个。战国字集——统计出战国金文的字形数量为1774字,楚简文字类型多:以《楚文字编》原收录材料为依据,补遗文字175个,以上博简材料为依据,补遗文字843个,以新蔡简材料为依据,补遗文字298个。上述数据的给出,整个先秦文字资源总盘子也就有所把握了。
各类异体数量与比例:1.甲骨文异体字,通过对《总表》的勘误和增补,重新考察了甲骨文中的异体字,得到了甲骨文异体字的基本数据:异体字为1031组,其字形总数3081个,因而在6227个甲骨文字形中,字头数实际为4065个。甲骨文异体字形总数占甲骨文单字字形总数的51.89%。这个比重大大超过后世文字系统,表现了字形系统内在规范性较差的早期文字特性。2.西周金文异体字,整理统计表明:西周金文中572个字头下存有异体,异体字涉及字形总数2134个。异体字涉及字头在总字头数的比重由26.92%下降为19.93%,异体字涉及字形在总字头形数中的比重由52.01%下降为48.15%——西周金文异体字在文字总量中相对甲骨文的比重下降,总体上无疑表明了这样一个事实:从殷商发展到西周,汉字构形的差异化程度降低,规范化程度提升。3.战国异体字,除了时代的差异,还要相应考虑分域等因素。战国文字整体和分域的异体字数量比较调查。调查数据首先表明:相对西周金文,整体战国文字异体字数量比重有较大幅度的降低:前者的异体字涉及字头占总字头数的比重为19.93%;后者的同口径数据则只有7.39%;前者的异体字涉及字形占总字形数的比重为48.15%,后者的同口径数据则只有20.26%。显然,这种数据的变化,反映了汉字系统随着时代的推移内在的构形规范程度有了很大的提高,即使遭遇了地域分歧加大的因素,这种趋向依然是非常明晰的。其次,相对整体战国文字异体字的上述两个比重,楚、秦、晋、齐、燕五系文字的同口径数据均有大幅度降低(楚为4.19%和3.52%,秦为0.85%和1.10%,晋为4.90%和4.91%,齐为1.58%和1.96%,燕为0.74%和0.77%),这就表明,战国文字的构形差异,在很大程度上是由各地域系别文字之间的构形差异所造成的,因此,目前的战国文字地域分系至少是有一定客观依据的。
关于殷商到两周“四书”结构发展,断代系统描写专题同样给出了可资对比的量化数据。通过分别以不重复字形和卜辞用字总量为统计基础,研究者得出这两个不同的层面的甲骨文“四书”结构在有效字形总量中的数量比重。以字形数为统计基础的量化结果:甲骨文的统计结果全面补正了既有研究的相关数据,其结果为,象形字占总字形量的40.16%,指事字占5.06%,会意字占40.89%,形声字占13.89%。殷商金文的同口径统计结果印证支持了甲骨文的统计数据的真实性。这个结果相对于小篆,表现了甲骨文在结构层面上原始程度。以文献用字总量为统计基础的量化研究:这个角度的统计,开拓了一种全新的关乎结构的量化研究路径,统计结果相对以不重复字形为基数的统计,数据发生如下变化:象形和指事的比重有所上升:象形从40.16%上升到76.97%,指事从5.06%上升到7.67%;而会意和形声则有较大幅度的下降:会意从40.89%下降到12.67%,形声从13.89%下降到2.5%。殷商金文的同口径统计结果同样印证支持了甲骨文的统计数据的真实性。该角度统计数据的这种变化,意味着独体字在甲骨文的常用字集中比合体字占据更高的比重,是对许慎“先有文后有字”之说所作的一个很好注脚。同时,对于汉字发生史意义上的汉字性质认知,也提供了参考数据。
西周文字“四书”类型的量化研究,以不重复字形数为基数的西周金文“四书”类型调查统计表明,从殷商甲骨文到西周金文,字形系统中四书的比重发生了如下的变化:象形从40.37%下降到11.57%,指事从5.59%下降到0.48%,会意从40.86%下降到32.97%,形声从13.75%上升到54.98%。也就是说,单纯表意的三书均有不同程度的比重下降,而只有形声有了大幅度的比重上升。以字形在文献中的总用量为基数的西周金文“四书”调查统计表明,首先,从甲骨文到西周金文,象形比重从76.97%下降到53.28%,指事比重从7.665%下降到2.25%,会意比重从12.67%上升到21.05%,形声比重从2.5%上升到23.43%。毫无疑问,这些数据变化,清晰地体现了汉字在结构层面的发展趋向:“文”的被使用概率的下降和“字”的被使用概率的上升都呈现了较大的变化幅度。其次,从文献实际用字的角度来看,汉字结构发展的速度,要大大低于不重复字形层面呈现的幅度,而这与甲骨文的同口径统计数据相比较,也呈现了高度的一致性,这足以揭示汉字结构发展的一种规律。
殷商西周春秋战国文字发展,还可以从字集、异体、字频、构件、结构、体态等部分,来描述殷商、西周春秋和战国三个时段出土文字系统的联系和发展状况。
字集。旨在回答文字系统究竟包含了哪些文字单位这个最基本问题。殷商时段:首先以《新编甲骨文字形总表》为起点,进行甲骨文字形数的全面清理。经逐个查核原拓,全面吸取相关考释研究成果,增补《花东》等新材料,完成了《新编甲骨文字形总表》补正暨甲骨文字形数量的清理,并确定其在GBK、CJK扩展字集中的传承状况。其次,通过对《金文编》收殷商金文补正,确定了殷商金文字形总量,及其对甲骨文字形的补遗。西周春秋时段:通过一手材料整理来增补《金文编》收字,依据相关考释研究改释《金文编》定字,完成了该时段金文字形数量的清理,并确定其在GBK、CJK扩展字集中的传承。战国时段:以《战国文字编》、《金文编》及其校补系列、《楚文字编》所形成的互补字汇集作为研究起点,通过全面整理一手材料和相关考释研究成果,完成了对这几个文字编的补遗和改释,进而对该时段字形数量作了初步确认,并作了该时段新见字以及字符集种类的归类。
异体。旨在清理各时段异体字数量状况以描述各时段文字的规范程度。殷商时段:重新确认了甲骨文中的异体字数量,并基于这个数量论证了如下发现:甲骨文具有内在规范性较差的早期文字特性;单字所含异体数与含异体单字数呈反比例增长趋向;多异体的字在字用上具有高频、多义、表达文献热点语言单位等特点。西周春秋阶段:通过异体字数量状况的确定,论证了两个发现:从殷商到西周,汉字构形的差异化程度降低,规范化程度提升;该时段多异体字头所含的异体字数大大超过甲骨文,根源于更大的地域分布所导致国族差异。战国时段:首先进行了战国文字整体和分域文字的异体字数量调查,数据证明整体战国文字异体字比重较前代有大幅度的降低,而各地域系别文字异体字比重又低于整体战国文字,从而揭示了整体战国文字构形差异的造成有各地域系别文字之间的构形差异的成因。其次进行地域系别文字的内部差异研究。以异体字数量最多的楚文字作为材料对象,调查其内部是否存在构形差异的下位子系统,调查数据给出了基本否定的回答。
字频。旨在弄清文字系统中各文字单位在实际文献中的被使用次数,并以此检测特定时段文字系统成熟程度。殷商时段:通过甲骨文字频调查统计得到如下发现:甲骨文字频具有高度的两端集中状况(即少数高频字占总字量的高比重和总字量中极低比重的低频字占单字总数的极高比重);这种体现文字系统的不成熟性的两端集中状况与甲骨文的程式、内容特点有一定关联;甲骨文的高端集中的字频现象本质上反映的是殷商汉字表达语义以简驭繁的一种断代特点;甲骨文字频的低端集中与殷商文字记录语言内容的专用化程度相联系。西周春秋时段:调查统计表明,1.该时段字频状况较之殷商时段的主要差异表现为:最高频端的集中度有所下降;最低频端的集中度基本保持殷商时段的水平;中间频次字在数量上全面上升。2.高端集中与铭文程式、嘏辞、字用特点三种因素相关;3.文字用法的数量总体上是与字频数成正比,高频字倾向于与普通词汇,特别是基本词汇对应。低端集中首先与专名类用法字相联系。战国时段:以《郭店楚简》为古书类文献代表,《睡虎地秦简》为文书类文献代表,战国金文为铭刻类文献代表,在全面完成了它们的字频调查统计的基础上,完成不同类型文献的字频比较研究、战国出土文献字频状况的断代特点、国别地域差异与字频状况关系的研究三个专题研究。
构件。旨在通过文字构形底层要素的深入调查去揭示文字构形系统的本质特征。殷商时段:在完成了各类甲骨文及殷商金文构件的数量调查,修订了相关既有研究的结论的基础上,揭示了甲骨文构件具有高频者少、低频者多这种与图画遗存相联系的特征;辨析了一批具有罕见性、暂见性、图画性及后世变异特征的特殊构件;基于构件的统计研究,提出了完善现行甲骨文部首系统的方案。西周春秋时段:以金文为对象的构件数量调查表明,相对殷商时段,构件参与不同字形构字的平均几率提升,一级构件比重大幅度下跌;由于平均不同构件的构字数量的趋向,导致了中间频次段构件数量增加最多。论析了本时段新见的特殊后世变异构件。战国时段,根据构件的系统定量研究对材料的系统性及丰富程度的要求,选定秦简和楚简帛文字分别作为西土和东土文字的代表,在完成其构件数量调查及其断代意义评估的基础上,通过两者特异构件的比较来量化其地域差异。
结构。旨在通过文字各种结构的分布及消长调查来描述各时段文字的发展状况。殷商时段:首先,分别以不重复字形数和字形在文献中的总用量为基数,得出这两个不同的层面的甲骨文“四书”结构在有效字形总量中的比重;其次,完成各种结构功能所含构件数量及各构件所具有的结构功能数的调查统计。以此为依据论证了殷商文字中结构层面的多种特征。西周春秋时段:以不重复字形数为基数的调查统计表明,从殷商甲骨文到西周金文,单纯表意的三书均有不同程度的比重下降,而只有形声有了大幅度的比重上升;以字形在文献中的总用量为基数的统计表明,从文献实际用字的角度来看,汉字结构发展的速度,要大大低于不重复字形层面呈现的幅度;构件的结构功能数量的调查首先揭示了表声构件的数量已上升到各功能类型构件之首,表声构件大大高于表义构件的增长,表明了形声字发展中对形符具有更严苛的选择性,这种选择应当是与该时段形声字发展以标类为主要途径相联系的。其次,象形、指事构件与会意、表义、表声构件的两者结构比重相对殷商文字的明显的变化,表明了本时段文字结构的更高的发展程度。战国时段:以字集的完整性和语境的清晰度相对符合材料要求的秦简和楚简帛文字为对象,进行了本时段结构类型分布的断代及地域特点调查;选择上博简、侯马盟书、战国货币文字三种典型材料,完成了战国文字结构的“无理化”演变的量化调查。
体态。旨在通过自然结构和层次结构这两种直接诉诸视觉的文字构形成分调查来揭示文字系统的发展变化。殷商时段:从独体字与合体字比重、合体字平面组合类型数量分布、层次结构的数量状况三个层次完成了对甲骨文构形的数量调查,并以小篆、现代汉字的相关指标为参照,揭示了其中凸现的断代文字特征。西周春秋时段:完成了对应于殷商时段的调查口径的各层次调查,数据表明在独体字与合体字比重、层次结构的两个层面本时段文字呈现了更高的发展程度,而在合体字平面组合类型数量分布的层面,本时段金文呈现了更低的发展程度。论证了合体字平面结构上的“倒退”现象与严苛的甲骨契刻书写环境的反常作用力相联系。战国时段:继续对应前时段的三个研究层次完成调查统计,在证明本时段文字体态发展程度总体高于既往的基础上,揭示了不同地域文字的发展不平衡状况及其促发因由。
先秦汉字发展演变的探索,是一个不乏既有研究成果的研究方向,而以严格定量论证的方式去做这种研究,此前却是乏人问津的。上述六个指标,不但把总体目标定位在这种前沿上,而且在各个具体问题的研究上,均努力将既有前沿研究成果为起点来展开进一步的研究,故在“先秦文字发展”这个题目下,实现了较为全面的创新研究。
古文字到近今文字的发展转型,在汉字发展史上影响到体制层面的重要过程,主要就是隶变楷化。隶变楷化,存在一定重合。关于隶变本质,就文字体制而言,就是将古文字阶段的线条为书写结构单位,解散转化为今文字的以笔画为书写结构单位。笔画的数学几何属性为线段,跟线条是相对的。经过隶变之后的汉字,笔画就构成有效区别单位。关于隶变发生过程,文字学者已将目光投到战国简牍材料。其中秦简材料体系上属于秦系文字,时间上则由战国延续至秦代,隶变发生不会晚于战国。现存云梦睡虎地秦简文字,整体上已处于篆隶之间,一定程度上保留着篆书的意味,被称为“古隶”。
国家统一,秦王朝实行书同文政策。国家政府在文字改革、规范方面进行的工作,力度之大,在历史上空前绝后。学者们认为:“秦国统一以后的官方用字是小篆;小篆虽然同秦王朝一样,存在的时间并不长,但它却代表了古文字阶段汉字书法艺术的最高成就;从文字的结构来说,小篆结体严谨、规范、匀称、平正,线条的力度均匀,行笔流畅自然,字体固定,异体字减少;从其来源上看,小篆源于秦国统一以前所使用的大篆,而大篆直接源于西周文字。从统一之前的秦国社会生活实际用字来看,比如前述云梦睡虎地秦简,所用文字是软笔即毛笔墨书的秦隶,其中像甲乙两种《日书》,集中反映秦朝当时社会民俗用字状况。对照起来,大体可以推测当时的小篆书体主要限于宫廷场合、某些特定仪式等。
汉代经济文化,繁荣昌盛。两汉前后历时达四百二十余年,隶书和草书是该时期的重要书体类型。隶书由秦隶过渡到汉隶,逐渐走向成熟,达到艺术上的高峰。同篆书一样,隶书影响深远。只要查询有关实物用字语料库,就显而易见,即使到了隋唐,像墓志碑刻一类仪式化程度高的场合,还经常见到使用复古性隶书,庄重典雅。“草书”作为书体类型专称,有其特定的含义,则是汉代才出现的。东汉许慎《说文解字·叙》所谓“汉兴有草书”,即特指一种书体而言。文字学者书法家认为:隶书与草书本是同源,它们都是汉字的草写,但后来却朝着两个不同的方向发展演化着——隶书逐渐变得笔画分明,书写规范;而草书却朝着线条缠连、草率流畅的方向演化。
秦汉文字演变调查资源丰富,除了上述云梦睡虎地秦简之外,其他简牍类举其大者就有马王堆帛书、银雀山汉简、居延汉简、居延新简、张家山汉简、敦煌悬泉汉简、额济纳汉简、阜阳汉简、吴三国东牌楼、走马楼吴简等。另外,石刻文、砖瓦文、金文、玺印文等,也显示了该时期文字使用的多样性。
汉魏六朝,文字经过了剧烈的隶变“解体”之后,书体发展至于自觉,楷书走向成熟。其中的重要因素,固然有文字自身的发展规律,而媒介发生了革命性变换,即纸张在这个时期真正成为社会日常生活的书写载体,不仅对书体发展,就是对文体“自觉”,都是最为直接的影响因素之一。
由于材料物理属性制约,诸如质量密度、书写程序以及耐消磨度等,尤以石刻数量庞大且字形保存相对完整。碑刻文字(包括墓碑、墓志铭、造像记、摩崖刻石等)和墨书写本文字,另外还有刻写在砖瓦上的文字以及流传下来的法帖文字等,构成本时期汉字实际使用调查的最基本材料。从物质技术因素来看,两晋南北朝时期纸张取代其他介质,对文字书写空间和传播速度带来深刻影响:秦汉简牍文字材料繁富,而南北朝已经罕见;秦汉简牍主要施于公用文书,六朝则主要用于“合符”一类所必需的特定场合,六朝文体流别始称大备;载体转换、纸张属性、书体发展等因素,使得文字使用广泛进入民间社会生活成为可能。正是在这个意义上,不妨将中古称为“文字自觉”时代。
就该时期书体发展及其因素而言,六朝时期书体发展,以至各体皆备,可以适应于不同的文体、使用于不同的场合,与文体发展特别是与书面文学发展的关联至为直接。书体的完备,除了文字系统楷化完成过程中自身发展的规律,主要取决于物质的因素和社会的因素:物质的因素,当时就是书写介质转换的实现,即纸张在魏晋南北朝真正普遍进入日常书写领域,最大限度地满足书写空间扩展,趋向自由。社会的因素,则是家庭教养的积累和崇尚书艺的社会需求。
书法自觉。在上述背景下,两晋南北朝时期,书法作为专门领域,真正进入所谓“自觉”阶段。在大量墓志碑刻材料中,“工书”专门,往往勒石标榜,作为“盖棺定论”。像北魏《元悌墓志》记载“学冠书林、尤好八体”:“王讳悌,字孝睦,河南洛阳人也。折彩丽天,冻源带地。鸿光昭晣,清烂自远。祖重华迭曜,握天镜以临万国;考蹈德齐札,揔三事以调四气。王资灵川岳,居贞若性。博览文史,学冠书林。妙善音艺,尤好八体。器宇淹凝,风韵闲远。丽藻云浮,高谈响应。”北魏《元钦墓志铭》铭刻墓主“笔下云飞,纸上风起”,似乎生前尤工草书:“君讳钦,字思若,河南洛阳人也。恭宗景穆皇帝之孙,阳平哀王之季子也。长源与积石分流,崇峯共升极齐峻。丹书写其深玄,绿图穷其妙迹。固以备诸篆素磬于金石者矣。……君资五行之秀质,禀七耀之涥精。生而环奇,任维国秘,职司王言。笔下云飞,纸上风起。忠规良谋,内外称焉。”像对于北魏一代文化学术有重要影响的郑黑:“闭门负心,讲诵鲁诗,朝书八体,采李斯曹憘笔法,前人垂今,今人识古。又书三字石经,袭爵诏京师太学,书立三体石碑,教诸皇子书三字石经,又注《字林》韵集六卷。”(北魏普泰二年的《郑黑墓志》)北魏永熙二年《张宁墓志》独称墓主“书学之能”:“书学之能,风标千刃,衿带万顷,自以桂林一枝,昆山斤玉,学岁不群,冠年独立,容豫乡国。”
从流沙坠简、楼兰汉文简纸文书、长沙走马楼三国吴简《嘉禾吏民田家莂》与《竹简[壹]》等简牍文字来看,该时期上承汉末隶书的成熟阶段而下启在隶书蜕变中产生楷书、行书、草书字体。该时期简牍的使用者多为中下层官吏、武士,书写工具采用毛笔,可以反映出社会用字情况的真实面貌。调查统计表明,魏晋南北朝简牍文字正是获得迅速发展的楷字,其笔画系统已经形成,但还不完善,笔画的形态和数量还不固定;楷化构件系统也已经构建起来,但还不成熟,构件的形态、数量和位置也不确定。从字体风格来看,是处于由隶书向楷书过渡阶段的文字,即“隶楷字”。
甲骨、青铜器、丝帛、简牍、玺印、泉布、兵器、玉石、陶器等材质,在漫长的历程中都留下了当时文字实际使用的痕迹。春秋晚期的侯马盟书、战国时期的帛书简文,也使人们看到了大量用软笔书写的文字。同一时期同一地域用不同书写工具和书写材料所写(刻)文字的比较研究,有助于汉字发展历史发展规律的全面认识。数百年间,木、石、纸书写介质的转换,直接影响了汉字传播方式的改变,促进了汉字书写体制的定型。竹木、石材和纸张介质的书写物理属性差异,纸张进入书写领域所引起的自由空间拓展和文字传播方式的革命,六朝完成纸张作为书写介质普遍进入书写领域,对于文字发展到自觉定制、文字传播方式及传输速度具有划时代意义。
唐代社会经济、文化与教育高度发展,达到中国古代社会鼎盛时期。楷书至此达到最高艺术水准,确定体制范型,谓之“自觉定型”。同时,也奠定了近现代楷字使用基础。有唐书法楷则,为后世不易之定制。楷字发展至于定型,有其历史的准备和自身的条件。就文字内部体制而言,南北朝楷书已经臻于成熟,为隋唐楷字定型作了充分准备。从上述物质技术因素来看,两晋南北朝纸张取代其他介质,对文字书写空间和传播速度带来深刻影响。从唐代当时所提供的条件来看,主要有两方面社会因素起了直接促进作用:一是承袭隋代科举教育制度趋于完备,二是整理形成与此相适应的社会标准规范。唐代楷字定型,是唐宋之际文字传播方式发生革命性转换的内在因素,即正是唐代楷字规范达到定型化程度,才使得印刷技术通行开来具备了基本前提。技术进步的直接结果,就是使得文字传播水平不再因人而异。
汉字发展到楷字定型阶段,其表意属性有没有发生机制性变化?由此带来的认知特征有哪些?这是本时期汉字发展调查所应回答的基本问题。即描述楷字系统“区别性”原则与表意机制关系:以形表义属于机制层面,其中的“形”体现为楷字结构;“表义”落实为各类楷字结构模式,诸如象形、指事、会意和形声类型。
唐代楷字调查,所统计分析数据,主要来源于两个系列:一个是出土石刻语料,一个是传世字汇材料。关于传世字汇材料,统计基数见《原本玉篇》(残卷)、《宋本玉篇》和《篆隶万象名义》,另外还涉及《干禄字书》、《五经文字》、《九经字样》等唐代字样系列。《宋本玉篇》专书资料库现有22795条记录(含各类异体),基本就是来自汉魏六朝和唐代的积累,较之《万象名义》资料库15291条记录增出7496条记录。但由于《名义》抄本存在大量舛分误并误混的舛乱情况(具见第五章《楷字传承变异》第三节“《名义》比较”),记录增加部分并非就是新出字量。《中古汉字流变》各部小序,将二者实际所收字头、异体逐一对号排比,反映各部收字实际出入,各部收字实际出入相加,共得到《宋本》多出5298字,《中古汉字流变》将这5298字逐个列具各部小序里,揭示出各部发展字量消长的分布比例。就目前的统计水平而言,这些数据,大致上反映了唐宋时期社会实际使用楷字的增长幅度。至于字样系列材料,除了直接反映唐代标准化水平之外,重要的还在于体现了当时的正字观念。关于出土石刻语料,统计基数为:魏晋南北朝石刻语料库文字字样表中认同归并为4334个字位代表字,统摄10715个字样,字位代表字和字样数量的平均比例是1∶2.7。隋唐五代石刻语料库楷字字样表中共贮存字样15769个,认同归并得到6158个字位代表字,字位代表字和字样数量的平均比例是1∶2.56。从两个时期出土实物用字数量来看,共性的表现为都存在大量异体字形,个性的差异则是隋唐五代新增字位代表字就达1824个。传世字汇所增加的5298字,以及出土实物用字所增长的1824字,其所由生,其代表的演进和分化之迹,就构成为唐代楷字发展的基本线索。
《汉魏六朝隋唐五代字形表》字头共7742条,其中仍包含少量异体字,统摄近10万实物使用字形。作为隋唐楷字定型的断代调研,集中反映在相互联系的两个方面:一是将唐代积累形式的楷字字汇,置于楷字发展过程进行考察;二是将唐代字样规范,置于共时的社会实物用字实际进行对照,还原当时字样标准所适用的社会环境,揭示唐代字样标准使用所达到的规范水平。注重楷字历史的发展层次及量化关系,注重楷字区别表意模式转换,注重楷字发展的社会技术类物质因素,是隋唐之际文字发展断代调研特色。隋唐楷字定型专题调查认为,对于断代与历时结合的汉字发展描述而言,调查统计给出量化数据固然有意义,而寻绎书体发展的直接因素和直接线索,包括提供字形讹误的历史根据,即复原字样的社会使用环境,更具认知价值。
该专题调研平台为“实物用字语料库”、“传世字书语料库”。两个类型语料库,对照互补,提取数据,完成《楷字发展》调查报告。各个发展阶段,以《汉魏六朝隋唐五代字形表》为时代坐标,提取数据,对照描写。“楷字区别性”部分,主要是考察魏晋南北朝至隋唐之际楷化变异定型过程,贯穿在这个过程中区别性的丧失、区别性的重建。区别性的重建,涉及楷化的扬弃选择问题,包括相关认知机制问题。调研的基本观点是:楷化选择倾向于形声结构,与其说是顽强保留示意标音功能,毋宁说主要是维护楷字结构区别性原则,以及由此带来认知机制上归类识别的方便。区别性原则,是贯穿汉字楷化过程的基本原则。这是因为,表意区别性的丧失及重建,体现了楷字从解体变异到定型完成的过程,揭示了繁化、简化、分化等表面现象背后潜藏的选择与扬弃规律,反映了表意模式的转换及楷字发展的趋势。“字汇楷字”,包括“字样标准”和“字际关系”两个部分。楷字字样规范,是唐代楷字定型标准。理论上的自觉意识,尤其是专门的字样学著作的出现,是楷书书体成熟的标志之一。唐人字样学所分“俗字”类,从字体来看,实际大率就是笔画、构件等层次的讹误导致的错讹字;从使用的范围来看,往往就是相对于记录社会雅言文体相对浅近文体场合的用字。整体而言,与相承时间的长短没有必然联系。“石刻楷字”,通过同质而具有明确时代属性差异的实物用字对照,观察唐代楷字的定型程度,观察定型楷字在区别性原则规定下的繁化简化现象及形体新增现象。依据“隋唐五代石刻语料库”所作共时的隋唐五代石刻异体构成类型调查,同样表明了该时期实际使用楷字的定型水平。
隋唐社会用字的基本字量,可以当时的基本字汇为参考。在南朝《原本玉篇》主体不存的情况下,唐抄《万象名义》所存楷字,不妨认为是反映南北朝时期的基本楷字。但由于当时楷字发展由过渡期到成熟期,社会用字呈现复杂局面,当时石刻使用的楷字,也有相当部分不见于《万象名义》的传抄。《原本玉篇》经过唐人孙强增广,反映出隋唐时期楷字使用量的增加。问题是到底新增加了多少?按有关楷字语料库统计,《宋本玉篇》22795条记录,较之《万象名义》15291条记录,多出7504条记录。问题在于,这批新增楷字,是否悉出自唐人之手,而不存在宋人在整理过程中增广的成分?如果确有宋人的增广,那么以《宋本玉篇》作为唐代基本社会楷字使用量就不够准确。这属于历史楷字发展时间层次分析问题,作为楷字发展断代研究要给出结论,也要依赖楷字资源库进行调查统计。
调查数据分析,依唐人封演《封氏闻见记》现成数据,《原本》共收16917字,《名义》数据库查询到15291条记录,如果连“同上”标识的494条记录,“古文”标识199条记录,“上文”标识61条记录(“上文”在《名义》体例当中,有时属于“释义”的说明,并不完全是字际间的关联)统计在内,要是再考虑所抄存种种异体字际关系等因素,二本所存字量原本相去不远。《名义》抄存字量,较之《宋本》22795字,二者字量上的差异,应该就是唐人孙强增字的基本来源。从有关韵书贮存楷字情况来看,宋人陈彭年是在重修《广韵》之后才着手《宋本》的修订工作的。《广韵》有3000多字(绝大部分并非异体),是在《宋本》找不到的。如果宋人同一批编者要对《玉篇》大规模增广,这部分字量不可能没有反映。从切语用字变动趋势来看,《玉篇》注音明显受到《字林》注音的影响,而与《广韵》注音不存在密切关系,有的甚至相违,可以排除宋人陈氏辈根据《广韵》修改《玉篇》的可能性。从二本修订时间关系来看,《广韵》是大中祥符元年修订完成的,祥符六年陈彭年等人又完成了对《宋本玉篇》的校订。对《广韵》称引的《玉篇》与今传《宋本玉篇》进行比较,发现二者存在相似性:《广韵》称引《玉篇》71次,或注明“《玉篇》云”,或注明“出《玉篇》”,其中65次的释义完全相同,占总数93%。这说明《广韵》所引《玉篇》,与《宋本玉篇》并无大的差异。另外,宋代集大成的韵书和字汇分别是《集韵》和《类篇》,其中《类篇》专书数据库记录各部原本统计之和为30944字,实际所著录字数为30844个,存在100个字的出入。相对于《宋本玉篇》,《类篇》新增字量为9557个(这只是简单数量关系,《宋本玉篇》正文亦有1735字系《类篇》未收录)。即扣除字汇中的重出字,《类篇》收字也比《宋本玉篇》多出8041字。其中,增幅尤为突出的大部像《艸部》新增409字,视该部1443字总量,增长比例达28%;《水部》新增346字,视该部1274字总量,增长比例达27%;《木部》新增337字,视该部1142字总量,增长比例达29%;《手部》新增268字,视该部896字总量,增长比例近30%;《女部》新增267字,视该部688字总量,增长比例达38%;《疒部》新增158字,视该部426字总量,增长比例近37%;《石部》新增141字,视该部430字总量,增长比例逾32%……至于《集韵》,现存数据库有53872条记录(包括大量“重音字”)。基于上述数据,如果说《宋本玉篇》果系出自宋人增广的话;那么,其收字范围要比现在所见《宋本玉篇》广得多。
上述对比调查,大体上支持这样的结论:《宋本玉篇》现有22795字的规模,基本就是来自南北朝和唐代。《宋本玉篇》所存楷字,大体上可以认为是唐人增字结果。《宋本玉篇》较之《万象名义》所增5298字,反映了唐代社会使用楷字的增长幅度。当然,字汇是历史积淀的结果,未必完全及时反映当时社会用字实际。六朝隋唐石刻等实物近百部字类使用调查对照表明,当时社会实际使用的若干字形,字汇并未予以著录。通常情况下,隋唐石刻部分用字,不见于《万象名义》而见于《宋本玉篇》;或不见于《宋本玉篇》而见于《集韵》、《类篇》;也有既不见于《万象名义》亦不见于《宋本玉篇》者。
楷字积累的形式主要有字汇专书和用字实物,开展两种载体类型的楷字对照,能够观察楷字发展的基本时间层次,从而揭示传承变异、增长发展的字频字量。进行“共时”与“历时”结合的调查对比研究,可以揭示楷字发展趋势。对于楷字资源调查而言,首要的工作就是分析层次,辨章字际关系,揭示楷化变异、楷字选择使用规律。楷化是在历史汉字隶变解体符号化过程中发生的,“六书”结构模式已经不能适应楷字构形情况。偏旁混淆以至于互换,“笔画”成为重要的字体结构“区别”单位,诸如此类,都是楷化过程影响到结构模式的反映。现代楷书的表意程度及其在楷字认知过程中的规律性体现,是更加强调楷字结构的体系性和整体性。
普通文字学表明,文字系统的发生及性质,可以借助于文字传播进行考察。汉字的历史传播,涉及两个圈子:一个是民族区域之间发生的文字改造使用现象;一个是国际地区之间即通常所谓“汉字文化圈”的文字改造使用现象。关于后者,正在联合域外文字学专家进行各类文字数据库关联比对。一旦数据分析工作结束,即将其作为《中国文字发展史》的延伸发展。
民族文字比较,需要整合各类民族文字资源。《民族文字》卷专题承担者为国内长期从事民族文字调查,开展比较文字学研究的专家。从上个世纪到现在,已经为我国培养了若干届少数民族文字学博士研究生。作者所带领的课题组,建成了中国少数民族文字资源库,部分品种还实现网络发布(东巴文检索系统、古壮文检索系统、水文检索系统、玛丽玛莎文检索系统、傈僳文检索系统以及中国民族古文字字表、中国民族文字同义对照词典)。《民族文字》卷就是基于该平台研制的成果。
基于多种民族文字资源库,《民族文字》对10余种民族古文字进行了比对研究。在当前对我国民族古文字的研究还往往处于习惯于对一个文字系统进行孤立研究而比较研究不够充分的状况下,本专题调研,分别以同义比较为主要手段和基本方法,讨论民族古文字的发生、性质、发展和传播。
考察对象涉及这样一些文字系统:古汉字3种:甲骨文、金文、小篆。中国其他民族古文字12种:纳西东巴文字、纳西哥巴文字、纳西玛丽玛莎文字、纳西达巴文字、彝文、傈僳竹书文字、尔苏文字、水文、壮文、契丹文、西夏文、女真文。外国古文字3种:苏美尔文,埃及圣书文字,马亚文。此外,本专著的研究,还涉及了日本、朝鲜与越南的民族古文字。
比较的发现是多方面的。比如有关文字发生:文字的渊源物应归为图画与符号两种;各种文字发生有其共同的基本动力,但各别文字系统的发生的动力又往往有所不同;文字的发生的涵义有其模糊性;文字的发生是一个过程。有关文字性质的:各种文字的文字制度与符号体态的发达程度之间既有关又未必成正比的规律。有关文字发展的:文字系统的性质是发展着的;我国的一些少数民族文字系统往往也可以断代;一种文字系统的各个发展阶段之间往往是互相渗透的。有关文字传播的:我国各个民族文字系统之间的关系往往不仅是互相关联的,而且是错综复杂的;我国一些民族的文字之间可能存在着至今尚不很清楚的关系;文字传播往往引起“拼盘文字”的产生;“拼盘文字”的内部往往存在着运动,即自源字和借源字之间不是各自孤立而是互相影响乃至可以互相结合成新字。有关文字系统整体的:确定了一些文字的各别字的来源,如对傈僳竹书文字的243字进行了造字理据的考释;考释了玛丽玛莎文的几乎证实了每一字并证实了它是一种独立的文字;证实了水书、彝文、壮文都是“拼盘文字”。通过比较,绘出了中国文字关系图。
相对于漫长的文字使用发展历程,上面不过是几个断面的匆忙巡礼。这里也许可以顺便提到曾经表述过的一些基本观点,主要涉及汉字与汉语关系。
文字与语音。普通语言学谈到语言系统中形音义的关系,一般都会指出:先有语言,后有文字,文字追随声音。以至于一般文字工作者在回答这个问题的时候,答案也是如此,似乎可以不假思索。就汉语史发展的实际情况而言,这个问题其实也是分层次的。在不同层次上,字形与语音的关系是不完全等同的。在文字的发生创制阶段,文字追随语音,这是没有疑问的;而且为了追随语音,文字使用过程中的结构体制也总是不断做出相应调整。比如,形声结构中声符的调整之类。但是,文字发生之后,文字体现为书面语,在相当长的社会历史时期,主要就是文字传承使用过程。在文字的传承使用过程中,对于文字使用者提出字音与字形的关系,那就是根据字形,后加字音,即字音标识符是后来加上去的。可以说,创制文字阶段,与学习运用文字成为普遍社会现象阶段,二者是需要区分的。前者是主动的,后者是外加的。 汉字体系中,果真存在表音类型,至少就无需每个字都有待于注音了。
形声与表音。不少专家根据汉字中的“形声”、“假借”等类型,归结出汉字“意-音字”、“表音字”,并以之与“表意字”并列,这将导致逻辑混乱,也不符合汉字发展实际。从基本字符来源看,汉字来源于图画形式和一部分符号(非音符)。从形声结构所用声符来源看,也是先有“有意味的形式”这样的独体表意字符,继而可以充当声符,而在另外的场合又可以充当形符抑或义符,纯然为形声结构而设的声符是不存在的。
假借与表音。以为假借使用的就是“音符”,所以假借类可以算是“表音字或音符字”,这也是将文字使用过程中存在的关系,当作一类文字体制上的存在。汉字记录书面语,汉字字集当然是从汉字实际使用文献中集合出来,但这并不等于讲字集体系就是具体的汉字用例。就字集体系看,被借用的字形,原本都有自己独立存在的结构方式,以及所托音义。另外,在记录汉语的实际功能上,就算是处于被借用关系的语境里,也还是无从建立到见形知音的认知关联。既然作为本字不能表音,那么被借用对应同样的音值(假借的前提是音同或接近音同),怎么可能就能变得表音了呢?事实上,假借字同样也不符合所谓“表音字”的性质,汉字体系纯粹的表音字并不存在。汉语史上,到目前为止,也还不清楚到底使用了多少假借字,这是否意味着,汉字记录汉语,人们无法了解使用了多少音符呢?而且上面说到,有的场合下作为借用算作音符,在另外场合下又作为本字在使用,又不能算是音符。世界语言文字体系中,有可能使用这样的文字系统吗?创制的文字体系性质,与书面记录语言过程中所形成的种种关系,并不是一个层次的问题。所谓文字性质,就是文字体系所使用的基本字符的性质。像日语借用了汉字,不用说训读部分,就是音读部分,但其表音功能属性与五十音图符号,完全不是一回事,也不能说是表音字。所谓表音字符,就是看到其书面记录形式就能读出来。这样的功能特点,日语里只有五十音图才具备。
从文字本体基本属性出发的结构类型划分,是属于文字体制与构造模式问题;而文字学界通常所谓“三书说”、“六书说”乃至“多书说”分类,其实是杂糅了功能(属于语言层次的使用功能)与结构(属于结构类型、结构方式及结构成分的本体属性)不同的适应范围,根本上是文字与语言关系问题上,逻辑分类标准不够清楚。
对象及范围。既然汉字特质为以形表意(具体实现为以形体联系意义,以形体区别意义),那么就不同于表音文字体系,就要使用类型复杂的字形体系。这类复杂的字形体系,形体数量繁多(理论上讲,有多少词语就相应需要多少记录字形。只是由于发展为以合成词的方式区别词义,才使得汉字不需要无休止地造下去),在实际标记使用和实际书写过程中(加上使用历史的漫长和书写因素的复杂),必然形成种种复综关系(文字的考索,事实上就不得不变成“形音义”互相推求的局面,根源亦在于此)。由此决定汉字学具有独立的研究对象和范围,那就是结构本体及结构使用。由此规定了汉字学不仅是基础学科,而且是应用性学科,在某些历史条件下,甚至可以成为“显学”。汉字来源于“书面语”的分析集合,而不等同于“书面语”。书面语相对应的是口头语,二者仅存在风格差异。汉字是用以记录书面语的符号体系。
汉字学,真正算得是世界上独特的门类。表音文字根本上不具备这些属性内容,也就不能构成这样的特定研究对象。文字性质定义不清,研究对象及有关范围也就模糊,这就是汉字研究过程中,字词关系一直苦于纠缠的根源所在。
文字与词语。汉语史上,很多情况下所使用“字”的术语,其实都是关于“词”的问题。汉语史上曾经存在的这类现象,不应该成为对于汉语最基本结构单位的认知干扰。汉字的形音义三个属性要素,其实都是抽象概括的。比如字音字义从哪来来?都是从记录语言的实际中归纳出来的。只要落实到具体的音值、字义,那就是用字结果“词”而非字了。汉字系统中字形是历史的集合、字音是语音的抽象、字义是语义的概括,只要明确了具体音值和义项,那就是词而非字。异体字定义成立的基础在于词汇学,汉字的基本属性在于形体,就字形属性而言,结构形体相同,自然就是同一个字;而不同结构形体,自然就是不同的字:初无所谓同形、异形、异体、同源之类的区别。上述概念的使用,充其量只是在字与词发生联系即字形进入记录词语的实际使用过程当中,才有必要提出来的一些区别原则。换言之,也就是词本位参照下的结果。不同时代所面对的字形,都是历史积累的结果,体现着若干历时层次。要进行整理,才有必要援引“异体字”这样的术语。共时性质的文字材料,可以进行共时异体字的调查整理;历时性质的文字材料,通过溯源明流的历时考辨过程,则可以排除某一时间层次上偶然混用所形成种种“体异用同”关系。但是,毋庸赘言,历时的整理其实是件很困难的事情,而基于某个共时的语言词汇层面才有可能做得比较彻底。而且,使用的范围和使用的频率,其实是很难调查清楚的事情。因此,所谓“记录了相同词语,在另外的历史条件下也完全可以互相替换”,其实是无从把握的。另外,历史调查表明,异体之“异”,古文字阶段运用线条构成构件(构件独立使用就是独体字),差异存在于构件合成各类结构及结构关系之间;今文字阶段变异大量发生在构件层次,还有使用部分笔画单位形成的区别。因此,结构上异体主要存在于构件之间及构件组合之间,包括部分笔画使用所形成的区别性结构,而不涉及书写风格差异。概括起来,异体关系的讨论,要考虑形体、使用和历史。
楷化过程的字形选择原则就是区别性的实现,这个过程体现为形声的选择、简化的选择、从俗的选择以及结构平衡的选择等等,但选择原则的核心就是恢复区别、形成区别,即区别体制的建立。这些关系的调查,是要认识汉字古文字结构隶变楷化解体之后,在机制上楷字系统在多大程度上还算是表意文字。在模式类型上是要考察表意功能实现的模式所发生的调整转换。
声符与词源。有的语言学者以“声”义为纲,将同“声”而意义又相同或相近的字归属在一起,建立字族;字族中的各个字称为同族字。他们认为,一个字族相当于一个义场,“声”的异同是确定义场的异同的重要形式标志;“形”义相当于义符,借此把“声”所隐含的各种意义归入不同的语义范畴,如把“浅”归入“水”的范畴,“线”归入丝缕的范畴,等等。字族中各个字的语义关系形成一个小小的系统,其中有一个“根”,由“声”代表,表示的意义宽泛而抽象,相当于逻辑概念关系中的一个上位概念;其他字的意义都是从这个“根”中衍生出来的,从某一个侧面去注释“根”的意义,使之具体化。语义的分析如以字族为单位,那么“族”中各个字的语义关系就如义场和义符,可以据此进行系统分析。对于上述“义类”所谓“同族”观念,我们认为,形声字区分声符和形符,这是在文字学的层次上来讨论问题。但是,分开来讲形符和声符的功能又是比较机械的,在具体分析过程中总是离不开整个形声结构关系的规定和制约。单独将声符归纳到一个抽象的范围,而且这个范围是比较宽泛的,这个范围来源于对一个具有同源关系的词群的抽象,否则就不会存在这样一个抽象的范围;或者说,这个抽象的义位事实上是空设的:这种做法,属于词源学的层次。例如学者们喜欢提到的“戋”作为声符的例子。从这个角度说,声符对应的范围似乎更加广泛一些。但是,这其实是将有关从戋得声构造所记录的词义系统归纳的结果。没有所记录的词群,这种所谓的抽象意义是不存在的。
形声与认知。汉字发展到楷字,形声结构成为选择使用的基本类型。在形声结构中,离开声符和形符任何一边去分析各自的功能特点、范围大小,实际上都是一件困难的事情。形声结构中的声符和形符,各自的作用,都是在相互依存、相互对待的结构关系中实现的。形符和声符,就是通过“结构对立”,使字形结构意义得到区别。通过这种区别,使得我们习惯上所说的表音表义即音义对应关系得到确证。归纳起来,形声结构,体现了汉字的基本区别功能;而形声结构区别意义的实现,就是依靠形符和声符的组合。楷字选择倾向于形声结构,与其说是顽强保留标音示意功能,毋宁说主要是维护楷字结构区别性原则,以及由此带来认知机制上归类识别的方便。
字形与视觉。基于汉字基本属性在于形体,汉字视知觉规律,构成汉字认知领域研究的基本问题。汉字的认知特征,是结构整体性感知。就功能层次而言,汉字形体标记区别音义,是基于结构整体的规定。结构成分之间相互依存,相互规定,离开了结构整体联系,部件成分的功能则是无法实现的。汉字认知的关键是符合认知实际的分类问题。就汉字与视知觉而言,汉字认知结构整体性原则涉及了这样两个层次的意义:其一,视知觉认知规律是整体性感知的,汉字认知也是从结构整体出发的。其二,汉字结构成分的功能是基于结构整体的规定,同一结构内部成分之间相互依待;即使分离出来的结构成分,事实上在另外的场合业已经过了整体性认知过程。
“发展”作为认知科学的基本概念,照理应包含两个相互协调的平行领域:一是文字作为认知客体系统演变,一是文字习得者作为认知主体在文字传播接受过程中自身认知能力提升。相对于漫长复杂的文字发展历程,这里的中国文字发展史断代调查,也还只是选取了几个断面;而且时代分期,基本上是根据已有的项目基础课题资源分布,未必平衡合理。中国文字发展的系统研究、成因规律揭示,那还是众多领域跨学科长期建设的基础学科体系。在系列课题研发的基础上,所进行断代的专题性描写,是应中国文字专业发展和教学参考的急需,只能算是各个时代断面的“调查报告”和基本史料,称之为“汉字发展调查报告”,也许更加符合实际。不同时代文字使用发展的量化统计分析数据,限于目前各类语料库的加工水平,随着调查平台的不断完善,也将不断作出相应调整。同样,这里所涉及的学术观点,也是个人提出来供大家批评的意见,并不代表本丛书所有作者思想。自然地,断代丛书诸种,其文责也当由各位作者自负。
臧克和
初稿于2011年深秋海印寺
修补于2013年盛夏沪上