购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

论现代汉字的三级结构

【提要】 现代汉字的组成不是杂乱文章的,它遵循一种内部规则,这就是现代汉字的结构规律。那么,现代汉字结构是如何构成的?可以分为几个层次?各层次的关系是什么?前人并没有过多的论述,本文就笔画、字素、整字三级层次关系逐一进行了分析,尤其集中在对中间层次也就是字素的讨论。因为中间层次起着承上启下的作用,其内部结构也最为复杂。本文将字素分为位素、根素、字素三个层次,并就此讨论汉字的结构类型。

【关键词】 现代汉字 结构 字素

现代汉字的字形结构是有层次的,它的最高层无疑是整字,最底层无疑是笔画。对于中间层次争论最多,分歧也最大,诸如偏旁、部首、部件、元件、构件、零件、字根、字元、字素、笔画组合、形母等等。我们姑且不去理会这些名称,从理论上说在笔画与整字之间有一个层次,对于所有的汉字都应该是这样。比如“一”,只有一笔,既是笔画又是整字,中间层次一定与某一层次暗合了。怎样正确认识这个中间层次,将是我们讨论的重点。

1 笔画

汉字的笔画是汉字从篆书到隶书之后产生的,汉字在甲骨文、金文、篆书阶段,可以说是由线条构成的,直到隶书阶段才从线条变成笔画。

1.1 笔画的基本类别

晋朝卫夫人在其《笔阵图》中,把汉字的笔画划分成七种,但没有给七种笔画定名。直到唐代张怀瓘作《永字八法》,才定出八种笔画的名称,即侧、勒、努、趯、策、掠、啄、磔。此后人们划分汉字的笔画渐趋细密,笔画名称也日趋统一。现在一般分成两类,一类是不曲折笔画,称为平笔;一类是曲折笔画,称为折笔。

平笔笔画有六种:横、竖、撇、点、捺、提。其中“提”笔一般不单独列出,而是包含在横中。因为汉字中没有“提”起笔的字,另外汉字书法规定末笔是横的独体字或不能单独使用的偏旁,当它们出现在合体字左边时,其末笔的“横”变为“提”。如:堤、地、垠、壤、站、竭、飒、端、理、斑、球等。因此可以说“提”是“横”的变形。“捺”笔被包含在“点”中,因为汉字没有捺起笔的字,另外书法也规定,捺在特定条件下要变成“点”。如:泰、达、漆、趣、迭、迷、奇、牵、囚、林、树、松、植、粘、和等。经过这种归并,平笔只有横、竖、撇、点四种了。

曲折笔画有单折笔和复折笔两种,传统上把单折笔和复折笔统称为折笔,这样平笔和折笔加起来共有五种,这五种笔画被称为汉字的基本笔画,即“札”字法。

1.2 笔画组合的类型

除单笔外,两笔和两笔以上的字都有个笔画组合问题。现代汉字中,根据笔画之间的空间关系,可以分出三种笔画组合类型:

(1)散列式(相离关系):三、川、八、小、氵

(2)连结式(相接关系):人、巨、幺、口、正、血

(3)交叉式(相交关系):九、才、丰、艹井、文、聿

有人作了更细的分析,例如交叉又分为横竖交叉、竖横交叉、撇捺交叉、上下交叉、左右互交、内外上交、外内下交等。由于现代汉字大多数笔画在 9 画左右,这就决定了笔画之间不是单一组合模式,而是复合式,即同一字内笔画之间可以有多种关系,如:鱼、比、身、责、噩、鬼、现、是、笔、清、概、法、联、想等。

汉字笔画的组合不是杂乱无章的,而是有规律可循的,据分析统计,横笔和点笔的组合频率最高,撇笔和点笔出现的位置最活跃,钩笔与其他笔型组合时笔形变化最多,捺笔与各种笔形组合率最低。

1.3 笔画顺序

书写汉字时笔画的先后顺序称为笔顺。笔顺不仅仅是先左后右、先上后下等书写规则问题,作为研究内容来说,它是实现汉字规范化、标准化的内容之一。按照一般规则,我们可以这样总结:

对于这样的规则来说,也只能是个大概。实际书写起来,还会出现许多情况,这就需要一些具体细则,同时允许有例外。比如“区”,应属于从内到左,但同时又有从上到下的问题,所以不得不综合考虑,先写上,再写里,最后写左下。再如“戈”应该是从上到下,但先写斜钩也是从上到下,于是采取先完成交笔再写散笔的办法。再如“亚”,一横之后,按先左后右应是点,但同时它又有从轴心到边脚的问题,因此第二三笔就先写两竖。像这种写法很大程度上与书法有密切关系,先写两竖的主要目的在于替后面的笔画布局立一个基准线,其左右的点撇才容易安排,字体也显得相互映衬。书法有写“川”先写中间一竖的,中竖确定之后,“左右之竖相背”才能做得合适,写“弗、羽、兆、非”先写中间或框架其用意也是如此。由此看出,汉字的笔顺虽然依据自然位置上下左右之序为基本,但同时也照顾到形体匀称方面所提出的要求。汉字的组形结体是艺术的,而不是机械的。

应该看到,有些字的笔画顺序存在着多种分歧,这些字的笔顺难以用一个标准去统一,它们往往是既有左右关系,又有上下关系,符合多种标准,造成写法上的不统一。如:“比、敝、脊、臣、辰、出、火、非、里、母、皮、升、凸、凹、幽、乃”等,如何规范这些字的笔顺,是目前亟待做好的一项工作。

1.4 有关笔画统计的分析

笔画统计主要包括:笔画数的统计、基本笔画使用频度统计、汉字起笔末笔的统计、笔画拥字量的统计等方面。通过这些统计分析,可得出有关笔画的一些规律性东西,从而为汉字的整理和研究工作提供更充足的材料。

2 中间层次和字素

2.1 关于部件问题的讨论

随着计算机输入汉字的需要,人们开始对现代汉字的结构进行重新认识,切分字形不再完全按照古汉字六书的方式,切分出来的笔画组合也不再称为偏旁,于是开始使用“部件”这个名称。“笔画组成部件,部件构成整字”的观点也渐渐得到学术界认同。但是,对于部件的定名和认识,至今未能做到全面、统一。且不说不同意“部件”名称的大有人在,就是同样使用“部件”术语的,对部件的数量、特征、构成也不完全相同,甚至出入很大。

从 1980 年前后,就开始有了专门讨论部件名称的论文。如费锦昌《关于规定偏旁部件名称问题的讨论》、苏培成《现代汉字的部件切分》、陶小东《也谈部件定义》、晓东《现代汉字独体与合体的再认识》、《现代汉字部件分析的规范化》、费锦昌《现代汉字部件探究》等。

苏培成(1995)《现代汉字的部件切分》一文认为,部件大于或等于笔画,小于或等于整字。他提出了确定末级部件的五种方法:单笔画、相离关系的笔画或笔画组合、相交关系的笔画组合、封闭的笔画组合、相接关系的笔画组合,每一种都作了具体说明。

晓东在(1995)《现代汉字部件分析的规范化》中明确提出了部件的四个基本特征:绝大多数部件具有通用性、具有不可分割性、部件与部件之间常常有分隔沟(相互分离)、构成一个部件的笔画一般具有笔顺关系。并且对现代汉语 3500 个常用字进行了分析,得出了 474 个部件。

鉴于部件中单笔的切分问题,很多人提出了自己的看法,苏培成认为可以把分离状态的横、竖、撇、折都定为部件,费锦昌(1996)认为这并不能解决所有的问题,“韭”与“旦”一样,下面的一横都指地面,为什么“旦”中的横可以取得部件资格而“韭”下的一横却不可以呢?“币”上的撇与“氕”下的撇一样,从造字法角度看都是声旁,如果“氕”切分成两个部件的话,为什么“币”就不能呢?于是他提出“让单笔部件取得合法地位”,把部件分为基础部件和复合部件两类。

种种分歧,在于对汉字结构的理论认识上的不同。部件是不是构字的直接单位?为什么会出现一级部件、二级部件……末级部件的名称?是末级部件直接构字呢,还是末级部件构成一级部件再构字呢?

2.2 字素的概念

字素是从理论上推导出来的一个概念,指字以下、笔画以上的中间构字成分,是构字的基本单位。字素具有明显的物质性,它有着可供人们共同识别的形体。其中绝大部分还有被共同认知的读音和意义,字素与字素之间的结构关系、潜在特点支持着汉字的性质。

字素不同于笔画。字素是现代汉字的构字单位,笔画则是构成字素或字的最小单位。如:“知”有两个字素;“矢”和“口”,“矢”是 5 笔,“口”是 3 笔。二者是截然区别开来的。但字素作为构字的中间单位,又不排斥某一笔画成为字素,这是由汉字的结构特点所决定的。比如“丿”是一般所谓的笔画,它可以用在“爫、、乐”里,也可以用在“币”里,其所处位置的不同,决定了它的价值或地位是不等的。在“爫”中,它只是组成构字成分的一个笔画(可作为“采、捋、妥、受”等字的字素),而在“币”中,它与“巾”等价,从现代汉字字形切分角度看,“币”可分上下两部分,上半部是“丿”自身就是一个字素。再如“氕”是形声法创造的字,“丿”表示读音“ pie”,它与形旁“气”相等位,理所当然地成为一个字素。所以我们认为“字素”大于或等于笔画。

字素不同于传统文字学中的偏旁。偏旁过去在左为“偏”,在右为“旁”,尽管现在范围扩大了,无论在左、在右、在上、在下、在中间、在周围,都叫偏旁,但偏旁部首毕竟有它特定的范围和指称对象,它多着眼于六书理论的分析,而现代汉字字形分解更多地着眼于现代汉字字形,如果说偏旁说更适用于古汉字的话,字素说则更适用于现代汉字。

偏旁多指合体字分析出来的两个相离部分,如“杉”有两个偏旁“木彡”,“花”有两个偏旁“艹化”,可见偏旁是按照文字结构用二分法对合体字进行一次切分而获得的结构单位。而字素不然,它不仅适用于合体,而且也适用于独体。如“人”从理论上说同样具有三个层次,同样应该具备构字的基本单位,只不过构字基本单位与构字的最小单位重合了而已。那么这时,我们仍然承认“人”有两个字素“丿”和“乀”。也就是说笔画与字素同位,而“丿”和“乀”是无法称为偏旁的。此外,偏旁一般可以溯源,可以从古汉字那里求得相应的音和义,即具有可释性,而字素则往往只具有可分解性,未必能说出其中的道理来。比如“及”,小篆从又(手)从人,“人”和“又”是它的偏旁,而现代汉字字素分析只着重形体:分解为“丿廴”两个字素。再如“衷”,一定要知道“衣”和“中”是两个构字偏旁,而我们只分析为三个字素。还比如“颖”按偏旁分析法,一定要“从禾,顷声”,“禾”“顷”是它的两个偏旁,而字素分析则只要区别基本构件就可以了,可以是“ 页”两个字素。不过,字素在许多情况下并不排斥偏旁,比如“湖”分为两个字素时,就分别是两个偏旁“氵、胡”,再如:休、认、们、说、沟、江、独、祥等也是这样。

字素也不同于部件、字根。部件一般有两个含义:一是指对汉字(合体字)一次切分后所得的结构单位,二是指汉字(合体字)多次切分后所得的单位,第一个含义上的部件相当于“偏旁”,这里就不再多说了。第二个含义上的“部件”,就是有人讲的“元件”或“字根”。事实上,“字根”不是构字的直接单位,亦即它们在很多情况下不直接构字。它们往往先组合成再大一级的构字单位才去构字,所以字根不是字与笔画之间最直接的层次。“字根说”也认识到这一点,常在文中自觉不自觉地谈到“字根具有承上(笔画)启下(整字)的作用,合成整字时需要几个字根”。这实际上是说字根是构字单位的单位,在字根之上还有一个层次也叫字根,这其实就是字素。当然有些字直接由字根组成,有些字根处于备用状态时是字,但汉字的大多数是多层次的,这从多根说的分析上就可以证明:

无奈之下,只好分别出一级字根(部件)、二级字根(部件)……末级字根(部件)……,这种区分几乎是毫无意义的,因为一级字根具有不可穷尽性,除去重复外,它几乎等于常用汉字数量。“鹭”中二级字根就含了笔画“、”,三级字根中却还是笔画组合“口、止、夂”等,单列出来则显得毫无道理。此外,说“何、路、鸟”是一级字根,那么“各、可”在“洛、河”中不也可以是一级字根吗?到底“一级字根”是什么样的概念,恐怕就公说公有理,婆说婆有理了。

总之,字根不是组字的直接层次。不能说字由字根构成,只能说字中包含着字根,字根按不同的结构方式组成构字成分,再由构字成分组成字,那么这个构字成分只能是字素。

2.3 字素的范围和种类

字素是一个通称,不仅合体字中有,独体字也包含字素。独体字中字素大于等于笔画,合体字中的字素即现代汉字一次切分后的构字单位。合体字的字素在备用时往往成字,但进入合体字之后,这些原字仍然可以划分层次和结构,即字素本身也有构成问题。字素的底层是位素,即构成字素相互区别的最小单位。位素之上是根素。即构成字素的基本单位,根素有时是可以分级的,可以有一级根素,二级根素……末级根素,这样,字的层次可以建立为:字——字素(根素一位素)——笔画。如:

由于汉字结构的复杂性,造成了字素与根素、位素之间,根素、位素与整字之间错综复杂的关系。从理论上说,现代汉字结构只有一个构成模式,即三级结构,但实际上并非每个汉字都具有同样清晰的可分性。因此,位素只是字素的底层单位,而当字素不具备复杂层次的话,这时字素就具备了位素的资格。同样,当根素位于最底层时,它也同样取得位素资格。可以说,位素是具备一定形体,具有一定含义,在构字中反复出现的笔画或笔画组合的最小单位。

这样,字的复杂层次就可以划分出不同类型,如:

从字素本身的结构来看,合体字中的字素可以分为单素和复素两类。单素指由一个位素构成的字素,即直接由笔画组成的字素,如:“氵、木、亻、口、艹、人、目”等。复素指包含两个或两个以上位素的字素,如“湖”中的“胡”,“鸿”中的“江”,“魔”中的“麻、鬼”等。复素处于备用状态时,大多数是字。

从字素与字的关系上分,字素可以分成字字素和不成字字素。成字字素指处于备用状态时,有音有义的位素结合体,如“胡”处于备用状态时读hu,有义,进入字之后,就成为一个字素,如在“湖、葫、糊、鬍”等中。此外“人、目、口”等都是成字字素。不成字字素指处于备用状态时,没有固定语音和意义的字素,如“亻、刂、氵、犭、礻”等。成字字素可以是单素,也可以是复素。

成字字素与不成字字素之间的关系,类似语言中成词语素和不成词语素之间的关系。当某个成字字素进入文字体系之后,它就取得了字的资格;当它进入文字的结构之后它就取得了字素的资格。所以字与字素之间是有兼类的,至此,我们可以用下图表示:

2.4 字素的切分原则

从上文中可以看出,一般所说的“元件”或“末级字根”,相当于我们所说的位素,切分出位素是很有必要的。据粗略统计,汉字的位素在200 个左右,而汉字的字素即第一级切分在 3000 个左右。由于“部件”说法名称不一,所指不同,切分方式有别,各家所得的“部件”差异也很大,有 105、128、160、166、177、205、250、300、344、512、686 等。用什么标准来肯定某一结构可以作字素而不是字素中的笔画,某一构字成分是单素还是复素呢?一个绝对单一而又合用的标准如果找得出,当然是好事,但事实上很难找到这样一个标准。对于字素的切分,我们认为可以区分必要切分和不必要切分。必要切分即必须对汉字进行的切分,不必要切分即无用切分,它指在某一范围内的无效切分。对于汉字编码来说,将汉字切分至位素一级是必要切分,如果再将位素切分成笔画则是不必要切分。对于识字教育来说,将独体字切分成笔画或将字素切分成笔画则是必要切分,因为笔顺、笔形、笔画组合、笔画数是识字的一项重要内容,不切分到笔画就难以学好汉字。所以明确切分目的,明确服务对象,是决定切分原则的前提,这里主要谈供计算机用汉字字素的切分。

2.4.1 层次分析法。即把合体字分级予以切分,依次切分到位素为止。“字素”一词本身就是层次切分的结果。因为现代汉字的传承性,决定了它的结构多是有理据性的。而且形声字占大多数,再加上会意字和部分象形字(楷体)也可以切分成两部分,所以适于层次分析法的现代汉字就占了绝大多数。

2.4.2 依据现代汉字字形,可分析性和可组合性相结合。可分析性即字形的可分解性,如“音”明显分为“立”和“日”两部分,“冀”分为“北田共”三部分,“鏖”分为“鹿”“金”两部分,“虎”分为“虍”“几”两部分,可分析性只据楷体字形,完全不顾汉字的来源和历史。可组合性,即分析出来的字位必须是在字中的同一方式反复出现的单位,具有较高的组合频率。比如“彐”、“爫”、“立”、“土”:

彐:寻、灵、刍、当、雪、归、扫

爫:采、孚、觅、谣

立:音、竖、端、位

土:寺、坚、地、吐

但有时也免不了少量单素,如“”(衰)、“”(虐疟)等。

2.4.3 不拘泥于字源。明确了切分目的,便不必拘泥于造字历史。比如“器”,不切分成“ ”“犬”,而是切分成“ 犬”,“赢”不切分成“ 贝”,而直接切分成“亡、口、 ”。“夫”不切分成“一大”而切分成“二人”,因为作为字位来说,笔画的出现频率较低,而“二”的组字频率则较高。

2.4.4 字素可以包括单笔画位素。如“轧、礼、札”中的“乚”,“玉”中的“、”。再如:

2.5 字素和位素的音义问题

字素和位素是从现行楷体字分析出来的,汉字字体历经多次变动,尤其是隶变和简化以后,许多汉字已经丧失或部分丧失了其构形的有理性,这样,分析出来的字素(位素)必然会有一些是无音无义的,如“彐、廾”等。我们主要用形体标准来确定字素或位素,所以不能因为它们未具备音义而不承认它是位素。另外像“氵、刂、灬、囗”等也不算是有明确读音,只是有个称呼而已。但这不等于说位素定名无关紧要,它关系到汉字的学习和使用。上世纪 60 年代中期,《文字改革》上曾经展开过规定汉字偏旁名称的讨论,一些意见仍值得参考和采纳,如“左旁右边”、“上头下底”、“外框内心”、“中腰四角”等。

3 整字

3.1 独体字和合体字

现代汉字字形结构可分为笔画字素与偏旁字素两类,前者为独体字,后者为合体字。具体来说,独体字在字形结构上只能分解出笔画,而不能分解出意义字素,比如“川、八、人、手、小”等。合体字指在字形结构上能够分解出偏旁字素的字,如“初、厅、村、析、结、细”等。有时分解出来的两个或多个字素并非都是偏旁字素,但只要含有一个或一个以上我们就认为该字为合体字。如前面所举的“币、韭、事、札”等。

现代汉字的独体字和合体字与古汉语所指不同。现代汉字是以字形分解为基础来定义的,而古代所谓“独体”“合体”是以造字方式为基础定义的。

现代汉字的独体字可能是古代汉字的合体字。比如“曰”,《说文》解释为“从口乙声”,认为是个合体的形声字;“甘”,《说文》解释为“美也,从口含一”,认为是个合体会意字,在现代汉字中,它们则属于独体字。

现代汉字中的合体字可能是古汉字中的独体字。比如“虎”,甲骨文为像老虎之形,《说文》中说:“从虍,虎足像人足,象形。”仍然认为是个象形字,在现代汉字中可以切分成“虍、几”。“泉”在《说文》中为象形字,像水源之形,而既代汉字则认为是“白”“水”组成的合体字。“阜”的小篆字形为像土山之形,现在则分成“、十”两部分。

同一个字的不同写法可以有独体与合体之分。比如“厂”为独体,“厰”为合体;“千”为独体,“韆”为合体;“头”为独体,“頭”为合体等。

值得指出的是许多字古今所指独体与合体是同一的,有分歧的只是少数。

3.2 现代汉字的结构类型。

汉字的结构模式即汉字字素与字素之间的关系问题,一般从两方面来分析。

3.2.1 空间关系:一个合体字字素与字素之间的关系有三种类型:相离关系,如“相、信、品”等;相接关系,如“局、吊、市”等;相交关系,如“事、果、东”等。

3.2.2 方位关系:指合体字字素所处的位置以及位置与位置之间的结构关系。从字素这个层次看,有三种类型:上下关系,如“思、呆、苗”等;左右关系,如“相、信、课、江”等;内外关系,如“局、司、围、这、困”等。如果继续分析根素与根素、位素与位素之间的关系,仍可以划分出许多小类来。

极个别的字作为个别处理,例如:“噩、坐、乘、爽”。也有人采取平面分析法分析汉字的结构,如傅永和在《汉字的结构》一文中,分成“两个部件构成的合体字”、“三个部件构成的合体字”……“九个部件构成的合体字”,并对每一种合体字的具体结构做了分析。

(l)两个部件构成的合体字,其结构方式有 9 种,代表字为:吕认压达勾问匹凶团。

(2)三个部件构成的合体字,其结构方式有 20 种,代表字为:荣抛树型花培部庶厢缠逞逊闾润挺捆抠圄幽乖巫。

(3)四个部件构成的合体字,其结构方式有 21 种,代表字是:阔匿欧营辔蕊蓝停额摄燃游韶遮腐寤嫠筐极剩。

(4)五个部件构件构成的合体字,其结构方式有 20 种,代表字为:渤澡搞敲蒿缀樊嚣酃骼戳篮寝漉齁蘧赢魔膏噩。

(5)六个部件构成的合体字,其结构方式有 10 种,代表字为:歌豁麓豌翳瀛衢臀冀灌。

(6)七个部件构成的合体字,其结构方式有 3 种,代表字为:戆麟饕。

(7)八个部件构成的合体字,其结构方式只有一种,代表字为:齉。

(8)九个部件构成的合体字,其结构方式也只有一种,代表字为:懿。

应该说两种分析法各有其应用的范围,有的领域多采用平面分析法分析合体字的结构,有的领域多采用层次分析法分析汉字的结构。

总之,现代汉字的三级结构,决定着现代汉字的很多方面,例如现代汉字字形的结构、构形的特点、对外汉语教学中的汉字教学、汉字信息处理等等方面,因此,正确认识结构层次论,对于汉字应用具有重要作用。

参考文献:

[1]陈原主编.现代汉语定量分析[ C].上海:上海教育出版社.1989.

[2]孙钧锡.汉字基本知识[M].石家庄:河北人民出版社.1980.

[3]王凤阳.汉字学[M].长春:吉林文史出版社.1989.

[4]苏培成.汉字字形规范的理论和实践[J].语言文字应用.1992年(2).

[5]张普.汉字部件分析的方法和理论[J].语文研究.1984 (1).

[6]傅永和.谈规范汉字[J].语文建设.1991 (10).

[7]高更生.谈异体字整理[J].语文建设.1991 年(10).

[8]高更生.汉字笔顺应执行统一的标准[ J].语文建设.1992 年(10).

[9]苏培成.现代汉字的部件切分[J].语言文字应用.1995 (3).

[10]费锦昌.现代汉字部件探究[ J].语言文字应用.1996 年(2).

[11]晓东.现代汉字部件分析的规范化[ J].语言文字应用.1995(3). NXbXzRhtigNZWUSJ7o4sBLkHSrUuj0nIJI95L6X/VWaLSjNe38eaEnBW7SZtZY3b

点击中间区域
呼出菜单
上一章
目录
下一章
×