我们国家高等学校本科中最早设有汉语专业或者叫汉语语言学专业的,就是北京大学。这个专业是20世纪50年代由王力、魏建功、高名凯、袁家骅、朱德熙、林焘等我国老一辈的著名语言学家建设起来的。后来北京大学的汉语语言学专业又有了很大的发展,1988年和2001年都被评为全国高等学校的重点学科。可是,每年志愿报考北京大学汉语语言学专业的学生却并不多。这是为什么呢?这是因为大家并不了解汉语语言学专业到底是干什么的。大家很容易这样来思考问题:到英语专业念书为的是学习、掌握英语;到日语专业念书为的是学习、掌握日语;到俄语专业念书为的是学习、掌握俄语;到德语专业念书为的是学习、掌握德语;到汉语专业念书,岂不也就是为的学习、掌握汉语吗?而我从一两岁起就咿哩哇啦开始说话,到现在我又能说又能写,还需要学习汉语吗?考生、家长和社会上一般人都按这种思路来思考问题,当然就很少有学生会志愿报考这个汉语专业了。其实上面所说的那个思路完全错了。在高等学校建立汉语语言学专业的目的,并不是要叫大家来学习汉语,而是要叫大家来研究汉语。
汉语用得着研究吗?当然要研究。不但要研究,而且现在的社会科技文化的发展,越来越显示出,必须要让更多的人来研究汉语,必须要加大汉语研究的力度,必须要加大对汉语研究的投入。这为什么呢?这里不想一开始就全面地回答和说明这个问题。相信等这个课讲完,大家就会了解和明白这个“为什么”。不过想先跟大家说这样一个事实。
大家都知道,20—21世纪可以说是人类社会又一个大的转折时期,即从工业时代步入信息时代。进入21世纪之后,20世纪后期开始建立起来的“信息高速公路”将通遍全球,进入千家万户。正是这种时代发展趋势,促使对自然语言信息的计算机处理成为目前全球性关注的研究热点。据有关报导,像美国、日本、欧共体(欧盟)等,从20世纪80年代开始就已投入大量的人力、物力来加速智能计算机、机器翻译等方面的研制开发工作。无论是人工智能还是机器翻译这样的高新技术,都离不开语言学研究成果的支撑。各国在着手进行研制开发智能计算机和机器翻译等高新技术的过程中,都不约而同地把自然语言信息处理放在非常重要的地位来考虑。他们都希望自己在信息科学与信息工程技术领域内独占鳌头。据2001年8月17日星期五报载,美国大功能电子计算机运转速度每秒达12兆3千亿次,可见目前计算机硬件技术已经是突飞猛进,而现在卡住语言信息处理技术的真正难题或“瓶颈”就是对语言的研究,或者说语言信息的计算机处理。
就中文信息处理说,目前“字”和“词”的处理已经取得了很多成果,并已经开始投入商业应用,而眼下最大的难点则在于怎么解决好“句处理”问题。所谓“句处理”,就是要研究解决怎么让计算机准确理解并处理汉语里一个句子的意思,又怎样让计算机生成一个符合汉语规则的、能让大家都懂得的句子来。现在对于“句处理”有多种策略和途径:有基于句法规则的,有基于概念网络的,有基于语料库统计的,有基于语义计算的,等等,已经形成了一个竞相研究、竞相发展的局面。这当然不能不说是一个可喜的现象。但我们不能不看到,无论使用哪一种策略与途径来进行汉语的句处理,都离不开对汉语的认识,离不开有关汉语的知识。而我们对汉语的认识,或者说我们所需要的有关汉语的知识,是一种涉及到语音、语义、语法、语用等诸方面的综合的知识,因为说话者用语言跟听话者交际,表达自己的思想、看法、情感,或者听话者从说话者的话语中准确理解对方的思想、看法、情感,都需经过一个复杂的编码或解码的过程,而在这个编码或解码的过程中事实上要调动各种各样的因素。单从语言这个角度说,起码也得调动语音、语义、语法、语用等各方面的因素(如果是通过书面语言进行交际,还得调动视觉方面、或者说图像方面的因素)。现有的有关汉语的知识实际上还远远不能满足中文信息处理的需要,这就是因为我们过去对汉语的研究太不够了,研究的队伍和研究的人员都太少了。显然对上述种种解决句处理问题所采用的策略和途径,我们都需给以足够的重视,都应给以足够的鼓励和支持,让大家都继续深入研究下去。各种策略和途径可以各显神通,互相吸取,取长补短,通力协作,逐步形成在信息科学领域里能在国际上与他国抗衡的群体竞争力量,让我们国家,力争在不太长的时间里,在中文信息处理,乃至自然语言理解和处理方面,无论是工程还是理论都能达到世界先进水平,继而能居世界领先地位。在这里不能不提醒大家注意这样一个事实:即使是对于“中文”的信息处理我们也面临着严峻的国际挑战。我们需要清醒地看到,不要以为在“中文”的信息处理方面我们一定是大拿,优势一定就在我们中国人手里。事实上就目前形势看,我们最多只能说“中文信息处理”的优势“有可能”在我们手里。为什么这样说呢?我们知道,对于中文的信息处理,国外也早就注意并着手研究了。以往国外研究机构或大公司,或者是出钱将研究课题交给中国有关研究机构或高等院校来做;或者是从中国雇人去他们那儿进行研究。但从1999年以来这种情况有了重要的变化,比如像富士通、英特尔、IBM、微软、摩托罗拉等大公司,都已经开始陆续进驻中国,在北京、上海等地设立中文信息处理的研究机构或基地,并且以高薪雇佣中国研究人员(对外国公司来说,这比在他们自己国内雇人所花的费用还是要低得多),与中国研究机构与高等院校争夺汉语研究的人才,争夺中文信息处理的“制高点”。因此,如果我们不觉醒,如果我们不加大研究的力度,那么这中文信息处理的“制高点”要不了几年就会被外国公司或研究机构所占领。而这就不止关系到中华民族荣辱的问题,更关系到我国经济发展、国防建设乃至国家安全这样的大问题。这决不是危言耸听,而是严酷的现实。为此,不仅高等学校的汉语语言学专业要办好,要培养越来越多的从事汉语研究和教学方面的人才,而且也要让全社会,特别是大学生,都来了解和关注汉语语言学研究这个事业。我们所以要在北京大学各个专业的本科学生中开设“汉语和汉语研究”这个通选课程,主要目的就在这里。
随着科学的发展,各个不同学科之间从理论到方法都越来越相互渗透,相互借鉴,相互影响。通过这个课,我们也想要让大家了解,语言研究,具体说汉语研究怎么从其他学科中不断吸取自己所需要的理论、方法,又怎么影响着其他的学科。所以这个课主要是有选择地介绍汉语和汉语语言学研究中一些比较重要的问题,使大家在了解汉语和汉语研究概况的同时,也能从语言学研究的理论和方法中得到一些启示,以利于自己的学习和研究工作。
这门课程,除“绪论”外,准备讲授15个专题。这15个专题是:第一讲:关于汉语;第二讲:汉语研究概述;第三讲:结构理论与结构层次分析;第四讲:变换理论与句式变换分析;第五讲:特征理论与语义特征分析;第六讲:配价理论与配价结构分析;第七讲:空语类理论与空语类分析;第八讲:移位理论与成分移位分析;第九讲:约束理论与语义所指分析;第十讲:指向理论与语义指向分析;第十一讲:范畴理论与语义范畴分析;第十二讲:认知理论与语言认知分析;第十三讲:语用理论与语言运用分析;第十四讲:类型理论与语言类型分析;第十五讲:汉语研究与汉语研究的应用。由于授课时间和教材篇幅的限制,课程中很多问题不可能面面俱到,而都讲得比较简单。好在每一讲后面都列出了主要参考文献,有兴趣或希望深入学习的同学可以找来阅读、参考。