语言学同历史学虽然都是独立的科学,但有许多地方可以互相帮助。历史学能帮助语言学,这是我们都知道的;因为要研究一种语言,第一步先要知道说这种语言的民族的历史,这用不着我们再详细去说,至于语言学能帮助历史学的研究,甚至有些历史上的问题只有从语言上去解决,似乎还有特别提出来谈一谈的必要。我预备在下面举两个例证。
第一个例证我想举印度欧罗巴民族原居地和以后迁移的情形的问题。这当然都是历史的问题;但提出这问题而又把这问题解决了的却是语言学。要叙述这问题,我们应该先从比较语言学说起,18世纪末、19世纪初年欧洲学者才开始接触到梵文。不久他们就发现,梵文同希腊文、拉丁文相似的地方非常多。经过细密的研究,他们终于知道了,他们一向认为是有色人种的印度人用的语言,原来同他们自己的古代语言竟是一系,皮肤黑色的印度人原来也同他们是一家。几千年前分了家出走的一个兄弟,现在忽然又回来归了宗。对白种的雅利安人这是多么大的一件喜事。所以欧洲一位大学者说,Dyaus-pitr (梵文) =Zeus-pater (希腊文) =Jupiter (拉丁文) 。这个公式的发现是19世纪人类最伟人的发现之一。他们既然知道了梵文、希腊文、拉丁文和欧洲近代语言原来都是一个来源,于是他们就根据这线索研究下去,终于把所谓原始印度欧罗巴语言拟构出来。这种语言就是后来一切印度欧罗巴语言的祖先。在这语言里有一个舌根音。这舌根音后来不知道为了什么原因分化起来。在印度语系的东支语言里,它变成摩擦音;在西支语言里,它变成k、kh、g、gh。譬如说表示“狗”的字在希腊文里是kuon,在拉丁文Canis,这是西支。在梵文里是Svan,在立陶宛文里是Szuo,这是东支。“百”字在拉丁文里是Centum,在希腊文里是Hekaton,在Avesta里是Satem,在梵文里是Sata,在立陶宛文里是Szimtas,在古保加利亚文里是Suto,在俄文里是Sto。学者们平常就用Centum这个字来代表西支语言,用Satem来代表东支语言。这些语言虽然都是从原始印欧语里演变成的;但却各有各的特点。间或也有两种特别接近的,像古代波斯的Avesta和梵文。以上这许多事实都是纯粹由研究语言得来的。倘若把这研究语言得来的结果应用到历史上,我们可以对印欧民族迁移分化的情形得一个清晰的轮廓:现在散布在欧亚两洲的白种人在纪元前几千年的时候原来都是一家。他们定居在旧大陆的某一个地方,人口大概也不会太多。后来也许是因了宗教意见的冲突,也许是因为政治意见的冲突,终于分了家。一支往西走去,几千年来,子孙繁衍,形成了许多国家。一支往东北或东南走去。在向东南去的路上,他们停留在现在的伊朗地方,共同住了一个期间。大概内部又起了冲突。于是一部分留在原地,一部分却越过高山,冲进了印度,成了现任印度雅利安人的祖先。看了我这简短的叙述,谁也会知道,这事实在世界历史上有多么大的意义;但在世界历史上有这样重大的意义的事实却不是历史学告诉我们的,而是语言学。
我上面说到原始印欧民族曾定居在旧大陆的某一个地方。倘若现在要问,究竟在什么地方呢。这当然又是一个历史上的重要问题。考古学、史前史、人类学都能帮忙解决这问题;但倘若没有语言学,其他科学都只能给我们一点零碎的知识。只有语言学能把这些零碎的知识贯通起来,给我们一个清晰而具体的答案。所以我们仍然只有先从语言学下手。我们先看一看学者所构拟成的原始印欧语言里究竟有些什么字,尤其是动物和植物的名词。动物名词有牛、马、羊、狗、猪、熊等;但没有虎、象、狮子、驴、骆驼。植物名词有柳树、桦树、山毛榉等。既然没有虎、象、狮子,可见原始印欧民族还没见到这几种动物;因而也就可以推论到,他们的原居地一定不会是热带。同时又因为原始印欧语里没有表示“海”的字,足见他们住的地方也不近海。没有“骆驼”,可见他们不是住在沙漠里。但从这些字里面,我们仍然不能确定地指出一个地方来。让我们再看看植物名词。在这些字里面,最重要的是“山毛榉”这个字;因为据学者观察和研究,倘若在欧洲北部从德国的大城königsberg起向南画一条经过俄国的Kiew一直到黑海岸的Odessa止,那么只有在这条线的西面才有山毛榉,东面没有。所以原始印欧民族的老家一定是在这条线的西面。把上面这些归纳起来,我们可以说,印欧民族的原居地大概就在中欧至北欧一带地方,而且还稍稍偏东。有了这语言学告诉我们的知识作基础,然后其他科学关于这方面的研究才有所依附,得到的结果才不致茫无边际。所以在研究这个极重要的历史的问题的时候,语言学为主,其他如考古学、人类学都只能帮助语言学。原始印欧民族的原居地的问题是个极大的问题。我上面虽然说了许多,而且得到一个似乎是结论的结果;但这问题并不像我上面说的那样简单,那结果也还不就是结论。将来的发展还有待于学者的努力。不过,将来无论研究到什么程度,那些由语言学观察出来的结果却绝不会被推翻,学者们只能把这结果补充修正,使它更接近真理。
同这问题相连的还有一个问题,也是语言学提出来而现在还没有解决的。我们上面说过印欧语系有东西两支。在欧亚大陆西部的属于西支,在欧亚大陆偏东部的属于东支。这似乎非常自然,一点也没有问题。在19世纪比较语言学者所知道而加以研究的许多印欧语系的语言都合于这个区分,换句话说,就是他们的文法现象和地理部位毫不冲突。但20世纪初年学者们又在中亚发现了几种新语言,吐火罗文就是其中的一种。这些语言都毫无疑问的属于印欧语系。按地理说,吐火罗文应该属于东支,因为吐火罗文残卷都是在中国新疆发现的。但吐火罗文的文法却确实是属于西支的。“百”字在吐火罗文里是kant,这就足以说明吐火罗文是一个Centum语言,为什么在一群印欧民族的东支的民族里会有一个属于西支的民族呢?目前我们还没有方法解答这问题。但我们相信,倘若将来这问题一旦解决了,我们对世界史,尤其是印欧民族迁移的历史,一定有很深的了解。
另外一个问题也同印欧语言有点关联,我们也在这里提出来谈一谈。钢和泰先生曾指出来,中国语言里有几个字似乎同印欧语言有点关系 (见北京大学《国学季刊》第一卷第 一期,《音译梵书与中国古音》,胡适之先生译) 。譬如说,“犬”字似乎同希腊文的Kuon,拉丁文的Canis同源。倘若这种例子找多了,我们说不定就可以证明中文同印欧语系同出自一源,也许能把中国人同印欧民族拉成一家。我虽然不敢说,这一定可能;但也不敢说,一定不可能。我只能说,在目前还没法证明。倘若认真想解决这问题,我们只有效法欧洲学者的办法,去研究中国古音,把原始中国语言构拟出来,然后再同原始印欧语言去比较。这当然又是一个在历史上非常重要的问题。在这里,我们也只有先走一条路,就是语言学的路。
以上讨论第一个例证。第二例证我想举古代西域人种的问题。我们都知道,现在住在中亚和中国新疆一带的是突厥种。但在突厥人到这里以前是什么人在这里住呢,我们古代的历史书虽然有一些对西域特别注意的,特别专写一章论西域的事情;但从那些记载里,我们很难窥测到这些所谓胡人都究竟属于哪个种族。对这些胡人的相貌,《魏书·西域传》“于阗国”条算是给了一个比较具体的描写:“自高昌以西,诸国人等,深目高鼻。唯此一国,貌不甚胡,颇类华夏。”但是只是“深目高鼻”四个字只能告诉我们,他们同“华夏”人不一样。白种人固然是“深目高鼻”,突厥人又何尝不这样呢,我们仍然不能确定他们的种族。自从19世纪末年20世纪初年,中亚古器物文献出土以后,我们研究的凭借增加了。我们从壁画上可以看到这些“胡”人的面貌;但给我们的印象仍然只是“深目高鼻”四个字。连从地里掘出来的头盖骨也只能告诉我们,在突厥民族没来到以前,中亚民族一定是属于印欧民族的白人。我们仍然不能知道,究竟是白人的哪种。在这里能帮助我们解答这问题的又只有语言学。
在中亚新发现的三种古代印欧语系的语言中,吐火罗文是独立的一支。关于说这种话的民族的归属问题,学者们的意见还非常不一致,我们这里不能详细讨论。其余的两种,于阗文和窣利文都已经有学者研究认为是属于印欧语系伊兰语系的。所以说这种话的人们大概也就属于伊兰氏族。现在我们再回头看我们上面提出的问题:在古代西域突厥人未到以前究竟住的是哪一种人,我们就可以回答说:最少有一大部分是伊兰民族。
以上讨论第二个例证,可举的例证当然还非常多;但只是这两个也就足够能表示出来,语言学是怎样能帮助历史的研究了。我上面说的有些只是老生常谈;但我为什么特别提出语言学同历史学来讨论呢?因为我觉得,有许多科学都能作史学的辅助科学;但语言学似乎还没被人特别重视过。我特别提出来,只是想唤起大家的注意。此外我还觉得,有很多纯粹的语言学者把研究的范围死死地限制到语言方面,不向外走一步。这我也认为很可惜。当然并不是每一个语言学研究的结论都可以应用到历史上去;但最少有些是可以的,而且把语言学的结论应用到历史上获得的结果多半都非常可靠。为了让语言学家注意起见,我写了这篇短文。
1947年11月29日北京大学