你所使用的词汇有哪些?也许你的单词处理器会告诉你论文的单词总数,但是你仍然不知道你究竟使用了多少种单词或同一个单词的使用频率。想要得到这些答案,我们可以上这个网址查询:www.er.uqam.ca/nobel/r21270/textools/web_vp.html。
使用方法:
(1)从电脑中复制此文章(例如某一课程的论文)。
(2)打开此网站,在文本框中粘贴所复制的文章。
(3)点击“do it”来获得结果。
得到的结果可能有点让人迷茫,所以我们来看一个例子吧(见下页的图片)。这里使用了我们所写的一篇学术文章。
让我们从右边看起。我们可以看到,文章共有 6799 个单词,不同的单词 1314 个。“token”(单词)这个词在这里指的是文章中的每一个单词。例如,后面括号里这个句子有 9 个token。(The sentence you are now reading has nine tokens.)“type”(类型)这个词是指每一个互不相同的单词。因此“the man who bought the dog”这句话只有 5 个type,因为“the”这个词出现了两次。而“Tokens per type”(每种类型所包含的单词)能够告诉我们每一个单词的平均使用频率,大约为 5.17。这个数字看上去似乎很大,但是这其中也包含了“a”“the”“or”“of”这类词。“Type-token ratio”(类型单词比)对于较短的文章非常有用。如果数值很低,说明你的文章中同一个单词用了很多次,这也就意味着你的文章可能比较无聊或者不够确切。
我们再往下看,可以看到很多不同的“Onlist”(列表内)数字,这些数字主要是针对程序在做分析时所引用的单词列表。并不是所有的单词都在列表内,也许是因为有一些太专业了,但也有可能是因为其中有一些程序无法识别出来的拼写错误。所以请记住,写论文一定要检查一下拼写!
我们再往左边看,这里有一些很有价值的信息。“First 500”(前 500)告诉我们有多少单词是属于英语里最常用的单词。在这篇文章中,这些单词占到了单词总量的将近2/3。而且请记住,这可是一篇学术文章。可以看出,你只需要知道并掌握这些基本单词就可以了,因为它们太常用了。
接着我们可以看到,有 73%的单词是属于最常用的 1000 词,其中 40%为“Function”(功能词汇),剩下的 32%为“Content”(内容词汇)。功能词汇指的是那些起到语法作用的词汇,但它们本身是没有什么意义的,比如说介词“at”和“up”、冠词“the”以及代词“she”。内容词汇指的是像“house”以及“university”这一类的名词或者类似“write”和“check”这样的动词。从这个例子中我们可以看到,功能词汇的数量要稍高于内容词汇。当然,这一比例也取决于你所写作的文章类型。如果是关于某一建筑的描述,内容词汇的数量可能就要更高一些了。
“K2 Words”指的是英语中最常用的 2000 词。在这篇文章中,只有 5%的单词属于这一类别。AWL的英文全称为“Academic Word List”,即学术词汇列表,这类单词对于学生来说非常重要。虽然这些单词在日常生活中并不常用,但是我们可以看到它们却占到了文章单词总数的 11%。如果你正在写一篇论文,但是你的AWL单词数量却非常低,那么你就得小心了,这说明你的文章可能太随便,不够正式。
如果你想把你文章里使用过的所有单词做一个统计,你可以使用这个网站:www.lextutor.ca/freq/eng/,右图所示的就是Lextutor网站的界面。
利用这个网站,你可以知道在你的文章中,哪些单词是最常用的。在这个例子里,最常用的单词(除一些语法词之外,如“of”“and”“or”等)包括像“centre”“language”和“self-access”这一类的单词(都与文章主题有关)。这种列表可以帮你找到你最常用的任何一个单词,不过重复太多总是不太好,最好能在同义词辞典里多找几个同义词(见本书第 56 页“同义词词典”)。
既然你已经知道自己用了哪些词汇,那么你所用的词汇与英语国家的人有什么不同吗?问问你的朋友,看能不能对他的论文做一个分析,把结果写在下面。你发现什么区别了吗?(如果找不到任何人能给你他们论文的复印件,也许你可以从你的老师那里拿一些范文来用。)
另外一种方法就是把你写的初稿和你修改后的版本进行比较,看是不是使用了更多的词汇?或者使用的词汇种类更多?学术词汇的情况又是如何呢?