计量世界里的“中国英语”：以摘要文本为例最新章节_李伟娜著

第一节
认识学术论文摘要

20世纪末，世界进入互联网时代，信息技术的发展及全球化以前所未有的速度改变着人们的社会生活。全球化也为各种不同的文化价值观念和社会结构提供了充分展示及交流的平台。进入21世纪，随着全球化步伐的加快，国际学术交流日渐频繁，水平也不断提高。在这样的背景下，文献的国际发表与收录状况业已成为衡量作者科研水平的重要参考指标，而英文摘要则是国际信息检索系统收录学术文献的主要依据。联合国科教文组织规定：“全世界公开发表的科技论文，不管用何种文字写成，都必须附有一篇短小精悍的英文摘要。”中国国家标准GB7713-87中规定：“报告、论文一般均应有摘要，为了国际交流，应有外文（英文）摘要。” CAJ-CDB/T1-2006［中国学术期刊（光盘版）检索与评价数据库规范］规定，理论与应用研究学术论文，包括综述性报告均应附中、英文摘要。由此可见，学术论文英文摘要直接关系到科研成果在世界范围的传播和交流。同时国际重要检索机构，如美国《科学引文索引》（SCI）和《工程索引》（EI）等，在决定是否收录和引证学术论文时，主要是通过阅读英文摘要来进行判断的（王敏芳，2008）。

在中国，一方面，学者为了加大其论文信息的传播速度和广度，提升论文的学术价值和应用价值，拓宽读者的阅读面，提高论文的被引用频次和影响因子，需要重视对英文摘要的写作；另一方面，很多学者学术论文的中文原文写得很好，但由于英文摘要存在一些问题，导致其优秀论文最终没有被国际重要检索系统收录。这里面有英文写作能力的原因，也有对国际重要检索系统的收录规则了解不足、适应不够的原因，更有对英文语言特点本身把握不足的因素。因此，学术论文作者对写好英文摘要的需求越来越大，学术界对英文摘要写作的关注程度越来越高，对其语言特点和结构功能的研究也逐渐呈云兴霞蔚之势。

对于英文写作能力的提高问题，由于英语受关注的程度越来越高，随着英语教育在中国的普及和发展（在中国，英语学习已经和语文和数学一样成为贯穿小学课程体系的主课之一，而且在小升初、中考和高考中占有重要的分量），加之中国作者也加大了英语写作能力的训练力度（近年来，很多高校都开设了通用英语写作课程，有些高校甚至开设了学术英语写作专题课程），中国作者的英语水平应经有了很大的提高，学术文章的英文写作基本做到句子通顺、语法正确，这一点得到了国际权威英语教育机构的肯定。另一方面，越来越多的中国作者也逐渐熟悉了国际重要检索系统的收录规则，掌握了学术论文英文摘要的结构特点和基本要求。但同时，细心的作者还会意识到，英文摘要除了必须符合英文的语法规定以外，所使用的词汇也应是常用公认的，而且还要尽量适用外国人的习惯用法，否则将影响论文的水平，进而影响到发表论文的期刊的质量，这是每个学术论文作者都应重视的问题；而这种对英文摘要语言特点的驾驭能力却是难以通过加强英文写作的训练和对写作规则的熟悉得到提高的。于是，英文摘要作为一种独特语体形式也开始引起学术界尤其是语言学界的关注。基于此，本书把英文摘要作为研究对象，把其语言特点作为研究目标。

一、摘要的定义

摘要是指以精炼的语言介绍文章的要旨、论点、实验结果和分析以及结论等，让读者了解全文概貌的一段文字。摘要应具有独立性和自含性，本身包括完整和独立成章的内容，一般出现在文章开头。虽然摘要通常被认为是学术论文的简短介绍性的文字，但还是被学者和研究人员从多角度加以定义。随着学术论文发表和学术著作出版的逐渐规范，对摘要的定义也经历了一个逐渐发展完善的过程。

最开始，美国国家标准学会（1979）把摘要规定为作者为发表论文所准备的一段能简短、准确概括文章内容的代表性文字。

后来，安德鲁（Andrews，1982）把摘要定义为一段概括长篇文章主要内容并突出重点，帮助读者决定是否值得阅读全文的简短性文字。该定义从语用的角度指明了摘要的功能。

再后来，洛克（Locker，1997）认为摘要指的是对长篇文献、论文、著作、研究报告或是期刊出版物等的一段简短概括，能够突出作品中的要点，简洁地描述作品内容和写作范围，指明所采用的方法，并说明调查结果或研究结果等。这在安德鲁定义的基础上从语言类型的角度对摘要的内涵作了进一步的描述和限定。

到了21世纪，Ufnalska（2009）把摘要定义为研究性报告或论文、评论、会议论文以及任何对某一问题或学科的深入研究分析的简要概述。摘要一般位于文章题目之后，正文之前。摘要应该用简短的文字描述研究目的、研究设计和研究结果。该定义对摘要的功能和风格作了进一步的整合归纳。

由此可以发现这些定义虽表述不一，但有一点看法是一致的，即摘要在形式上应该是简短的，在内容上应该是对学术论文信息的概述。虽然对摘要这种“有代表性的”“简短的”概括性文字的体裁还没有统一的明确的规定，但其作为介绍科技信息的写作形式应该是准确、简洁和客观的，功能上能够帮助读者迅速、准确地了解文献的主要内容，判断与自己研究兴趣的相关性，进而决定是否有通读全文的必要（American National Standard Institute，1979：403）。

二、摘要的功能

学术论文需要运用摘要对复杂的研究进行简短的交流。一篇摘要可以代替完整的论文成为独立体，因而被很多机构用来作为挑选学术会议发言的依据和基础，这说明其本身应具有独立性和自含性，即不阅读全文，就能获得重要的信息。摘要的主要功能包括：

（1）概括文献要点。摘要是对文献主要内容的提炼和概括，可以让读者在较短的时间内了解文献的主要内容，以作为文献标题的补充。由于现代科技文献信息浩如烟海，读者检索到论文题名后是否会阅读全文，主要就是通过阅读摘要来判断。所以，摘要的一个重要功能就是吸引读者的注意并快速将文章的主要信息传递给读者。

（2）吸引文献检索。随着网络技术的迅猛发展，网上查询、检索和下载专业数据已成为当前科技信息情报检索的重要手段，网上各类全文数据库、文摘数据库等，越来越显示出现代社会信息交流的水平和发展趋势，而论文摘要的索引就成为读者检索文献的重要工具。所以论文摘要质量的高低，直接影响着其论文的被检索率和被引用的频次。这是因为大多数文献数据库只能够索引到论文摘要而非整篇论文；由于版权以及出版费等方面的问题，许多学术论文全文需要付费购买才能获得，因此摘要在这个意义上成为文献纸质或电子版全文的重要“卖点”（Gliner & Morgan，2000）。

（3）方便国际交流。本书讨论的对象为英文摘要，在前文中已经谈到，我国早在1987年就有相关规定，为了推动国际交流，科学技术报告、学位论文和学术论文应附有外文（多用英文）摘要。而且国际重要的检索机构也主要是通过阅读英文摘要来决定是否收录。因此英文摘要还肩负着学术科研成果在世界范围交流和传播的重任。

三、摘要的内容

对摘要的研究发现，一篇摘要在结构上并没有一成不变的格式，不同种类的摘要，对于不同的内容有不同的侧重（Tippett，2004；Ufnalska & Hartley，2009）；但总体来说，论文摘要通常包括以下几部分内容：背景（background）、问题（problem）、方法（method）、结果（result）和结论或启示（conclusion & implication）。这些部分都要用简洁的语言作清楚的描述。有的时候，如果有可能，还应尽量提一句论文结论的应用范围和应用情况。

（1）背景：这部分需要回答“我的研究从哪里开始”这个问题。作者需要简要介绍研究的背景和现状，必要时，可以利用论文中所列的最新文献，简要介绍前人的工作，为过渡到所研究的问题做铺垫，以点明研究本课题的合理性和重要性。但这部分的介绍一定要极其简练，在这方面，EI提出了两点具体的要求：

第一，尽量少谈背景信息（minimize background information）；

第二，避免在第一句话重复使用标题或标题的一部分（avoid repeating the title or part of the title in the first sentence of the abstract）。

（2）问题：这部分需要回答“我要做的研究具体是什么”这个问题。说明文章主要解决的问题。一般来说，一篇学术文献摘要，可以不谈背景而在一开头就把作者写此文章的目的或要解决的主要问题或者研究设定的目标交代清楚。

（3）方法：这部分需要回答“我是如何进行研究的”这个问题。在交待了要解决的问题之后，接着要回答的自然就是如何解决问题。这部分内容主要说明作者的研究工作过程及所用的研究方法，也应该包括众多的边界条件、使用的主要设备和仪器或采用的衡量标准。在摘要中，过程与方法的阐述起着承前启后的作用。

（4）结果：这部分需要回答“我的研究得出了什么样的结果”这个问题。与研究过程及方法密切相关的往往就是最后的结果和结论。这部分内容具体指对研究数据的明析和阐释，还包括研究结果与原研究问题的关系以及结果的局限性。

（5）结论或启示：这部分解决“我从结果中能得出什么样的结论，获得怎样的启示”这个问题，以突出论文的意义。在文摘结尾部分还可以说明论文的主要贡献和创新、独到之处。

以上摘要的结构适用于学术期刊论文和学位论文等文献，摘要本身的结构内容和文献全文的结构内容是相吻合的，只不过摘要不对原始文献加以诠释或评论，而是对其进行准确而简短的概括，以反映原始文献的主要信息。对于会议论文需提交的摘要，有时候需要对实验内容描写得更加详细一些，这就涉及下一步将要说明的摘要的分类问题。

四、摘要的分类

摘要按照其内容和功能的不同，大致可划分为报道型摘要、指示型摘要和报道—指示型摘要3种类型，以下进行一一说明。

（1）报道型摘要。报道型摘要是指明文献的主题范围及内容梗概的一类简明摘要，相当于简介。报道型摘要一般用来反映科技论文的目的、方法及主要结果与结论，在有限的字数范围内向读者提供尽可能多的定性或定量的信息，充分反映该研究的创新之处。科技论文如果没有创新内容，如果没有经得起检验的与众不同的方法或结论，是不会引起读者的阅读兴趣的。所以学术性期刊（或论文集）应该多选用报道型摘要，用比其他类摘要字数稍多的篇幅，向读者介绍论文的主要内容。以“摘录要点”的形式报道出作者的主要研究成果和比较完整的定量及定性的信息。报道型摘要在篇幅上一般来说，中文在300字以上，而英文在200词以上。

（2）指示型摘要。指示型摘要是指明文献的论题及取得成果的性质和水平的一类摘要，其目的是使读者对该研究的主要内容（即作者做了什么工作）有一个概括性的了解。创新内容较少的论文，其摘要可写成指示型，一般适用于学术性期刊的简报、问题讨论等栏目以及技术性期刊等，只概括地介绍论文的论题，使读者对论文的主要内容有大致的了解。在篇幅上，中文指示型摘要一般在100到200字之间，英文以100词左右为宜。

（3）报道—指示型摘要。报道—指示型摘要是以报道型摘要的形式表述论文中价值最高的那部分内容，其余部分则以指示型摘要的形式表达。其篇幅中文在300字左右为宜，英文在100到200词之间。

以上3种摘要分类的形式都可供作者选用。一般来说，向学术性期刊投稿，应选用报道型摘要的形式；只有创新内容较少的论文，其摘要可写成报道—指示型或指示型摘要。从目的论的角度来讲，写论文的首要目的是被收录发表，而论文发表的最终目的是要引起关注和被人引用。如果摘要写得不好，在当今信息激增的时代，论文被收录进文摘杂志、检索数据库，被人阅读、引用的机会就会少得多，甚至丧失。一篇价值很高、创新内容很多的论文，若写成指示型摘要，可能就会失去较多的读者。在这种情况下，如果作者摘要写得过于简洁，在发表前就会被要求修改。

以下是3种不同类型摘要的样例，本书作者选取3篇代表3种类型的摘要实例，文本来自学术论文英文摘要语料库AAC（Acadenic Abstracts Corpus）的计算机科学专业子库（AAC-CS），每篇英文摘要还附有相对应的中文摘要。

●　报道型摘要

Software cache is a commonly used method which solves the irregular applications on Cell processor. Considering that software cache usually ignores the irregular reference memory access pattern and thus sets the cache line to a specific length，which elevates memory bandwidth overhead and limits cache utilization，this paper proposes an adaptive cache line strategy，which continuously adjusts cache line size during applications execution，therefore，the transferred data size is decreased significantly. Moreover，this paper presents a corresponding software cache—hybrid line size cache（HLSC）. It introduces a hybrid Tag Entry Array，with each mapping to a different line size. It’s a hierarchical design in that when a miss is occurred in the long line Tag Entry Array，misshandler is invoked at once. But if there is a miss in the short line Tag Entry Array，misshandler is invoked immediately as well the long line Tag Entry Array is checked. If it’s a hit in the long line Tag Entry Array，misshandler is abandoned. The hit rate is efficiently increased because hierarchical lookups. Additionally，an original replacement policy—index aligned strategy（IndAlign_LRU）is proposed to implement least recently unused replacement policy for multiple cache line sizes. Performance evaluation indicates that the adaptive cache line scheme greatly decreases the reduction of data transfer and improves hit rate. Additionally，aver-age execution speed of the HLSC is faster than that of the cache line design with 1024B，512B，256B and 128B by 28.9%，29.7%，32.1% and 33.5%，respectively.（cc60，244 words）

非规则问题是大规模并行应用中普遍存在和影响程序效率的关键问题，软件Cache是Cell处理器上解决该问题的一种普遍手段。鉴于通常的软件Cache忽略了非规则引用的内存访问模式，将Cache行设定为一个固定的长度，而加重内存带宽负荷及制约Cache利用率的问题。文中提出了一种自适应的Cache行算法，它根据非规则内存访问的特点，在程序执行过程中不断地调整Cache行的大小，因此减少了传输的数据量。同时，针对不同的Cache行大小，设计了一种相应的软件Cache结构——混合行大小的Cache。它包含多种Tag项数组，每种Tag项数组对应于一种Cache行大小。该Cache设计是一种分级的结构，因为当长Cache行的Tag项数组缺失的时候直接进行缺失处理，而当短Cache行的Tag项数组发生缺失的时候启动缺失处理，同时检查长Cache行的Tag项数组是否命中，若命中，则终止缺失处理。通过对Tag项数组的分级查找，Cache的命中率有了显著提高。除此之外，文中提出了一种新的行索引对齐的Cache替换策略，它能够在多种不同的Cache行大小并存的情况下实现LRU替换策略。实验表明该文提出的自适应的软件Cache行策略极大地减少了冗余的数据传输，提高了Cache的命中率。同时，与固定的1024B，512B，256B，128B的Cache行的性能相比，自适应的Cache行策略的执行速度分别提高了28.9%，29.7%，32.1%和33.5%。（490字）

●　指示型摘要

The integrity measurement of TCG can only insure that the components of a computing platform are tamper-proofed，which is not enough for avoiding the interference between components at runtime for building the trust chain. The interference of other components results in the unexpected information flow. The trust model of Trusted Computing Platform is analyzed in this paper. Based on the intransitive noninterference model，a formal method of analyzing the trust chain transfer is proposed. In a formalized way it specifies the security policy isolating the interference between components that can make the trust chain valid after integrity measurement.（cc96，98 words）

基于可信计算组织（TCG）的完整性度量只能保证组件没有被篡改，但不一定能保证系统运行可信性。其问题在于，当组件运行时，受其他组件的干扰，出现非预期的信息流，破坏了信任链传递的有效性。文章在分析可信计算平台的信任模型基础上，基于无干扰理论模型，提出了一种分析和判定可信计算平台信任链传递的方法，用形式化的方法证明了当符合非传递无干扰安全策略时，组件之间的信息流受到安全策略的限制，隔离了组件之间的干扰，这样用完整性度量方法所建立的信任链才是有效的。（218字）

●　报道—指示型摘要

This paper proposes a novel problem of mining top-k graph patterns that jointly maximize some significance measure from graph databases. By exploiting the concepts of information theory，it gives two problem formulations，MES and MIGS，and proves that they are NP-hard. Two efficient algorithms，Greedy-TopK and Cluster-TopK，are proposed for this new problem. Greedy-TopK first generates frequent subgraphs，and then incrementally and greedily selects K graph patterns from frequent subgraphs. Cluster-TopK first mines a set of representative patterns for frequent subgraphs，and then incrementally and greedily selects K graph patterns from representative patterns. When a given significance measure satisfies the submodular property，Greedy-TopK can provide tight approximation bound. Cluster-TopK has no approximation bound guarantee but is more efficient than Greedy-TopK. Extensive experimental results demonstrate that the Top-K mining proposed in this paper is superior to the traditional Top-K mining in terms of results usefulness. Cluster-TopK can achieve at least an order of magnitude speedup than Greedy-TopK，while achieving comparable mining results in terms of quality and usefulness.（cc119，153 words）

本文提出了一个新的研究问题：如何挖掘Top-K图模式，联合起来使某个意义度量最大化。利用信息论的概念，给出了两个具体问题的定义MES和MIGS，并证明它们是NP难。提出了两个高效算法Greedy-TopK和Clus-ter-TopK。Greedy-TopK先产生频繁子图，然后按增量贪心方式选择K个图模式。Cluster-TopK先挖掘频繁子图的一个代表模式集合，然后从代表模式中按增量贪心方式选择K个图模式。当意义度量满足子模块性质时，Greedy-TopK能提供近似比保证。Cluster-TopK没有近似比保证，但比Greedy-TopK更高效。实验结果显示，在结果可用性方面，文中提出的Top-K挖掘优于传统的Top-K挖掘，Cluster-TopK比Greedy-TopK快至少一个数量级。而且，在质量和可用性方面，Cluster-TopK的挖掘结果非常类似于Greedy-TopK的挖掘结果。（265字）

从以上摘要样例中可以看出不同类型的摘要所要突出强调的重点各有不同：报道型的摘要既交代了方法也交代出了研究的具体结果。指示型摘要主要描述了结论而非研究的具体结果。报道—指示型摘要则以概括介绍研究背景和意义为主，中间也不乏对研究数据结果的报道。对于理工科的文献检索（如EI），多数论文摘要属于报道型摘要，包括会议论文、研究报告及期刊论文，也包括个案研究。这类摘要包括研究工作的对象和范围、使用的方法、结果以及结论。而对于描写详细的综述评论性文章，就需要使用指示型的摘要，只需要描述研究的对象和研究范围。

本书研究的重点在于学术论文英文摘要的语言特点以及在不同学科领域中体现出的特点，由于不同学科领域的学术论文的研究内容有所差异，理工类更倾向于使用报道型论文摘要，而文科类如法学等倾向于使用指示型摘要，更有作者选择报道—指示型文摘，因此本研究对于文摘的类型不作深入的区分。

第一节 认识学术论文摘要