购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.1 改写的魔法:让语言焕然一新

本节首先来了解改写的概念及分类,以帮助我们更好地运用改写来达成高质量文本的目标。

3.1.1 改写的定义

改写就是用不同的方式表达相同的语义。作为一种语言行为和活动,改写在知识传播和信息传递的过程中普遍存在。改写集中反映了自然语言的多样性、灵活性和重要性等特点。改写可以用来表示将一个短语或者句子转换成其同义短语或者句子的过程,也可以用来表示改写过程生成的结果。

那么什么类型的词法关系和语法机制能够进行改写呢?改写保留了“概念上的近似等价”。Barzilay等认为改写是传达相同信息的可替换方式。而Oren Glickman等认为改写现象突出地反映了自然语言的多变性——用不同的方式保持着相同的意思。在国内,刘挺、李维刚等在前人旳基础上,对改写进行了形式化定义,假设有两个短语或简单句A和B,若满足以下条件:

(1)A、B为同一种语言的短语或简单句,且字面意思不完全相同。

(2)A、B分别是结构上稳定的短语或者简单句。

(3)A、B同属某个语义集合,即所表达的语义相同。则称A为B的一种改写,反之亦同,称句对{A,B}为一个改写句对,简称一个改写。特殊情况下,如果A、B分别是一个词,则{A,B}称为一对同义词。性质(1)主要区别于双语句对,性质(2)确定了改写研究的对象主要是短语或简单句,性质(3)是{A,B}成为改写的必要条件。尽管研究者根据自己的理解给出了改写的定义,但是如何确定互为改写的短语或者句子语义相等或相似程度的标准一直是一个没有确切答案的问题。

3.1.2 改写的分类

改写是自然语言中一种非常普遍和重要的现象,它体现了自然语言的多样性、灵活性和复杂性等特点。很多研究者从不同的角度对改写进行了研究和分类:Barzilay等根据改写的可分解性,将改写分为原子级和复合级;根据改写的粒度,将改写分为词汇级、短语级和句子级。Chutima等则将改写划分为6类,分别说明如下。

●同义词:用一个词的同义词替换该词。

●语态:语态之间的转换,例如主动语态与被动语态之间的转换。

●词性的变化:将词性进行转换,例如把一个名词转换为动词使用,或进行其他词性变化。

●断句:把一个长句子变成多个短句子。

●定义:用一个词的定义替换该词。

●句子结构的变化:用不同的句子结构表达相同的语义。

在国内,赵世奇等综合已有的研究成果,将改写划分为7类,分别说明如下。

●细微变化:在不改变原句语义的情况下,通过替换、添加和删除句子中的结构词来实现句子的改写。结构词又叫功能词,是指没有单独完整的词汇意义,更多是语法意义或语法功能的词。英文中常见的结构词包括代词、数词、冠词、助动词、介词、连词等。但是这类改写的应用价值不大,因为它引起的变化非常微小,而且不重要。

●同义短语替换:同义词属于同义短语的范畴,它是同义短语的一个特例。此类改写就是根据上下文语境,用符合要求的同义短语替换原文中的短语。这类改写被广泛研究和应用,一方面在于它所需的同义资源比较容易获取,另一方面在于它在语言的实际使用中比较普遍。

●词典注释替换:将原文中的词用其在词典中的注释进行替换。此类方法把原文中的专业术语等难以理解的词语用其词典注释替换,使其变得通俗易懂,从而更好地帮助读者理解被替换词的含义。

●语序变换:句子中的某些成分(例如英文和中文中的地点状语、时间状语等成分)可以放置于句子中多个位置而不会影响语句的意思,因而可以通过移动这些成分的位置来进行改写。句子结构变换:在原文意思不变的情况下,通过改变整个句子的结构来改变句子,而不是简单地对某个成分进行替换或改写。这是一类复杂的改写现象。

●句子拆分与合并:将一个复杂的长句子拆分成等价的若干简单短句,其中每个短句都包含原句中的一部分信息。句子合并则是将多个简单的短句合并成意思相同的复杂长句。从句的识别与指代消解等问题是此类改写的关键问题。

●基于推理的改写:要保证原文与改写句意思不变,需要某些背景知识的支撑。 rSxsOfyu+Vt96dwqew3salHNI3EExuw2BpKtXAqoNyWPRJWD+3TgbpNIpYcsFJ7R

点击中间区域
呼出菜单
上一章
目录
下一章
×