购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4.1 文档格式标准发展概述

文档作为信息和知识的载体,已经被应用在各种场景中,如科学论文、电子政务、商业信函、财务报表、合同契约、档案稿件和产品手册等。统一的文档格式标准有助于信息的规范化处理,如编辑、存储、检索、转换等。办公文档应用被应用于各行各业,每天都有大量的办公文档被创建。20世纪90年代,数字化的文档格式尚未形成统一的技术标准,人们逐渐发现,如果这些办公文档以某个公司定制的私有格式存储,每个收到文档的人,都要用特定供应商提供的软件才可以打开文档,这将为文档的长期存储、分发和传播带来巨大风险。因此,形成一套开放的技术标准体系越来越重要,很多国家和地区都制定了支持开放的文档格式标准的政策文件。

开放的文档格式标准有助于信息的互联互通,让用户可以自由选择办公软件供应商,同时能够促进供应商之间在市场上的平等竞争,并有利于增强文档系统的安全性。随着时间的推移,陆续有多项以XML为核心描述语言的开放文档格式[如OOXML(Office Open XML)、ODF(Open Document Format)、UOF(Uniform Office Format)等]标准发布。常见的以xlsx、xltm、xltx为文件扩展名的电子表格文档,以及以docx、pptx为文件扩展名的办公文档都遵循ISO/IEC 29500文档格式标准,该标准也被简称为OOXML标准、OpenXML标准或ECMA-376文档格式标准,本书将简称其为OpenXML标准。

OpenXML标准的标准化工作由ECMA 国际下属的TC45技术委员会 执行和维护。ECMA国际是一个致力于信息和通信系统标准化的国际性行业组织。多个机构和公司参与了OpenXML标准的制定工作,包括来自苹果公司(Apple Inc.)、巴克莱资本(Barclays Capital)、英国石油公司(BP p.l.c)、大英图书馆(The British Library)、依视路公司(Essilo Inc.)、英特尔公司(Intel Corporation)、微软公司(Microsoft Corporation)、NextPage、诺维尔公司(Novell Inc.)、挪威国家石油公司(Statoil)、东芝公司(Toshiba Corporation)、美国国会图书馆(Library of Congress)的代表。OpenXML标准在2007年被 国际标准化组织 (International Organization for Standardization,ISO)通过,成为一项办公文档领域的国际标准。许多常用的办公应用都遵循该技术标准,包括桌面商业办公套件Microsoft Office、Apple iWork、IBM Lotus Symphony、Kingsoft WPS Office和永中Office等,开源办公套件Apache OpenOffice和LibreOffice等,以及新兴的在线办公应用Microsoft Office Web Apps、Google Workspace、ONLYOFFICE、石墨文档、钉钉文档和腾讯文档等。


在制定OpenXML标准时,办公文档常以二进制格式进行存储,当时约有4亿用户在使用这种格式的文档,文档数量约有400亿份,并且每年以数十亿的数量增加。这种二进制的文档格式是在当时计算机计算资源和存储资源有限的背景下设计的。而以XML为基础的文档格式新标准结合了硬件设备的发展、网络传输环境的变化和文档内容的可扩展性等因素进行重新设计。当时人们基本上仅通过桌面办公软件来使用办公文档,考虑到未来除了通过桌面办公软件读写办公文档,还将有使用其他文档编辑程序来处理这些办公文档的场景,例如根据业务数据自动生成文档、从文档中提取业务数据并将这些数据输入业务应用程序中、只对文档的一小部分执行受限任务但保留文档可编辑性、为具有特殊需要的用户群(如盲人)提供辅助功能、在各种硬件(包括移动设备)上处理办公文档等,OpenXML标准的设计形成了开放标准,这也让类似Excelize这种文档处理基础库的实现成为可能。

文档的长期保存是最为重要的问题之一。文档以数字化表示形式对信息编码,而数字化表示形式与编码信息的程序密切相关。保障数十年后依然可以读取文档而不会有明显的信息丢失是很困难的,OpenXML标准的制定过程中充分考虑这一问题,最终选择以开放的XML格式作为基础。 jFJfDuk6WWsa+rA+p5E+uFnTQ/O/k7lbktQxqyfJ36YBSN8UIzWJDxxnoPrbRHZC

点击中间区域
呼出菜单
上一章
目录
下一章
×