随着计算机技术特别是通信技术的发展,信息共享的需求越来越显得急迫,数据量的增大也使信息资源管理成为突出而复杂的问题,这就需要更简单有效的方法来管理和维护数据,而用户则需要用更快更便捷的方法来找到自己所需的资源,而元数据的出现为解决这个问题提供了有效的管理和应用手段,逐渐成为数字信息时代最重要的工具之一。
目前关于元数据(Meta Data)尚没有统一标准的定义,一般认为元数据是“描述数据的数据”,是关于数据的组织、数据地址及其关系的信息。简单地,元数据对于数据来说,类似一个人的名片,或是一张图书馆藏书的卡片,用于资料的整理、查找、存取、集成、转换和传送。以截止阀为例,其相应的元数据描述如图2-1所示。
图2-1 截止阀及相应的元数据
元数据具有标准统一的格式,用规范的方式对数据的模式特征进行描述,可以通过一个模型结构,用标准的数据元素来表达通用的信息。元数据具有平台独立性、通用性,其自身不受技术平台的影响,可以在不同平台之间进行移植。元数据是生成其他数据模型的基础,可以生成其他数据模型或代码信息,并为系统提供统一的可读的系统模型,使系统在运行时可以使那些实体对象通过元数据模型来了解其本身的特征、结构、地位及与其他对象之间的关系等。这样就可以从一个全新的角度来理解、设计和开发系统。
元数据是有系统、有次序的结构性数据,它本身具有很强的逻辑结构,一般的元数据都是有层次的树状结构。为能够对信息资源进行准确和高效的描述,元数据在描述信息资源的时候一般分为三个层次。
一是对信息资源基本内容的描述,包括信息资源的标题、摘要、关键字等基本信息。标题就是信息资源的名字,通过标题使用者能够初步掌握信息资源的基本范围。摘要则表达了信息资源的基本内容,用户可以通过摘要掌握此信息资源的主要内容,便于判断是否是自己所需要的信息。而关键字则为信息的检索提供了方便。这些都为用户对资源的选择提供了重要依据。
二是对信息资源的获取方式进行描述,如信息资源的分发者信息、信息资源的获取地址信息等,通过这些信息,使用者可以很方便地获取所需要的信息资源,还可以直接联系信息资源分发者来获取信息。
三是描述元数据的维护信息,包括元数据的标识、元数据的维护方、元数据的创建日期与更新日期、更新频率等。这些信息主要作用于对元数据的管理与维护,提高元数据的管理和维护效率。同时,使用者也可以通过元数据的更新日期、更新频率等信息判断元数据与信息资源的一致性程度,进而间接判断信息资源的适用性。
在 PDM 系统中,产品相关信息由不同的主记录和各种不同的文件组成。主记录是描述对象的属性,如文件主记录、图纸主记录、模型主记录和零部件主记录等。主记录与文件之间可以通过元数据进行关联,因此,元数据是 PDM 中用来管理数据的数据,如描述图纸特性的图号、图名、比例、图纸存放路径等。每一项元数据对应 PDM 系统中的一个属性项,元数据(属性项)的集合就构成了属性集。对零部件和文件的分类、编码、查询就是对其元数据的管理,例如,当设计的零部件模型里有材料这个属性,需要查询材料是45号钢的零部件时,通过PDM系统就可以搜索出所有材料是45号钢的零部件。另外,元数据与主记录之间往往也存在必要的冗余,这样就能够在主记录与文件之间建立联系。
如图2-2所示描述了主记录、元数据、文件之间的关系。主记录定义了零件号、中文名称、零件版本、材料、重量等重要属性。元数据除位置地址这个属性外,其他的属性跟主记录的属性是一样的。主记录与元数据通过零件号这个唯一识别码建立联系,元数据位置地址存放指向物理数据的引用指针,这样主记录根据元数据与文件建立联系。
图2-2 元数据、主记录、文件之间的关系
电子仓库是指在PDM系统中实现特定存储机制的元数据库及其管理系统,是PDM系统中最基本、最核心的功能部件,它保存所有与产品相关的物理数据和文件的元数据,以及指向物理数据和文件的指针,该指针指定存放物理数据的数据库记录和存放物理文件的文件系统与目录,如图2-3所示,PDM系统建立元数据与物理数据的联系,并将这种联系与数据保存在电子仓库中,从而达到快速检索与节省存储空间的目的。
图2-3 电子仓库、元数据库与文件系统的基本关系
电子仓库是实现 PDM 系统其他相关功能的基础,其提供的主要数据操作功能包括:对象的检入、检出、传送、改变对象的属主或受者关系、按照对象属性来进行检索、对象静动态浏览和导航、对象的安全控制与管理,以及电子仓库的创建、删除、修改等。而这些操作屏蔽了对象存储的实际物理位置,也就是说,用户在进行操作时,不必关心文件实际存储的物理位置与数据信息传递过程,只需要与电子仓库进行交互即可。
电子仓库的工作原理可做如下描述:当文件存入时,首先在元数据库中产生一条记录,用以记录这个文件描述信息,然后把这个文件存入到专用存储区中,再把文件的地址指针存入记录。当用户需要获取该文件对象的备份时,PDM先到元数据库中找到整个文件的记录,然后根据记录中的地址指针找到这个文件,复制或检出到用户空间,并且更改这个文件的状态标志。每当进行这些操作时,PDM都要对用户的操作权限进行检验。PDM根据用户的操作权限和被操作文件的状态对文件进行管理。
PDM系统为保证系统中共享数据的安全性、正确性和一致性,用户在存取数据时都要通过电子仓库的注册、签出与签入操作以及相应权限的检验,并把文件的状态标记为签入或修改,如图2-4所示。
图2-4 电子仓库的作用
指当用户将自己工作区中新生成的文件存放到电子仓库时,系统根据内定的命名规则为此文件命名,然后把这个文件存放到电子仓库中。这时,在元数据库中产生一条记录,记录此文件的文件名或文件标识号作为关键字,以及文件的地址指针,并把文件的操作状态标记为签入。与此同时,PDM系统把用户工作区中的源文件删除,以确保电子仓库中的文件完全处于电子仓库的控制之下。
此操作指将电子仓库中的文件信息签出到用户工作区进行修改。此操作根据文件名,先到元数据库中找到这个文件的地址指针,然后根据该指针找到这个文件,复制这个文件到用户工作区中,再到元数据库中把这个文件的操作状态标记为“修改”。当用户需要修改电子仓库中的对象时,必须将文件对象从电子仓库中签出,放入个人工作区中进行修改。与此同时,电子仓库对该对象加锁,其他用户只能浏览对象的内容而不能进行其他操作。
签入操作实现的是将用户工作区的私有信息放入电子仓库。修改后的对象存放到电子仓库中并不覆盖原有的对象,而作为这个对象新的版本存入电子仓库中。签入操作根据文件名,先到元数据库中找到这个文件的记录,比较这个文件的版本状态,把这个文件的操作标记为“签入”,然后把这个新文件存入,把此文件的地址指针存入数据库中记录,用户工作区已修改的文件也即被删除。
这里有以下几点说明:
① 只有电子仓库的属主或被授权的用户才能对电子仓库进行相应的操作。
② 只有对电子仓库有签入权限的用户才可以将个人工作区的对象签入到电子仓库中。并且对象如果被签入到电子仓库,它就属于该电子仓库的属主所有,与原来的用户脱离属主关系,对该对象的访问权限的管理完全由新属主负责。
③ 一般用户在权限许可下才能对电子仓库中对象的内容浏览,但不能进行修改。只有对该电子仓库具有修改权限的用户,才能对电子仓库中的对象进行修改。
④ 电子仓库的专用存储区是由电子仓库控制管理的。电子仓库从操作系统接管了对这部分存储区的控制,从操作系统是无法看到这个存储区域的,因此用户、应用程序和操作系统无法知道文件的具体位置。所有存储在专用存储区中的文件不通过 PDM 系统的控制管理是无法被取用的。另外,在电子仓库内同一个文件只有一份,经过修改的同名文件用版本号来区别。这样就保证了所有用户所进行的任何修改信息不会流失,从而保证了数据的完整性。
在PDM系统中,电子仓库是建立系统底层服务的关键,如图2-5所示。电子仓库是服务器为文件的存储专门设置的区域,一般由管理程序、数据库管理系统和专用存储区组成。电子仓库一般建立在关系数据库基础上,主要保证数据的安全性和完整性,并支持查询和检索功能,它连接数据库和文件系统,通过建立在数据库之上的数据指针,建立不同类型产品数据之间的关系,实现文件的层次和关系控制,并通过面向对象的数据组织方式提供快速有效的信息访问,实现信息透明、过程透明。
图2-5 电子仓库提供PDM底层服务
目前PDM系统的电子仓库类型有集中式、分布式和虚拟式三种。
集中式电子仓库将物理数据集中于中心服务器上来进行管理。元数据管理库、数据记录管理库与存放物理文件的文件系统和目录位于同一台服务器上,用户通过远程登录来获取数据,其体系结构如图2-6所示。其优点是保证了数据的唯一性和安全性,缺点是由于网上用户都需要远程登录来获取数据,因此速度慢、效率低。
图2-6 集中式电子仓库体系结构
分布式电子仓库具有介于分布式文件系统与电子资料库之间的特点。同一个电子仓库可以对应多个分布在不同计算机上的文件系统和目录,不同电子仓库之间元数据共享,做到分布式环境中电子仓库与电子仓库之间,以及电子仓库与用户之间直接进行数据操作,无须进行远程登录,其体系结构如图2-7所示。
图2-7 分布式电子仓库体系结构
是在分布式电子仓库的基础上,不仅文件系统是分布的,而且元数据库与物理数据库也是分布的,即只有一个面向全企业的虚拟电子仓库,而实际元数据分布在多个物理电子仓库中,其体系结构如图2-8所示。虚拟的元数据管理与分布式文件管理的实现,使得用户能访问全企业的产品信息,而不用考虑用户或数据的物理位置。
图2-8 虚拟式电子仓库体系结构
从技术上来说,集中式电子仓库管理方法的实现技术相对简单,可以较好地保证数据的唯一性,适合于需求相对简单的中小型企业。但对于企业某个部门来说,其常用的数据一般在一定范围之内,这时就可以考虑按照数据来源或者部门需求,分别建立不同物理位置上的文件系统和目录,以分布式电子仓库来代替集中式电子仓库,实现数据就地存取或就近存取,同时又可很方便地实现数据共享。虚拟式电子仓库的技术实现,随着企业规模不断扩大,异地办公的情况越来越多,而且企业之间协作也不断加强,这时就可以考虑采取虚拟式电子仓库解决方案,实现数据跨企业系统集成和异地协同。
总的来说,电子仓库的作用就是把各种文件存放在专用存储区中或从专用存储区中取出文件,并在存取过程中由“管理程序”产生这些文件的元数据。其中,元数据是管理数据的数据,用于资料的整理、查找、存取、继承、转换和传送。PDM通过建立元数据与物理数据的联系,并将这种联系与元数据保存在电子仓库中,从而达到快速检索与节省存储空间的目的。从中可以看出,电子仓库与元数据之间的关系就像图书馆和图书目录的关系,有了图书目录,读者才能更简捷、更清楚地查找所需要的图书,而且,图书管理员通过图书目录也能更方便地管理图书。电子仓库的成功操作和使用很大程度上依赖于海量元数据的有效管理,元数据贯穿电子仓库的创建、维护和管理的各个方面,描述了与电子仓库所有相关方面的数据。
企业在生产经营过程中是依靠产品信息流动来运转的。企业的各种信息数据是以文件的形式存在的,包括工程设计与分析数据、产品模型数据、产品图形数据、专家知识与推理规则及产品的加工数据等。
文件具有不同的分类方法,可以按照文件的来源进行划分,也可以按照文件的动静态特征进行划分,或者按照文件存在的状态进行划分等。根据文件格式的不同,可以把 PDM 管理的各种文件分为五种类型。
描述产品或部件、零件性能的文件,由文字处理软件生成。
存储产品模型的设计信息和基本属性,其中包括产品或零部件的三维模型、二维图纸和装配视图、几何尺寸、视图比例、产品的材料、重量、数量、技术要求以及设计物料清单等,主要由CAD软件产生。
存储所有在图形文件中没有描述的产品数据。表格文件包括有关产品或部件、零件的产品定义信息和结构关联信息。产品定义信息包括基本属性和特征参数。结构关联信息描述了零件或组件、产品之间的隶属关系。这类数据大部分由数据库管理系统进行管理。
存储各种加工程序、管理程序和其他应用程序。
存储采用多媒体手段制作的产品信息,描述产品及产品各个部位真实形象的图像、声音和动画、对复杂装配过程的动态模拟等。这些多媒体文件生动地反映了产品性能指标、生产过程、维修指南等信息。
对于上述5种不同类型的文件,PDM系统采用两种不同的管理模式。
单个文件在PDM电子仓库中可分成以下两种方法来处理。
将文件整体看作一个对象,根据其名称、大小等描述信息,并将这些信息放到 PDM 数据库表中,文件的物理位置仍然在操作系统的目录下,由 PDM 提供管理该文件的机制。这种管理方法能够保持文件的完整性,这些文件中的数据不能与文件脱离,一旦脱离就失去了意义。文本文件、数据文件、图形文件、多媒体文件等一般打包管理。
将文件内容打散,将其内容分门别类放到数据库中,由 PDM 提供分类查询,或建立与其他数据库中对象的关联,并提供图示化的管理工具。其中的数据可以从文件中提取,这些数据都具有独立意义,可以将这些数据分门别类地放在关系数据库中,以便对文件内容进行检索和统计。与这些数据和其他属性数据一起,构成新的文件,用于分类、检索、汇总和统计。表格文件一般打散管理。
成批电子文件在PDM电子仓库有以下两种常用的数据组织方式。
将产品或项目生命周期内有关的项目、工程、产品、部件或零件的所有文件集中起来,建立一个完整的描述对象的文件目录,称为文件集或文件夹。然后,把它们放在电子文件柜中,即可查询文件集,也可查询文件集中的文件,一个文件集中可以包含各种不同类型的文件。这种方式也形象称为“文件柜”管理,例如新建车间设计项目可以划分为设备选型、平面布置、土建设计、电气布线、给排水设计、总图等几个子文件夹,分别存放对应的资料。
以产品为中心,它把产品结构映像为管理对象,每个零部件对象都包含与之相关的所有技术资料信息和审批过程。也就是说,每个对象的所有相关数据,如设计图纸、说明书、NC代码、AVI 文件、工艺文件等在产品结构树上会“挂”在相应的零件和装配体上。这种文件组织方式也称为“产品结构树”管理。
PDM的文件管理就是把上述各种文件的内容作为管理对象,文件管理的状态图如图2-9所示。其基本功能包括以下四个方面。
图2-9 文件管理的状态图
① 浏览
浏览功能可根据对象的属性方便快捷地对文件进行查询。既可以查看文件的所有属性情况,也可以利用 PDM 系统的文本编辑器打开该文件,以浏览文件的具体内容,并在权限许可的情况下直接进行修改。在有其他应用程序时,也可以浏览图形文件、多媒体文件等。
文件对象的浏览能满足 PDM 用户方便、快捷地查询并获取所需要的当前和过去的技术资料,减少并杜绝重复设计,从而可大大缩短系统产品以及新产品设计的时间。
② 圈阅与批注
除浏览功能外,用户可以利用图形覆盖技术对浏览的文件进行圈阅和批注,而不破坏原有文件的内容。一个图形文件可以被批注多次,每次批注都可以形成独立的文件,作为批注文件加以保存。批注文件时,除原始文件外,还可以查看到以前历次的批注情况。批注时可以使用文本注释,也可以使用图形圈阅。
PDM系统是按照文件对象的类型对不同文件进行分类查询和分类归档的。各类文件在系统中的存放不是杂乱无章的,而是按照文件类型有序地进行管理,其优点是既缩短了信息查询的时间,又使得相关产品信息的描述更直观、更清晰。
通过文件的版本管理,可将文件的每一次变化配置为不同的版本,建立不同版本间的对应关系,以保证在特定时间阶段对应特定有效的数据,文件的版本一般是通过与之关联的文件夹实现的。
① 权限管理
PDM系统要完成对用户的识别、对用户存取数据的权限确认工作,保证信息的完整性、安全性、正确性,要防止合法用户有意或无意地越权访问,要防止非法用户的入侵。为了防止非法访问,在操作系统目录下,所有文件都隐含了真实的文件名,然后将读、写控制权全部交给操作系统的超级用户。由系统管理员建立账号,一般用户无法找到具体所需的文件。一旦将文件交给PDM管理,那么就在PDM中生成新的只有PDM才能解释的名字,并由PDM控制读、写权限。这样即在操作系统的列表命令下,虽然文件目录中可以列出文件名,但无权限的用户也无法读、写和执行。
② 用户管理和数据共享
对系统的合法用户进行管理,包括用户自身信息的定义、修改及与用户相关的信息。其中系统的基本用户可分为超级用户和普通用户。
文件管理模块为企业宏观管理提供功能,并为所有与产品相关信息和产品生命周期内产生的全部信息提供功能。同时,各功能模块的实现,如产品结构配置管理、工作流管理等模块的实现都与文件管理密切相关,因此,文件管理模块是确保 PDM 系统其他模块顺利完成的基础。
以项目管理为例,项目主管将项目分解为若干子项目、子任务,然后进行分发,各个子项目都要经过一系列相关工作流程,随着流程的逐步推进,不断产生项目相关文件,并且伴随着版本、版次的变迁,文件的数量和种类也不断增加,这些文件包括图形文件、文本文件、数据文件、表格文件和多媒体文件等不同格式的文件。一般来说当一个工作流程结束后,在产品模型中就增加了一个新的零部件,这样,产品的结构随着项目的进展变得越来越完整,当项目结束时便得到了完整的产品数据。当流程完成后,项目阶段由工作状态转变为归档状态,此时,这个阶段所产生和处理的文件数据都要进行归档,从工作流程的角度来看,只有当所有的文件全部归档后,才意味着流程的结束,完成了该流程所描述的任务。同时,文件归档应当按照文件的不同类型进行分类归档,实现文件类型的有序管理,避免了文件组织的杂乱无章,从而使得产品信息的描述更直观、更清晰。当完成文件归档之后,产品及其所属的所有零部件、零部件的描述文件都与该项目存在联系,因此,可将项目名称或项目编号作为索引进行查询,从而提供快速、有效的信息访问,实现信息透明。
如前文所述,电子仓库处于 PDM 结构的核心位置,它连接数据库与文件系统,通过建立在数据库之上的关联指针,建立不同类型的或异构的产品数据之间的联系,实现文件的层次和联系控制,能够保证数据的安全性和完整性,并支持各种查询与检索功能。
由于 PDM 系统管理的物理文件往往是各式各样的,管理和查找起来非常困难。如果用数据库对它们进行管理,只需将文件的描述信息,如文件名、文件长度、类型、创建日期、版本、所有者及存取路径提取出来,添加到数据库表格中,就可以建立数据库表格中每一条记录与一个物理文件的连接,从而保证记录与相应物理文件的对应关系。因此,通过电子仓库可以比较方便地实现文件的分布式管理与共享,如图2-10所示。
图2-10 电子仓库与文件管理的关系
PDM系统在进行文件存入操作时,首先要通过规则约束检查,只有符合操作权限的用户才能将文件存入电子仓库中,这时文件的元数据将存入元数据库中,具体文件则放入指定的某一文件系统的相关路径中,而打散的物理数据则放入指定的数据库中。根据操作权限,用户可以通过文件对象的指针来实现相应文件的操作,PDM 系统自动到相应的表格中进行记录的修改和增加,来跟踪文件信息的变化,把文件的元数据存入元数据库中,相应的具体文件则放入指定的某一文件系统的相关路径中。通过这样的机制,PDM 系统对用户屏蔽了文件存储的实际物理位置,使得用户无须了解软件的运行路径、版本、版次,以及文件的物理位置的信息,就可以利用电子仓库来管理存储异构介质上的产品电子文件,实现产品数据的无纸传送;同时,生成的文件在存入时,首先要通过规则约束检查,只有符合操作权限的用户才能将文件存入电子仓库中;另外,这种机制还可以使用户实现文件信息的快速查询和检索,这些信息包括文件描述、作者、部门、版本号和零件与项目间的联系等,并能保证数据的一致性、完整性和安全性。