在产品智能设计过程中,通常来说所获取的各项需求知识之间是相互关联的,这种关联既可能是互补的也可能是互斥的。例如用户对空分装备配套空气净化系统的要求“净化效率高,机械杂质滤除效果好”,对空气压缩机要求“具备一定的抗微小机械杂质撞击能力”,具有一定的互补性;而“运行可靠、流程先进、操作方便、设备配置合理、安全低耗、设备总成本低廉”则具有某种互斥性。因此在产品智能设计过程中需要对这些需求知识进行分析和约简处理。基于粗糙集理论的需求知识分析适合处理以数据表形式表示的知识,因此可提取需求知识本体中的属性并转化成数据表形式的需求知识表达系统,以实现数据约简、属性权值计算、需求案例分类等任务,从而达到需求知识分析的目的。在产品智能重组设计过程中,尽量将信息系统中相关度和重要性程度较高的产品设计需求知识进行优先处理。
粗糙集理论作为一种研究模糊的不完整、不确定、不一致等各种不完备知识的表达、学习、归纳的数学理论方法,具有完全由数据驱动、不需要人为假设的优点,更具客观性。它能在保持知识库分类能力不变的条件下,通过属性约简,剔除冗余信息,导出问题分类和决策规则,无须提供问题所需处理的数据集合之外的任何先验信息或附加信息,仅根据观测数据本身来删除冗余信息,比较知识的粗糙度、知识属性间的依赖性与重要性,抽取分类规则,易于掌握和使用。粗糙集不仅为信息科学和认知科学提供了新的科学逻辑和研究方法,而且为信息知识分析与处理提供了有效的技术,已经在人工智能、知识获取分析与数据挖掘、模式识别与分类、故障监测等方面得到了较为成功的应用。
粗糙集作为描述不完整和不确定性知识的工具,其研究的对象或环境是信息与知识表达系统,通过引入下近似(lower approximation)和上近似(upper approximation)概念来表示知识的不确定性。下近似是指所有对象元素都肯定被包含;上近似是指所有对象可能被包含。通过引入约简和核概念进行知识的分析与处理等计算,简化信息知识中的冗余属性和属性值,进行知识库的约简,提取有用的特征信息。约简就是用对象的部分知识属性取代全体属性,从大量数据中求取最小不变集合,以简化对对象的研究。对于不能进行约简的知识属性,我们称之为“核”。粗糙集中对于系统、上近似、下近似以及约简与核概念的数学定义分别如下。
粗糙集将研究对象抽象为一个信息系统或知识表达系统,可用信息表表示,而信息表又可由四元组来表示,即
式中: U ——论域,是一个有限非空集合,是知识系统中研究对象的集合。研究对象即知识表中的元组或者记录。 U 是知识表中所有元组的集合,可以用 U ={ x 1 , x 2 ,…, x n }表示。
A ——知识属性集,是一个有限非空集合,用于刻画对象的性质,可用 A ={ a 1 , a 2 ,…, a m }表示。
V ——知识属性值集,是一个有限非空集合,可用 V ={ v 1 , v 2 ,…, v m }表示,其中 v i 是知识属性 a i 的值域。
f ——知识函数,即
其中, f ( x i , a j )是元组 x i 在知识属性 a j 处的取值。
设 U 是对象集, R 是 U 上的等价关系,则称( U , R )为近似空间,由( U , R )产生的等价类为
式中:
(
X
)——
X
的下近似;
(
X
)——
X
的上近似。
若
(
X
)=
(
X
),则称
X
为可定义集合;否则,称
X
为粗糙集,如图2.4所示。
图2.4 粗糙集概念示意图
定义 给定一个知识表达系统 S =< U , A , V , f >,有知识属性集 A' , A' ⊂ A 且 U / A = U / A' ,并且不存在一个知识属性集 A″ , A″ ⊂ A' 且 U / A″ = U / A' ,则称 A' 为 A 的一个约简。知识表达系统可有 m 个约简: A' , A″ ,…, A ( m ) ,所有约简的交集 C = A' ∩ A″ ∩…∩ A ( m ) ,其中 C 称为 A 的核。
产品智能设计中,产品需求知识的各个属性对于满足用户需求的重要程度是不同的,而且各属性之间存在相互依赖的约束关系。因此需要在需求知识约简和核概念的基础上进行产品设计需求知识的相关性计算,以此来分析产品多个需求知识的依赖度和重要度,更好地指导产品智能设计的进程。
在产品智能设计中,对于给定的需求知识表达系统 S =< U , A , V , f >, A = T ∪ J , T ∩ J =Ø,且 T 为需求知识条件属性集, J 为决策属性集,决策属性 J 对条件属性 T 的依赖度(或者可以称为条件属性 T 对决策属性 J 的支持度)可定义为
式中:Base——集合的基数,即集合包含的元素个数。
上式称 J 在 g 程度上依赖于 T ,记为 T ⇒ g J ,其中
式中, T _( X )——需求知识条件属性集的子集。
g <1表示决策属性集 J 中的部分属性值由条件属性集 T 中的属性值决定,则称决策属性集 J 局部(在 g 程度上)依赖于条件属性集 T ; g =1表示决策属性集 J 中的所有属性值都由条件属性集 T 中的属性值决定,则称决策属性集 J 完全依赖于条件属性集 T 。
因此,可对需求知识的粗糙度进行如下描述:
式中: R T J ——需求知识的粗糙度,其值体现了需求知识条件属性集 T 对于决策属性集 J 分类的近似程度。
需求知识属性
T
i
的重要度
可以用从需求知识条件属性集合
T
中去掉某个属性
T
i
时,
T
的决策属性集
J
正域所受到影响的程度来表示,即
对于知识系统中各需求知识的重要性程度的计算,可以通过引入各需求知识
R
i
针对论域或对象集
U
的不可分辨关系
U
|
R
i
(
i
∈(1,
n
)),求出对象集
U
相对于需求知识集
R
的等价关系
U
|Ind(
P
)及相对正域Pos
P
(
S
),依次省略各个需求知识
R
i
(
i
∈(1,
n
))后,列出
U
针对剩余各需求知识的不可分辨关系
U
|Ind(
P
-
R
i
)(
i
∈(1,
n
)),依次计算省略各需求知识后的相对正域
(
S
)(
i
∈(1,
n
)),根据相对正域的变化及式(2.9)得到需求知识系统中各需求知识的重要性程度
g
的计算式:
其中
产品需求知识的条件属性对于决策属性的重要性程度越高,则认为两者的相关程度越强。在产品智能设计过程中,应尽量将需求知识系统中相关度和重要性程度较高的产品需求知识进行优先处理。