购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3.2 机器学习系统的基本结构

图2.1所示是机器学习系统的基本结构。环境向机器学习系统的学习部分提供某些信息,学习部分利用这些信息修改知识库,以提高机器学习系统执行部分完成任务的效能,执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分。

图2.1 机器学习系统的基本结构

影响机器学习系统设计的最主要因素是环境向学习部分提供的信息的质量。机器学习系统中知识库存储的知识是指导执行部分动作的一般原则,但环境向学习部分提供的信息却是各种各样的。如果信息的质量比较高,与知识库中的知识差别比较小,则学习部分比较容易处理;但如果提供的是杂乱无章的信息,则机器学习系统需要在获得足够信息之后,经过归纳总结、推理,删除不必要的细节,形成可作为指导动作的一般原则的知识后再将其存储到知识库。这样学习部分的任务就比较繁重,设计起来也较为困难,而且机器学习系统所进行的推理并不完全是可靠的,以至总结出的知识的可靠性也受到影响,需要通过执行部分来检验效果。正确的知识能使机器学习系统的效能提高,应予以保留;不正确的知识应予以修改或从数据库中删除。

知识库是影响机器学习系统设计的第二个因素。知识的表示有多种形式,例如特征向量、一阶逻辑语句、产生式规则、语义网络和框架等。这些表示形式各有特点,在选择表示形式时要兼顾以下4个方面。

(1)表达能力强,即表示形式能很容易表达有关的知识。如研究物体,可以用特征向量(颜色,形状,体积,材质)表示。例如(红,方,小,木)表示的是一个红色的小的方形木块。但用特征向量表示物体间的相互关系会比较困难,这时采用一阶逻辑语句是比较方便的。

(2)易于推理,即表示形式能使推理较为容易。例如,在判别两种表示形式是否等价时,如果采用的是特征向量则这个问题比较容易解决,而用一阶逻辑语句则要困难得多,需要较高的计算代价。

(3)容易修改知识库。机器学习系统在学习的过程中会不断修改它的知识库。因此机器学习系统的知识表示一般都采用利于修改知识库的明确、统一的形式,如特征向量、产生式规则。学习部分在修改知识库时,无论是增加还是删除知识,应对整个知识库进行检验、调整,以防产生矛盾的知识。

(4)知识易于扩展。随着机器学习系统学习能力的提高,单一的知识表示形式已经不能满足需要,一个机器学习系统有时需要使用几种知识表示形式,有时还要求机器学习系统本身能构造出新的表示形式,以适应外界信息不断变化。因此机器学习系统应包含如何构造表示形式的元级知识。这些元级知识可以使机器学习系统的学习能力得到极大提高,学会更加复杂的知识,不断扩大知识领域和提高执行能力,所以元级知识也可以被看作知识库的一部分。

需要说明的是,机器学习系统并不能凭空获得知识,因此要求其具有某些知识以能够理解环境提供的信息,对信息进行分析比较,做出假设,检验并修改这些假设,从而形成自己的知识。更确切地说,机器学习系统是对现有知识的扩展和改进。 KSD2TLdmWFj51B05jZ0JCok3qZ8oGpC6WQvG9Szj1bypoXdBpK+bmCmpKfXWVUtI

点击中间区域
呼出菜单
上一章
目录
下一章
×