MATLAB神经网络30例最新章节_杨杰著

2.1 理论基础

神经网络经过几十年的长足发展，已经遍及各个行业，几乎已经达到泛滥的地步，但神经网络不是万能钥匙，为了使神经网络具有很好的泛化能力，它的使用必须遵守以下3个原则。

（1）输入与输出样本存在某种特定的函数关系。

（2）输入与输出样本间的函数关系是一种平滑的数学映射。

（3）样本数量充足，包含给定仿真系统的基本特征。

但在实际使用过程中，常常存在如下的问题。

（1）输入的维数过高，一方面导致神经网络的收敛时间呈指数级数增长，甚至不收敛的情况，即所谓的维数灾难；另一方面大量的输入变量对输出事实上影响极小，甚至可以不考虑，造成了大量的运算浪费。

（2）输入变量之间常常相关性很强，也会导致出现输入维数增加的情况。

针对以上情况，主成分分析神经网络应运而生，其作用体现在两个方面。第一，去相关性；第二，减少无关变量的影响，对神经网络而言则体现为降维，进而大大地减少计算量。

2.1.1 主成分分析的原理

主成分分析（Principle Components Analysis，简称PCA）是统计学中的一个概念，由Pearson 于 1901 年提出，并由 Hotelling 在 1933 年完善，它主要是把分散在一组变量上的信息集中到某几个综合指标（也就是说主成分）上，每个主成分都是原始变量的线性组合，主成分之间互为正交关系，继而可以缩减多变量时间序列的维数，去除冗余信息，减少包含在多变量时间序列中的部分噪声，并且可以反映不同变量之间的相关性。当样本数据维数较多和结构复杂的时候，采用主成分分析的方法可以简化输入样本，减少训练时间，提高训练的效率，达到提高神经网络泛化能力的目的。

常用的多变量数据分析方法有如下4种：主成分分析方法、因素分析方法、多维尺度变换方法和聚类分析方法。比较其他方法而言，目前主成分分析方法是特征抽取中最为经典和广泛使用的方法。自从1990年首次将主成分分析方法应用于人脸辨识，到现在主成分分析己经广泛应用于过程监控、故障诊断、多变量统计过程控制、减少神经网络的维数等领域中了。它的基本思想是针对复杂的系统问题，首先利用主成分分析对多变量参数矩阵进行处理，主成分分析的实质是n维空间的坐标旋转，并不改变样本数据结构，得到的主成分是原变量的线形组合且两两不相关，能够最大程度地反映原变量所包含的信息。在以一定标准选取前m个较重要的主成分之后，原来的多维问题就得以简化。以精简过的参数矩阵作为神经网络的输入量，在训练样本数并未减少的基础上，消除了网络输入间的相关性，减少了网络的输入数，简化了网络结构，从整体上提高了网络的性能。

1．主成分分析的数学模型

设有p个指标组成的p维随机向量：

得到的综合指标为：

其中，对于k=1,…,p，有：

y1是线性组合中方差最大的，其他变量的方差按序号依次递减，且都互不相关。设λ ₁ ≥λ ₂ ≥…≥λ _p 是协方差阵 D (X)的特征值，则第k个主成分的贡献率为：

前m个主成分的累计贡献率越大，数据的信息损失就越小。通常m所取值标准时使得累积贡献率达到80％以上。

2．主成分分析计算步骤

（1）数据标准化。

设有一样本集，含有p个变量、n个样本和t个连续目标量。样本集用自变量矩阵X(n×p)和目标矩阵Y ( n× t)表示。

标准化后的自变量为：

式中，是原始矩阵X ⁰ 中变量X _ij 经标准化的第i个样本的第j个变量的数据；、分别是第j个变量的算术平均值和标准（偏）差。

（2）计算标准化自变量矩阵X的协方差矩阵R。

（3）计算协方差矩阵R的特征值矩阵L和特征向量矩阵A。

RA=AL

（4）根据特征值矩阵L和特征向量矩阵A计算变量的主成分贡献率及累计贡献率。

（5）选择主成分代替原始样本数据。

3．主成分分析的意义

（1）对于主成分Y=XA，Y的各列一定是正交的，且各列的平方和即为对应的特征值，这就做到了最大程度的去相关性。

（2）Y各列的均值为0，方差为所对应的特征值，便于对数据进行统计分析，而且有利于神经网络的数据预处理。

（3）特征值矩阵L的所有特征值一定是正实数，特征向量矩阵A一定是单位正交矩阵，即A ^T A=I，有利于数学公式的推导，也从根据上保证了主成分分析方法的正确性。

2.1.2 主元神经网络与股票预测

随着市场经济的发展，股票应运而生，同时股票的发行与交易也为市场经济的发展提供了必要的推动力。依据调查详细准确的资料和股市中的一些信息来对股票的发展做出预测，这就叫股票预测，它是经济预测的一个分支，它主要是预测股票的发展趋势，依据是股票的历史数据和规律，同时结合科学有效的方法。股票预测不但是经济预测研究中一个备受欢迎的研究课题，而且是广大股民在投资中减少风险的一个很好依据。

对于具有高收益与高风险双重特点的股票投资，股民们也努力研究其内在的规律，因此也诞生了形形色色的股票预测方法，如移动平均线法、点数图形法、K 线图法等。由于影响股票市场的因素太多，并且这些因素又具有不确定性的特点，所以股票预测系统就显得尤为复杂。另外，股票价格非线性的变化，股票预测信息量的庞大，这些都决定了股票预测算法上的复杂，也正是由于这些复杂的因素，致使在众多传统的股市预测中很难达到理想的效果。

近年来，随着人工智能技术的快速发展，再加上计算机的辅助，给股票的预测提供了很多新的方法，而能够依据数据本身的内在联系建模，具有良好的非线性逼近能力和对杂乱信息的综合处理能力的神经网络凭着具有高效的智能信息处理技术，已经取得了显著的成就，如在信号处理方面、在模式识别的控制方面等，并且得到了广泛的应用。神经网络具有自学习和自适应等特性，并且又具有很强的非线性逼近能力，所以它不用建立复杂的非线性系统的显含关系和数学模型就可以避免许多人为因素的影响，也可以克服传统定量预测方法的许多局限及面临的困难。因此，用人工神经网络来预测股票，在建立合理性和适用性的预测模型中具有独特的优势，将为解决股票这种非线性系统的预测提供有效的方法。

主成分神经网络如图2-1所示。

图2-1 主成分神经网络

基于上述分析，我们建立如图2-1所示的股票预测系统。

（1）股票预测指标体系。共包括8个指标，即开盘x ₁ 、收盘x ₂ 、涨跌额x ₃ 、涨跌幅x ₄ 、最低x ₅ 、最高x ₆ 、成交量x ₇ 、成交金额x ₈ 。

（2）股票预测历史数据。根据股票预测指标查找股票历史数据，见表2-1。

（3）指标处理。指定性指标的识别与处理，以及所有指标的无量钢化。

（4）输入数据的预处理。对无量纲化后的指标数据进行主成分分析。

（5）BP神经网络的设计。若要预测第t天的数据，可以采用第t-n至t-1天的数据来进行递推。值得注意的是，并不是n越大预测结果就越好。因为股票市场非线性波动异常强烈，数据的关联性较弱，n值过大可能会导致“老”数据影响“新”数据。本节为了减少计算量，只选择第t-1天（经过主成分分析后）的数据作为输入，第t天的涨跌幅x4作为神经网络的输出值。

（6）网络的训练设计完成后，需要运用样本集对网络进行训练。训练时，网络的输入层为主成分分析之后的累计贡献率达到85%以上的主成分，网络的输出端为训练样本的预测值。

（7）网络的检验。网络检验的主要目的是对网络的泛华能力进行检验。网络的训练检验完成后，即网络稳定后，将各连接权值和阈值作为知识库，这时整个网络就是一个预测模型，然后用测试集对网络的泛化能力进行检验。如果预测效果不好，则需要对网络的相关参数进行调整，直到得到满意的效果为止；如果检验效果好，那么可以直接应用于预测。本节采用150组数据作为训练值，50组数据作为检验值，以验证模型的正确性。

（8）结果分析。如果网络检验效果好，那么网络可以用于预测，可以将预测指标按照上述处理后输入神经网络，对股票进行预测。

表2-1 上证指数历史行情（部分数据）