本章主要介绍金融数据的生产、类型、公布系统与获取渠道,金融数据挖掘的基本技术,金融数据处理与金融统计分析技术以及相关实验。具体内容包括:
(1)金融数据的生产、分类与公布系统。
(2)金融数据挖掘原理与技术方法。
(3)金融数据处理与统计分析基础。
(4)金融数据挖掘与统计分析实验。
每天我们都会通过各种传媒获得各种金融信息。互联网各大门户网站会在主页上发布最新的股票价格指数、外汇与黄金行情、中央银行的货币统计、国家统计局发布的物价指数等数据;公共交通工具上的移动传媒报道的财经资讯也在以数据方式传达信息;晚上收看电视频道,不时会浏览到中央、地方电视台的财经频道,数据趋势及图表不停地出现在画面上。我们每天都在接触数据,金融经济活动每时每刻都在产生数据,不管是数值型数据还是非数值型数据,都在客观记录金融经济活动的状态和结果,传递着金融经济信息,孕育着金融经济运行的趋势。数据生产、表现采用不同的格式,有显性的也有隐性的,有完整的也有零散的,既有主流信息也有杂音鼓噪。我们统计、记载数据,目的是从中找出规律或趋势,更好地作出各个层面的决策。不同的决策者关注的是不同的信息,中央银行、企业、投资者、作为消费者和储蓄者的居民个人,做出行为选择所依赖的数据信息是不同的。为此,从不同行为选择主体视角进行数据挖掘、整理、分析是必要的。
宏观金融数据(macroscopic financial data)
数据挖掘(data mining)
关联分析(relational analysis)
相关分析(correlation analysis)
回归分析(regression analysis)
判别分析(discriminatory analysis)
统计表(statistical table)
调和平均数(harmonic mean)
微观金融数据(microcosmic financial data)
金融数据挖掘(financial data mining)
描述统计分析(descriptive statistics analysis)
差异分析(variance analysis)
聚类分析(cluster analysis)
时间序列分析(time series analysis)
算术平均数(arithmetic mean)
几何平均数(geometric mean)
众数(mode)
虚拟变量(dummy variable)
中位数(median)
截尾均值(trimmed mean)
异众比率(variation ratio)
正态分布(normal distribution)
偏度系数(coefficient of skewness)
峰度系数(coefficient of kurtosis)
因子分析(factor analysis)
主成分分析(principle component analysis)
数据公布特殊标准(special data dissemination standard,SDDS)
数据公布通用系统(general data dissemination system,GDDS)