购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.5 小结

数字经济也称智能经济,是工业4.0或后工业经济的本质特征,数据成为信息经济—知识经济—智慧经济的核心要素。数字经济代表一种新的经济形态,即充分发挥数字经济在生产要素配置中的优化和集成作用,将数字经济发展中的创新成果深度融合于实体经济的各个领域之中,提升实体经济的创新力和新动力,形成更广泛的以数字经济为创新驱动力和实现工具的经济发展新形态。数字经济时代是一个数据爆炸的时代。由于消费互联网、移动互联网,以及工业互联网、智能传感器日益发达,数据的获取更加简单、便利,价格也更加低廉。一瞬间,数据充斥着我们的工作与生活的方方面面。

当下的数字经济时代,我们用没完没了而又毫无意义的数据指导我们的思想和行动。我们喜欢在数据中寻找模式,并为我们所看到的模式编造一些理由。我们通常也不会注意到数据的偏差性和无关性,或者科学研究的缺陷和误导性。我们倾向于相信计算机从不犯错,认为不管我们把什么样的垃圾扔进去,计算机都会吐出绝对真理。面对丰富的数据,研究人员通常不会花费太多的时间对优质数据和垃圾进行区分,或者对合理分析和垃圾科学进行区分。更糟糕的是,我们常常不假思索地认为,我们对大量数据的处理永远不会出错。

“数据无需理论支撑”曾一度是那样的喧嚣,但这是一种非常危险的理念和信号。计算机无法区分有用数据和无用数据,无法分辨合理理论和一派胡言。数据自身也不会给出任何论断,因此我们需要寻找一套理解数据的理论。数据中隐藏的信息和知识是客观存在的,但是只有具有相关领域专业知识的人才能将它们挖掘出来。尽管所有宣传都在鼓吹大数据,但有时小数据的作用反而更加显著。无需通过搜遍堆积如山、随机获取的数据来寻找有意思的发现,采集有助于解答问题的好数据更富有成效。

计算机没有常识或智慧,它们能识别统计学模式,但无法判断所发现的模式是否有逻辑基础。当前的机器学习程序(包括那些应用深度神经网络的程序)几乎完全是在关联模式下运行的。它们由一系列观察结果驱动,致力于拟合出一个函数,就像统计学家试图用点集拟合出一条直线一样。深度神经网络为拟合函数的复杂性增加了层次,但其拟合过程仍然由原始数据驱动。被拟合的数据越来越多,拟合的精度不断提高。一种常见的建模风险是过度拟合,也就是说,模型与历史数据的契合度相当好,以至于它只能“预测”过去,而且由于数据中不可避免地存在错误,这种预测也不完美。如果我们仅仅根据过去的趋势推测未来,而不去考虑这种趋势是否有意义,那么我们的结论可能会与众所周知的真相相去甚远。

数据挖掘技术非常火热,使用数据挖掘技术来分析和回归所得到的数据被认为是一种“先进”的做法,在拟合算法上下功夫的项目和论文越来越多。这种单凭实验数据拟合本质上是统计意义上的“改进”,它与在物理意义上的改进绝不是一回事。单靠追求数值上的准确,无助于了解其物理意义。那样的计算用于探索科学原理是不可信的。

深度学习这类缺乏表示因果关系的方法,无法进行逻辑推理,依然不是放之四海而皆准的万能药,依然与我们在开放系统中需要的通用人工智能搭不上什么关系。计算机永远不会真正理解的根本事实是,合理的模型比仅仅与数据吻合的模型更加有用。人类独具的因果思维是一切科学技术的基础。

回顾历史,人工智能一直在两个极端之间徘徊,要么一切都由人工编写代码,要么一切都让机器自己学习。对人类心智的研究让我们明白一个道理:必须将注意力从统计模拟和对大数据的严重而肤浅的依赖上转移过来,从建立对世界拥有深度理解的模型开始。通往更加优秀的人工智能的大道,就是打造对世界拥有真正理解的人工智能。

我们可以得出这样的结论:能对数据进行解释的最简单的模型是最好的模型。如果找到了可用于解释数据的某种简单假定,则该假定即为数据的最好模型。当然,请牢记Golomb提出的下列观点(数学建模五不要): [32]

(1)不要相信模型就是真实事物。图1-3是对本观点最好的诠释。

(2)不要在限定范围外进行推断。

(3)不要为适应模型而歪曲事实。

(4)不要使用不可信模型。

(5)不要盲从于模型。

图1-3 柏拉图洞穴寓言 s3vGdvZZiJovw2JDrS6Q9VXFB4lBO7x5PFcVGWM2/Squ/ZisPXfcar0lOShdRwMp

点击中间区域
呼出菜单
上一章
目录
下一章
×