内容简介:在人工智能异常火热的今天,很多人认为我们生活在一个不可思议的历史时期,人工智能和大数据可能比工业革命更能改变人的一生。然而这种说法未免言过其实,我们的生活确实可能有所改变,但并非是朝好的方面发展。我们过于武断地认为计算机搜索和处理堆积如山的数据时不会出差错,但计算机只是擅长收集、储存和搜索数据,它们没有常识或智慧,不知道数字和词语的意思,无法评估数据库中内容的相关性和有效性,它们没有区分真数据、假数据和坏数据所需的人类判断力,没有分辨有理有据和虚假伪造的统计学模型所需的人类智能。 计算机挖掘大数据风行一时,但数据挖掘是人为而非智能,也是非常艰巨、危险的人工智能形式。数据挖掘先是通过大量的数据走势、相关关系来发现让我们内心愉悦却无实践价值的模型,然后创造理论来解释这些模型。作者通过“史密斯测试”和“得州神枪手谬误”等实例说明,如果你挖掘和拷问数据的时间够长、数量够大,你总能得到自己想要的结果,然而这是相关关系却并不是因果关系,只是自我选择偏好,并没有理论基础也没有实用价值。
在人工智能异常火爆的今天,本书另辟蹊径,从反面探讨了AI研究中存在的一系列问题。开创性地提出了“得州神枪手谬误”和“史密斯测试”等来批判那些先有数据后有理论和模型的科学研究方式——数据挖掘。如今大数据、坏数据、假数据充斥着我们的生活,数据挖掘以相关关系取代了因果关系,AI到底是真的有智能还是只在服从?本书为你解答。
这本书内容可以分为人工智能和数据挖掘两部分。首先是人工智能,作者的观点是人工智能只是在某些领域很擅长,远远达不到智能的水平。仔细想想,现在的人工智能能解决的都是人类编码好的,因为人工智能工作的依据是数据库,没有数据它什么也干不了。我们只是看到它在专业领域高效的一面就以为它什么都会了,所以产生各种误解;然后是数据挖掘,近年来大数据被吹得神乎其神,仿佛只要有了数据什么问题都能解决。作者提出人工智能犯的两类常见错误:一是提出理论,然后找到符合理论的数据,把不符合的数据忽视;二是直接为数据编造理论。对于人工智能来说,数据只是数据,它没有能力分辨是否合理。综上所述,人工智能和大数据只是刚刚起步,距离实用还有很长的路要走。