图思维方式是一种典型的高维思维方式,这是相对于低维思维方式而言的。
在日常生活中,我们经常会说某些人一根筋,在英文语境中有Tunnel Vision(隧道式眼界)一词,表达的是同一个意思,即非常浅层、狭窄的思维模式,用数学(图论)语言来描述就叫作一跳思维(1-Hop Thinking)。所谓一跳思维,指的是只能往前推演一步。显然,生活中只有一跳思维的大有人在。比如在工作中,有人做事情只考虑眼前的一步如何走,完全不管后续的事情和可能的发展;在社会治理、国际政治关系中,体现这种一跳思维的事件更是不胜枚举。
人类到底是如何思考的呢?这是一个没有标准答案(或者说很难形成共识)的问题。有人会说大多数人是线性思考的,也有人说是非线性思考的,还有人说是聚焦型思考或发散型思考的,抑或两者、多者兼而有之。
如果我们把这个问题提炼成一个数学问题,并用数学语言来描述,可以说,人类在本质上是用图的方式(网络的方式)来思考的。
每个人的思维能力、思维方式皆不同,区别在于思考的模式与效率大相径庭。普通人只能考虑到一步或者极为浅显的层次;而智者则可以融会贯通,在思考的深度与广度上形成一张更大的网络,无远弗届。所谓“无远弗届”,指的是思绪触达的地方再远都可以,这其实是一种多跳式和超深度的关联、遍历、搜索、过滤、剪枝的能力。
比如,我们在小说中经常看到神机妙算的军师给出征的将军一系列锦囊,并嘱咐他走到某一步的时候就打开某个锦囊,告诉他如何处理危机,下一步又该何去何从,这就是非常典型的最优路径规划问题—在每个关键节点选择一条路径继续游走,从而获得最优解。
我们身处的这个世界是高维的、关联的、不断延展的,我们每时每刻接触的所有信息都自动在大脑中存储为实体(人、事、物)、关系(如何连接、动作方向)与属性(描述、特征、标签)。
人脑很像是一台设计精密的计算机,当我们需要从中抽取一条信息、一个知识点的时候,可以快速地定位并获取它。而当我们进行思维发散的时候,会从一个知识点或多个知识点出发,沿着知识点之间关联的路径和网络进行遍历、搜索,抽丝剥茧,得到一条条路径或一张张小网,形成相互交织的信息网络。早在20世纪40年代,社交网络的概念还没有被发明之前,研究人员就已经试图用图网络模型来描述和解释大脑的运作机制。尽管我们并不完全了解大脑这台超精密仪器的工作原理,但是用图网络的方式来解释让我们离真相越来越近,如图1-1所示。
图1-1 用复杂图网络的模型来解释大脑运作机制
当我们需要对一个知识点进行详细描述的时候,可以赋予它很多属性,知识点之间的关联关系同样也可以带有属性,通过这些属性可以加深对每一个知识点、每一个关系的理解。
例如,我们从小到大填过很多家庭关系表,包括各家庭成员以及他们的籍贯、年龄、性别、单位、联系方式、教育程度等。我们填这些表的时候,就是在调用一张“家庭关系图谱”,主要节点有爸爸张三、妈妈李四、哥哥张小五、姐姐张小六,每个节点都有一些属性,如年龄、联系方式,当然还有一个节点就是自己—张小七(小七也有自己的属性),代表自己的节点会指向所有近亲,关系名称为爸爸、妈妈……显然,这张图能够以一种迭代的方式延展,如果聚焦在爸爸节点上,他的近亲关联图谱又包含他的父母和兄弟姐妹,以此类推。
这些实体(点)与关系(边)所组成的网络,我们称为图(Graph)。当图中的点、边带有一些属性时,则为属性图(Property Graph),属性可以帮助我们筛选、过滤信息,或进行聚合及传导计算。
带有属性的图可以用来表达并且完全还原世间的一切事物与现象,无论它们当中所包含的实体是关联的还是离散的。当实体互相关联的时候,它们形成一张网络;而当它们离散的时候,就是罗列这些实体的一张表,像是关系型数据库表中的一行行数据。从底层存储技术的视角来看,关系型数据库(数仓)善于罗列离散、割裂的数据,用它来表达网络化、关联化的数据,则十分困难,或者说效率会变得非常低下。随着查询的复杂度增加、深度增加、灵活性增强,关系型数据库愈发显得力有不逮。究其根本,是受其架构本身的低维性所限。让低维的关系型数据库来表达高维的图是极其困难的,通常事倍而功半甚至无功而返。而图是高维的,高维可以向下兼容来表达低维空间的内容,反之则不成立。在第3章中,我们会具体分析为什么关系型数据库在处理一些复杂的场景时存在效率问题。
图的这种表达方式和人类的大脑神经元网络存储与认知事物有极大的相通性。我们总是不断地关联,发散,再关联,再发散,当我们需要定位并搜索某个人或事物的时候,找到它通常不意味着搜索的结束,而是一连串搜索的开始。当我们进行举一反三式的思维发散时,就相当于在图或网络上进行某种实时过滤,抑或动态甚至深度遍历与搜索。当一个智者在旁征博引的时候,其思绪等于从一张图跳到另一张图,其脑中存储了很多张图,这些图或联动或互动,根据需要随时来为他提供服务。反之,前文提及的一根筋式思维的人是不具备这种能力的,也正因如此,他们所从事的工作大都是极为简单的。试想,如果将这样的人放在重要的岗位上,对于他所处的集体恐怕会带来灾难性的后果。
举个例子,脑海中想你最喜欢的一道菜—红烧肉。你是怎么想到它的?如果按照现代网络的搜索引擎技术,先输入“红”,推荐出“烧”,再输入“肉”,这时得到包含“红烧肉”的推荐列表—或许人类的大脑并不是严格意义上用这种倒排索引的搜索技术,但这并不重要,因为定位到“红烧肉”只是我们的起点,在图思维方式中,如何延展到后续的诸多节点才是关键。
从红烧肉开始,你或许会想到湖南红烧肉、东坡肉、苏东坡、宋词、李清照、靖康之耻、岳飞、文天祥、崖山之战、忽必烈、成吉思汗、蒙古西征……如图1-2所示。所谓举一反三、旁征博引,大抵如此。
图1-2 从东坡肉到巴格达之围的局部关联路径
当我们的思绪定位到某一个知识点的时候,只要我们愿意,就可以继续一步步地关联下去—从红烧肉到湖南红烧肉是一个细化分类的1步关联操作,从湖南红烧肉关联到名人苏东坡是我们沿着知识图谱继续发散的2步关联操作。以此类推,上面的例子中一连串的“旁征博引”实际上是一个在图数据库(或知识图谱)中不断遍历和关联深达12步的过程。
举一个更简单的例子,记得2000年笔者在硅谷的时候,某天听到广播电台的主持人在谈论“蝴蝶效应”,特别是他们想知道牛顿和成吉思汗之间是否有关系。如今,我们借助图数据库(存储和计算能力)和知识图谱(可视化和可解释性)进行查询时,可以清晰地看到他们之间跨越了东西方400年的一张关联图谱,如图1-3所示。
图1-3 成吉思汗与牛顿之间的关联图谱
我们学到的每一个知识都不是孤立的,不断增加的知识点编织成一个巨大的知识网络,我们可以随时从中提炼、总结、组织、扩展、推导、关联。人类历史上,所有智者、文豪、天才每一次惊世骇俗的灵光乍现,或者路人甲乙平常至极的循规蹈矩,都是在实践图的思维。灵光乍现是因为在图思维的道路上延展得深、广、快,循规蹈矩则是在图上走得太浅、太窄、太容易被看懂、太容易出纰漏、太容易形成共识和被预测,进而会被定义为缺乏创新。
从本质上来看,每一个知识网络都是一张图,每一个博古通今的人的脑子里面都装满了图,并善于利用图去思考、发散、归纳总结、融会贯通。如果一张图不能解决问题,那就再加一张!