虚拟现实与媒介的未来最新章节_薛亮著

第二节
算法

从历史观点来说，我们可以在机械计算器、纺织生产和虚拟现实技术之间找出某些联系。雅卡尔（Joseph Marie Jacquard）是一名法国工程师，她第一次发明了可以织线的自动机器，之后，法国纺织工人勃逊（Basil Bouchon）大约于 1725 年设计的穿孔卡模式系统为之后用于美国人口普查数据制表的卡片机的发明做了巨大贡献。而何乐礼（Herman Hollerith）发明的卡片机第一次被用于 1890 年度的美国人口普查，这使得数据制表的时间仅在几个月里就可以完成，而以前却需要好几年。到了 19 世纪，机械织布机的引入对纺织生产产生了很大的影响。确切地说，大规模的工业生产模式取代了磨坊和工厂里的小规模纺织生产。而且，这些变革也改变了人们衡量与评估能力和智力的方式。

19 世纪，数学家巴贝奇和勒芙蕾丝发明了用于数学处理的机械化系统，由此改变了生产的社会模式。然而现代算法的发展却否认了巴贝奇的机械装置与电子计算机之间的直接联系。而在巴贝奇生活的时代，程序计算是文职工作的内容之一，由人工使用计算机进行操作。因此，由于其他方法也可进行此类运算，算法就不只是和数字技术或现代形式的计算机器（台式电脑、笔记本电脑和平板电脑）有关。

巴贝奇的目的是想制作一台在运算上比人类大脑更快更高效的机器，他相信人类大脑的运转和机器遵循着同样机械原理，因而也可以用机器模仿。巴贝奇从 1820 年开始，花了两年时间设计制作了差分机，它可以执行算法操作，可执行航海表和天文表所要求的运算。之后他又开始设计“分析机装置” ，并在 1871 年完成，利用了一系列的穿孔卡片，正如计算机编程的早期形态。巴贝奇关于差分机和分析机的一系列想法灵感来源于雅卡尔，就是上面提到的那位自动织布机的发明者。与现代电子计算机一样，分析机的发明目的是成为一种可执行多种不同功能的万能机器。虽然巴贝奇在分析机上投入了很多心血和时间，但他并没有制作出一个全功能机。

与此同时，他还致力于使用差分机来取代人力。在英国的许多其他城市，尤其是曼彻斯特和利兹城，工厂和磨坊都在使用人力进行工业生产。由于机械操作可以衡量与监督，很快，工厂和磨坊就开始纷纷将其应用到他们的生产当中。工人们就像机器一样，他们的工作被仔细地编程至由不同部件或阶段组成的生产系统当中。在巴贝奇的观点影响之下，人类身体的力量变得机械化，利益化或是多余化，从而不被人所重视。因此，通过机械化工序以及利用衡量与监督系统，巴贝奇想要取代人力的设想也很快就被应用于物质生产当中。在巴贝奇活着的时候，很少有人肯定他的设想和成就。但巴贝奇对于万能机器和劳力取代的设想在今天仍然至关重要。可以说，当那些在东南亚的工厂里生产着驱动虚拟环境电脑组件的劳工们对外完全隔绝时，这个过程就一直持续到了 21 世纪。

19 世纪的机械计算发明为 20 世纪电子计算机的生产铺垫了基石。但是，我们仍需要发明更多的技术，比如可以更快速执行算法的电子晶体管。随着二战后苏联太空计划的快速发展，美军开始加大研究开发的投入，尤其在计算机领域。在 20 世纪 50 年代至 60 年代冷战的背景之下，技术发展的紧迫感使得美军频繁利用大学研究项目资金进行一系列交互计算机和模拟技术的实验。与此相类似的，美国国防部高级研究计划局（APRA）是研究虚拟现实技术的主要资金来源。二战期间一位雷达技师恩格尔巴特（Douglas Engelbert）接受ARPA的资金，在加利福尼亚州的门洛帕克市为斯坦福大学建立了增强现实研究中心（ARC），其主要任务是开发计算机可视化系统。这个研究对虚拟现实发展的意义在于——表明了人机交互的可能性。的确，恩格尔巴特预料到了计算机拓展人类能力的潜力，他也一直致力于将信息搬上计算机屏幕的工作当中。在当时，他的想法可是非常激进的一种。

同样也是在 20 世纪 60 年代，来自麻省理工学院的一个名叫苏泽兰研究发明了现代电脑绘图的雏形——画板（Sketchpad）以及一个头盔式的显示设备。苏泽兰的原型图形系统是一项极具创新、振奋人心和突破式的发明，因为它显示出了电脑绘图的创新潜力。人们可以尽可能地以一种最自然的方式来创造图像，他们只需要用手、眼睛以及一支像铅笔一样的装置画出来就可以了。苏泽兰对于电脑绘图的实验是极有意义的，因为它们为现代虚拟现实技术的图像界面奠定了基础。1965 年，苏泽兰发表了一篇研究论文《终极显示》（The Ultimate Display），解释了头盔式显示设备和虚拟现实系统的实验工作。在论文里，他谈到了人类是如何通过自己身体里的感知传递能力以及对客观物体的先验知识来感知和理解这个世界。值得注意的是，苏泽兰的关注点是虚拟现实沉浸的具象方面。他的研究表明，为了建立一个有效的计算机生成环境，我们需要多感官参与，而不仅仅集中于视觉感知。据他所说，终极显示将会使用操纵杆、立体音响以及力反馈机制，以此增强沉浸式体验。但头盔式显示装置的缺点是过于笨重，戴着很不舒服。至 20 世纪 60 年代后期，苏泽兰搬到了犹他大学，经过一番改良后，第一代可操作的头盔式显示系统就此诞生。

另外一个探寻虚拟现实发展的线索与 20 世纪 60 年代致幻剂和意识选择形态的实验有关。古往今来，人类一直试图通过各种创新方式比如使用致幻植物或是参加宗教活动去探索现实。有时候，人们认为只有少数社会成员例如萨满族的巫医或神秘主义者才值得探索其他现实和人类感知。可是，在 20 世纪 60 年代，人们认为只有LSD 才能为神秘体验或灵性体验提供化学基础。美国学术界在哈佛大学和柏克莱加州大学对LSD进行了研究。这些实验和虚拟现实环境的发展之间存在着内在联系。蒂莫西·利瑞（Timothy Leary）是虚拟现实的主要拥护者。在哈佛大学任职教授时，为了接触另类现实，他用致幻剂进行实验。利瑞概括了LSD研究与个人计算发展之间的联系：“电子游戏的兴起使得年轻玩家可以亲自移动屏幕上的电子和数字信息。巧的是，许多此类电子应用的设计者和营销商都住在旧金山地区，而且都很擅长使用致幻药物。” 利瑞指出，屏幕技术比如电视、录像机和计算机在一定程度上改变了“现实”一词的含义。在此背景下，虚拟现实不是被动地通过药物产生意识的选择形态，而是“升级”为一种涉及图像和声音交互的系统。

至 20 世纪 80 年代后期以及整个 90 年代，虚拟现实技术呈现在西方和西方文化国家都享有极高的地位。在政治舞台上，前美国副总统阿尔戈尔大力支持互联网、万维网及虚拟现实的发展，声称：“我们必须确保联邦政府可以竭力刺激像虚拟现实这类创新技术和重要技术的发展。”值得注意的是，戈尔对于信息高速公路观念以及知识经济发展的宣传也和虚拟现实技术紧密相关。和戈尔不同，利瑞更靠近社会力量和威望人士，他通过和著名作家比如威廉·吉布森（William Gibson）、威廉·巴罗斯（William S. Burroughs）及美国感恩而死乐队（The Grateful Dead）前成员之一的约翰·巴洛（John Barlow）之间的情谊来宣传虚拟现实技术。利瑞在 1994 年曾言，计算机生成虚拟现实的发展极具突破性，改变了我们对于时空关系的理解。戈尔和利瑞两人的主张成为虚拟现实呈现构建及传播争论的开端，揭示了这些争论是如何在社会经济力量网络中，在文化的背景下运行。

信息时代为公众带来了前所未有的信息便利化：这使得个人产出和获取信息的能力得到指数爆炸型地提升。由此所产生的直接后果是，社会需要一种新的方式来过滤庞大的信息量，从而得到能够被人性化地理解和认知上地可处理的信息。从历史上来说，信息“守门人”的角色是被信息传递者所扮演的，比如新闻工作者，他们可以通过训练所获得的技能和经验，独立自主地分析、优先和展示一些他们认为对于受众来说最有意义和价值的信息。人类扮演信息“把关人”的这一过程往往伴随着我们所熟知并理解的把关人与受众之间的动态交流，并同样受到限制，而这是我们所持有的显性的和隐性的成见所造成的。当今易接触信息的数量之大，导致无法从认知上处理和自动地过滤所有的信息源，由于这一原因，内容提供者开始使用机械地数字化自动过滤信息技术。这里自动过滤信息的过程即算法。理解算法过滤为受众所带来信息的类型和质量与人类调解传递的信息之间的有何差别，关于受众在如何看待并接收信息时出现的三个根本性的改变如下：

●关于公共信息的内容和类型的改变；

●应用算法后，新闻议程设置的改变；

●公众和传播者在选择信息时信任关系的变化。

通过算法进行自动的、计算机驱动的处理信息，会对社会和文化产生很大影响。关于什么是算法的深层次解释，要求我们从CPU中央处理器的基本逻辑功能开始，对于技术层面进行更深层的关注，即计算机科学如何应用算术运行信息过滤的复杂体系，这类纯技术性分析不会出现在本文中。然而提供一定的基本知识来理解算法在信息处理和过滤方面却非常重要。算法所带来的更海量却流于表面的知识信息，却也恰好体现了算法框架和自动过滤系统的局限性和无助感，而且目前为止来看，我们很容易区分电脑算法过滤的信息和人工遴选的信息，这么看，算法似乎还没那么“智能”。

但真正新的智能形式正在出现。它不是某种生物，而是模拟人类大脑的产物——人工智能。目前最先进的算法是透过人工智能来展开的，能够解决问题并执行任务。这种智能形式当然与人类大有不同：它通过大数据的窗口去感知世界，拥有自己的一套逻辑。它似乎来自互联网数据领域，即国际商业机器公司（IBM）、谷歌（Google）、微软（Microsoft）、脸书（Facebook）、优步（Uber）等世界主要数据公司的研发中心。几乎每一周，我们都能听到与人工智能相关的新闻。通过新闻我们了解到，人工智能在许多领域已经超过了人类智能。这些领域包括策略游戏（2017 年，阿尔法围棋打败了世界围棋冠军柯洁）、人脸识别、各类诊断（例如医疗）、自动交通（优步 2016 年声称将推出自动驾驶汽车服务）等等。人工智能似乎遍布各大行业。这些算法基于庞大的神经网络，而神经网络正是通过模拟人类大脑神经的运作而产生的。这些算法具备和人类一样的学习能力，能够自主地去探索身边的世界。这种新智能完全是原生的，不是先天存在（没有经过文化或社会的“预先编码”）。它不仅仅是一次技术演变，而是一场革命，目前我们尚未衡量它对数字化社会产生的影响。无论如何，需要给算法一个界定了。

算法的英文“algorithm”一词来源于 9 世纪伟大的波斯数学家阿尔·花拉子密（Al Khwarizmi），其名字的拉丁文译名是Algoritmi。他的著作《积分与方程计算概要》（ The Compendious Book on Calcula tion by Completion and Balancing ）传入欧洲之后，书名被简译为《代数学》，Algebra即由此书而来。正是他将来自印度的十进制数概念传播至西方世界。正如牛津大学计算机科学家约翰·麦考密克（John MacCormick）在其著作《改变未来的九大算法》（ Nine Algo rithms that Changed the Future ）中所说的，算法不仅仅是“一本教你一步一步解决问题的秘诀”（最简单的例子就是菜谱）。这种说法随后衍生了计算机算法问题，这种算法可以用来分类、选择、连接和预测…这些算法是一套由代码（程序）构成的指令，用数据（数据或大数据）作为其“配方”的原料。这些算法背后是许多负责编程的工程师、计算机科学家以及数学家（迄今，算法首先是由人想出来的）。让这些算法生效的是它操作的数据以及记录的结果（与需要达成的目标有关），这能够启动其自主学习的能力，从而创造新的智能形式。因此，算法是被遵循一个过程或是一组规则，从而能够进行计算或者解决其他问题。

算法并不是代码，并不要求特定的程序语言，也不依赖需要处理指令的软件或是硬件。算法是一个过程，是一系列被设计好的行为，如果遵从特定的操作顺序，就能够产生意图所期望的效果。关于算法极为重要的方面是“逻辑和控制相分离的原则”，算法可以被认为是逻辑部分的组成，即使用特定的知识来解决问题；而控制部分则根据所使用的知识，来决定问题解决的策略。换句话说，算法由两个维度构成，逻辑负责决定处理什么内容，而控制则负责如何进行处理。逻辑和控制紧密相关，逻辑是关乎范式的设定，而控制则要求持续且递增。如果程序员需要通过调整控制层面来提升算法的效率，那么就需要设计新的步骤来改变现状，然而，当前的基本逻辑范式仍需要保持原状。另一方面，如果程序员需要改变逻辑，那就意味着需要设计一种完全崭新的方式，以新的算法来解决问题。也就是说，提高效率的途径并非一次次递增，而是以一种完全新奇的方式，独辟蹊径地解决设计算法所需解决的问题。

例如谷歌网页评级系统。1995 年，拉里·佩奇和瑟格瑞·布林决定开发一个算法已解决一个流行的网络信息问题，即当评价网上搜索引擎结果时，显示结果与搜索词相关性的问题。直至那时，搜索引擎大多是用来基于网页浏览次数的分类来解决这一问题，当时广泛采用这种理念是因为其算法也基于同一逻辑，并且其控制的方法和目标是基于此逻辑不断提升搜索速度和更新搜索内容。然而佩奇和布林决定彻底改变这种算法逻辑，他们另辟蹊径地借用“学术引用”这一概念，将不同网页上推送的超链接频次作为重要性依据，由于逻辑范式的改变，从而完全改变了网页显示结果的相关性。他们改良算法而创造的PR系统一度成为全球最重要的网页搜索优化方法，在该范式下，分析每一个网页基于与其他网页链接的数量和质量，在整个网络世界中于是形成了不同等级的定位。这一范式转变的好处将会被网络使用者所认可，因为该评级算法展示出更多与用户搜索内容相关的结果。这一范式的逻辑转变为布瑞和佩奇两人带来了丰厚的收益，并开启了全球最大的科技帝国的发展。

为了理解算法在技术和应用层面是如何工作的，需要对于计算机的基本性能和局限进行简单阐述。确实，算法作为一个过程，与具体的技术应用步骤还是有所区别的，所有的计算从某种程度上来说，受限于计算机的功能和特性。根本上来说，即从中央处理器层面来说，计算机唯一能做的事情就是：轻击按钮以进行二进制的转换，并通过轻击这一行为进行赋值。本质讲，中央处理器仅仅是能够在每秒内处理十多亿次的二进制转换的转换器。这就意味着任何一种机器语言的设计都可以利用这一局限：系统语言本质上来说也就是一系列数学指令，这与基本代数学（加减乘除和指数运算等等）并无二致，这些指令的设计是为了更好更快地利用轻击以实现转换功能。这一概念对于把握算法这一概念具有重要作用：无论何时，当我们要求计算机对于某一简单问题进行回答时，对人类而言这是微不足道的小事，但这一问题却需要被转译为一系列明确的指令，这些指令需要用基本的数学公式来表示，最终使得中央处理器能够触发二进制转换。

最后需要厘清的是，本书后面所使用的“算法”这一术语，不再具体指称上述计算机二进制指令等技术性内涵，而更多是用其借代意义——是一种对于复杂的、内在关联的、需要进行大量算术处理的体系，而这一体系的目的是为了解决问题。也许算法是为了作为某一类特定的社会科技系统而产生的，它作为系统中的一分子用于提供知识或用于决策，在这一过程中，人类、系统和信息都是仅仅以数据而存在，并且彼此之间产生一种体系化的数学关联，然后根据对它们的计算和评估为它们赋值。再一次以谷歌为例：2009 年，谷歌宣布推出“私人订制”，这种新的方式能够提供个性化的搜索结果。谷歌通过针对 57 项标签的分析来量身定做出用户的搜索结果。这 57 项标签的具体特性是商业机密，其中可能包含使用位置、电脑型号、操作系统和浏览器类型等等。所以当谷歌用户输入搜索词条时，在搜索结果展示前的短短几秒内，屏幕背后的系统往往会对至少 57 项内容进行算法的分类和归纳，并于计算结果所提供的具体指令相结合，以产生最恰当的个性化搜索结果。

术语“算法”本质所带来的问题是人们无须理解算法如何进行筛选和分类信息这一复杂过程，而这与本论文尤其相关。实际上，当我们谈到算法时，古莱斯皮曾这样说过：“算法很容易被视为单一的艺术品，当大多数时候我们所感兴趣的不仅仅是它作为一种工具，而是作为很多共同产生作用的工具，有时候不同的工具适用于不同的用户，而这一过程太过于复杂以至于有时候算法的设计者都不想再去理解它们。”在理解这一问题时，人类异化地深层含义是：一般而言，算法过程在组成部分和内部从属部分上都过于复杂，以至于没有任何一个人能够对此产生全盘的和系统化的把握。这也意味着我们发现自己一而再再而三地，失去选择过滤信息的能力：第一次是将“选择权”委托给算法，第二次则是无法避免地对算法过程作为一个整体概念和系统化把握的失控。

第二节 算法

第二节
算法