购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

剑桥分析公司

剑桥分析公司(Cambridge Analytica,简称“剑桥分析”)是总部位于英国的战略传播实验室(Strategic Communications Laboratories)集团公司在美国的分公司,也是最广为人知的大数据分析公司。尽管剑桥分析是一家典型的大数据公司,其规模并不大,但由于它在2016年美国总统大选中扮演的角色,它成了同类型公司中最为臭名昭著的一家。对此事的分析与政治无关。相反,它充分证明,人类的行为可简化为计算机数据。对剑桥分析运作方式的评估基于互相冲突的证词传闻,但除非在相关文献中得到证实,否则不会进行详细介绍。

剑桥分析是一家致力于实现在线广告效益最大化的数据分析公司。它收集的数据包括种族、性别、年龄、收入、地理特征等人口统计数据,以及广告反响、生活方式、消费者信心等心理数据,含5000个数据点,覆盖2.2亿美国人。在数百万个样本中,通过在线测试收集数据,测试行为心理学家所谓的五大人格特征:开放性、尽责性、外向性、亲和性和神经质,简称OCEAN。 将所得的行为数据与社交网站的数据进行交叉引用,为仅凭社交网站数据构建用户个性蓝图提供了算法前提。换句话说,在参与性格测试的人中,亲和性高的与亲和性极低的点击模式明显不同。这项分析针对的是个体性格特征,但是它将所有五种性格特征进行了特殊组合。在分析了成千上万的测验参与者和他们的在线活动轨迹后,他们的每一次点击都可以准确地与性格特征联系起来。你不再需要通过性格测试来让公司了解你,仅浏览网页就足够了。之后,这些个性分析结果会被用来使线下数据与不同网站的Cookie连接起来,便于投放个性化的广告。

剑桥分析前首席执行官亚历山大·尼克斯(Alexander Nix)以泰德·克鲁兹(Ted Cruz)在艾奥瓦州党团会议期间的竞选活动为例,说明了数字画像是如何应用的。首先,单独划分出一个说服组,其中有45000名投票率很高的摇摆选民。 对该组选民进行分析,生成相关度最高的性格特征:责任心高于平均水平、神经质程度低、开放度低等。这一人群关注的主要问题是枪支权利。这些综合因素为成功投放广告奠定了基础。在这一目标受众中,通过剑桥分析公司预计的4000至5000个美国人个体数据点,可以将群体进一步细分到个人层面。

毫无疑问,剑桥分析拥有一套出色的媒体策略,这已不是秘密。上述解释有据可查,但没有人在意。尼克斯在公开场合描述了这一策略,并因此广受赞誉,但在特朗普当选总统之后,出现了针对该策略的一系列指控。 调查得出的总体结论,是该公司获取数据的方式是合法的,但利用数据的方式不透明,因此数据交易不合法。由于缺乏对数据获取人的适当审查,所有当事人被处以一系列罚款。 剑桥分析公司永久关闭。它从脸书获取的数据促使联邦贸易委员会(Federal Trade Commission,FTC)发起了对脸书的调查。

新闻媒体出于方便,省略了这个故事中较为乏味的部分。 剑桥分析是一家相对较小的分析公司,其运作方式与同类型的其他公司相同。选举只是它运营的广告业务的板块之一,在2016年的美国大选之前,该公司已经涉入了100多次选举。 美国军事防御机构国防高级研究计划局(Defense Advanced Research Projects Agency,DARPA)为打击恐怖主义,曾资助加拿大政治咨询和技术公司AggregateIQ(据传为剑桥分析的加拿大分部)开发Ripon软件。 国防高级研究计划局还证实了行为动力研究所(Behavioral Dynamics Institute)开发的反恐工作,该研究所采用的技术和剑桥分析采用的并无异处。 行为分析在每种情况下都是合理一致的,并不是暗中进行的,也不是剑桥分析独有的。

对于剑桥分析的指控大多没有依据,但因持续时间长,足以破坏其声誉。例如,尼克斯向英国数字、文化、媒体和体育委员会(Digital,Culture,Media and Sport Committee)提供的自愿证词是长达三个多小时的共谋指控(其中大部分是错误的),而没有提及基于行为的精准投放(behavioral microtargeting)或其影响。 虽然剑桥分析的行为在道德上是不当的,但它也不是恶意的,因为它的做法遵循了大数据分析的标准程序。

经过长时间的调查,公司的算法仍然是最高机密,大数据对选举的操纵程度几乎无法计算。不过,也许通过估算剑桥分析的经济效益,可以从整体上推算出它的业务规模。第一位采用该公司的总统竞选服务的美国候选人是参议员克鲁兹,他为此花费了580万美元 。在与剑桥分析的合作过程中,他的竞选活动取得了巨大进展。在总统竞选的最后五个月,特朗普向剑桥分析支付的款项达600万美元 。假设这些交易有利可图,剑桥分析购买所有相关数据的价格应低于项目收款额。而对脸书来说,这些数据完全微不足道。剑桥分析的丑闻是众多社交网站数据泄露事件中的一件,其中受益的第三方公司所采取的策略,不过是脸书精准投放策略在小范围内的反映

剑桥分析引发了滚雪球效应,最终导致脸书制定了针对大数据调查的政策和程序。简明扼要地重述联邦贸易委员会的文件,脸书显然通过大规模监视,将从用户行为中获利。隐私政策故意含糊不清。例如,它保护与用户界面组件的交互,但数据收集机制绕过应用平台获取设备数据。 这一机制的唯一目的,是利用用户过去的行为来影响他们未来的行为,以此最大限度地提高用户参与度。

至于政府在保护网络人权方面的作用,立法能做的只有这么多。联邦贸易委员会和脸书达成和解,脸书受到了处罚,但运作方式的核心并未改变。 执法机关要求其用户政策更加具体,尽管如此,提高用户意识可能不会带来任何改变,毕竟马克·扎克伯格(Mark Zuckerberg)在作证期间喝水的方式比证词本身更受关注。别忘了,要不是剑桥分析的运作操纵了政治,没有人会在意这些。面对大数据策略的变化速度和模糊性,立法者一次次的努力显然表明,他们几乎无法与之抗衡。

即使在丑闻爆发和有罪裁决之后,算法也未被公之于众。公众仍然看不到他们使用的平台的后台情况。如果公开这些技术,公司将不得不牺牲自己的竞争优势和声誉。然而,通过跟踪单台设备,我们可以大致了解这些服务供应商可以获得哪些数据输出。2019年的研究“关于谷歌和脸书数据保留和位置跟踪的取证云分析”,恰恰证明了普通三星Galaxy Note 5手机用户的隐私有哪些。为证明这一点,研究人员通过获取安卓操作系统的超级用户权限,从而访问三星、谷歌和脸书的内存、文件和分区加密。手机内安装脸书、谷歌应用程序以及取证软件,使用该手机两周后,结果显示,在脸书上的每一次互动、在谷歌应用程序里的几乎所有私密信息和关闭了位置服务的位置时间线,都是可检索的数据。 简而言之,几乎所有应用程序里的数据都不会受到保护。谷歌和脸书在获取此类数据的方式方面并不透明,对此,美国国会议员鲍勃·古德拉特(Bob Goodlatte)在谷歌首席执行官陈述证词时,做出了最为准确的总结:“谷歌能够收集的用户信息数量,甚至会让国家安全局脸红。”

对个人来说,所有这些都令人恐惧,但这种恐惧的思维有利于阻止它向善意的复杂集体思维发展。就伦理道德而言,基于行为的精准投放异常复杂,它会给个人隐私和自主权带来威胁。当人们开始认识到严酷的现实时,才开始会从另一个角度看待这些不利后果。即使是区块链,也不能把收集海量数据的妖怪收回魔瓶里,何况我们产生的数据量只会增加。例如,脸书总是靠数据赚钱,但如果它倒闭了,数据收集也不会就此停止。数据正在成为一种新的世界货币,一个数据管理者倒下了,还会有另一个数据管理者出现。

相应地,每个重要行业都有相当比例的低俗元素,再加上完全真实的意图。例如,大数据研究人员不会为了财富或名誉从事研究事业,但他们的成功依赖于获得外部资金的能力。对这些教授和研究人员来说,大规模的资助和获得影响力的机会,会左右他们的研究结论。 无论是个别教授还是整个公司,都在对手的压力下,朝着一个目标而努力,并渴望在对方停下来的地方继续发力。五大科技巨头将以某种形式继续占据主导地位,随着它们在未知的技术领域继续深入探索,清晰的立法边界将变得越来越模糊。

数据巨头甚至都不敢把话说清楚——它们秉承互相矛盾的基本原则。苹果不想跟用户数据扯上关系——这是个负担。 脸书相信“未来是私密的”,公司会努力确保这一愿景的实现。 谷歌打算出于利他动机使用数据,并最大化用户利益。 谁说的是对的?

前文对公司如何利用数据的概述,并不是在将这些公司妖魔化。数据的使用在全球范围内提升了效率,创造了价值,它发挥的积极作用不应被忽视。大数据创造的经济价值遍及各行各业,每个行业的价值都接近数千亿元。本书并没有详细讨论大数据对行业的好处,因为区块链解决方案并不对此造成威胁。 7C9591oq1EL2x7trA9YXVI6L9vvcpToJ6tqGwpIeBSk+eitKfmN1TpjiCrHEAQg7

点击中间区域
呼出菜单
上一章
目录
下一章
×