《今日心理学》杂志的前主编罗伯特‧爱泼斯坦接受英文大纪元《美国思想领袖》节目专访。(大纪元制图)

像谷歌和脸书这样的科技巨头公司使用哪些方法来改变用户的态度﹑信念甚至投票倾向?搜索结果的排名如何影响摇摆选民?

在我们不知道的情况下,搜索引擎算法会对我们的看法和行为产生多大的影响?为什么没有更多的人研究这些问题呢?

这是《美国思想领袖》节目﹐我是杨杰凯(Jan Jekielek)。

今天来到我们节目的是《今日心理学》杂志的前主编罗伯特‧爱泼斯坦(Robert Epstein)。他目前是美国行为研究和技术研究所的高级研究心理学家,也是搜索引擎偏见方面的最杰出的专家。

我们将探讨爱泼斯坦博士对科技巨头搜索偏见的细致研究,以及他所取得的惊人发现。我们还将了解爱泼斯坦博士的雄心勃勃的计划,即在2020年大选前的几个月监视和跟踪搜索引擎偏见。

杨杰凯:爱泼斯坦博士,很高兴您能来我们的节目。爱泼斯坦:很荣幸。

杨杰凯:爱泼斯坦博士,我认为您是数字化社交媒体和搜索引擎潜在偏见的最重要专家之一,尤其是与选举有关的偏见。能介绍下这方面的情况吗?

十二种技术可改变人们观点?

爱泼斯坦:好的。这里面大有文章,而人们普遍还未意识到。我研究大型高科技公司掌握的一些技术已超过六年半的时间,这些技术只有它们拥有。这类技术被用于改变人们的观点、思想、态度、信仰、购物和投票倾向,而人们毫无察觉,并且不会留下书面痕迹。

事实证明,它们有一整套这样的技术,这是人类历史上从未有过的。大约六年半前,我偶然发现了其中的一种,并开始在可控的实验中非常仔细地进行研究。从那时起,我发现了大约十二个这样的技术,目前正在研究其中的七个。

杨杰凯:我十分期待深入探讨其中的几种技术。首先是搜索引擎操纵效应。您最近在国会作证时说,至少有260万张选票受到影响。您是在国会宣誓的证词中说到了这一点。您能解释一下这个发现吗?

爱泼斯坦:好的,有两点。有时很难解释我们分别理解这些内容有多重要。但是其中一点涉及实验研究,我已经研究很长时间了。我有时与人们在实验室做实验,有时在网上,有时请多个国家的人进行实验。

实验:人们倾向信任搜索结果顶部内容

在这些实验中,人们被随机分配到一个或另一个小组中。因此,实验是随机的,其中至少有一个是对照组。我们使用对抗平衡的方法(counterbalancing),就是说我们会打乱顺序以确保不会得到任何所谓的顺序效应。我们的实验是双盲的,这意味着执行实验的人员,即我们的助手,和参与者都不知道假设的理论或者分配的小组的意义。

我们会采取一切可能的预防措施,以确保当我们获得结果时,能真正理解它们的含义。在2012年末,我碰巧看到一些新的研究,并不是我自己的领域(心理学),而是市场营销方面,研究搜索引擎的搜索结果对购买和点击产生的巨大影响。这项研究得出的结果是,首先,人们倾向于信任搜索结果顶部的内容而不是底部的内容。

实际上,所有点击中的50%点击的是排名最靠前的两项,它们非常受到信赖。这些新研究的结果对我来说非常有趣,例如,一项眼动跟踪研究(eye-tracking)表明,即使你将非常好的结果放在列表的低位,人们目光从上往下看,即使他们可能看到这个非常好的结果,他们的目光又会马上回到顶部。

所以我心想,好吧,无论出于何种原因(我花了数年时间来研究此中原因),如果人们信任这些排名靠前的搜索结果,会不会有人用搜索结果来改变人们对某事的观点呢?也许可以做到。甚至可能改变他们的投票倾向。

控制搜索结果顺序 约一半人的倾向被转变

因此,我进行了一个随机对照实验,观察我可以对实验对象产生什么样的改变,搜索结果的顺序由我来控制。我以为对投票倾向和观点可能会造成2%或3%的变化。不会太多,但是很多选举结果的票数都非常非常接近,所以如果我能使某些选民产生转变,我主要集中在摇摆选民,这些人易受影响。

我认为,这些人的选票可能会决定一次票数非常接近的选举的结果。我进行的第一个实验,结果是48%的人的倾向被转变了。

杨杰凯:难以置信。

爱泼斯坦:我也是这样说的。我不相信这一结果,于是我对另一组人重复了实验。结果是63%的人被转变了。一个又一个的实验,我发现搜索结果对改变人们的观点、甚至投票倾向有巨大的影响力。

我想,确实需要对此进行研究。后来我对全美50个州的2000多人进行了一项全国性研究。结果再一次证实,人们的倾向发生了巨大的转变。

但是因为这项研究规模很大,所以我也能够深入研究是否有任何人口统计学的影响。可以肯定,不同的人口群体在不同程度上受到这种操控的影响。因此,从多项研究中我们可以发现,对人们的倾向造成20%以上的转变是十分容易的。

但是,在那项大型的全国性研究中,我们发现其中一个小组的转变率达到80%。

操纵搜索结果顺序 人们还以为公正

换句话说,某些人口统计群体非常信任搜索结果。通常,人们对搜索结果的信任是因为他们信任谷歌,谷歌是世界上大多数人获得搜索结果的主要工具。也因为他们知道结果是由计算机和算法生成的,人们并不确切知道怎么算出来的,但是他们认为这一定是公正的、客观的,因为它来自计算机。

到这个时候,我们确实觉得我们有某些发现,因为我们发现了一种新的效应。我们称这些类型的影响叫效应。我们有一个新的效应,我将其命名为“搜索引擎操纵效应”,简称SEME,发音是“seem”。

这件事情的某些方面非常令人不安。第一,通常来说,人们看不到搜索结果的偏见。想像一下,真令人毛骨悚然,因为这使这种效应成为行为科学中发现的最大效应之一。从某种意义上说这是潜意识的,无论是谁,包括我自己,在查看搜索结果时都不能轻易看出是否存在任何偏见或偏爱,比如说一款狗粮或一类音乐或一位候选人。

杨杰凯:所以就是你可以操纵这些搜索结果的顺序,你知道你操纵的是什么,但是当你问实验者他们能否看出来时,他们会觉得看上去是公正的。是这个意思吗?

大选实验:人们观点发生巨大变化

爱泼斯坦:是的。在基础实验中,分成三组,参与实验的人不知道他们被随机地分成三组。在第一组中,搜索结果的排序方式对其中一个候选人有利,第二组中,排序方式相反,以便对另一个候选人有利。第三组是无序排列,也就是对照组。

在我们让这些人进行实验之前,先向他们介绍每个候选人的一些情况,然后再问他们关于每个候选人的问题。喜欢谁?信任谁?如果现在投票,会选谁?通常这时候大家大概是50/50的比例,因为我们选择的是摇摆选民。我们有多种方式确保他们是摇摆选民。

然后,我们让他们到网上搜索,他们使用的搜索引擎非常类似于谷歌,名为Kadoodle。搜索起来就像谷歌一样,可以查看搜索结果。他们可以访问搜索结果的不同页面。可以点击任何搜索结果前往页面。我们在所有实验中都使用了真实的搜索结果和真实的网页,所有这些都来自互联网。

这三组的唯一不同是搜索结果的顺序。这是唯一的区别。我们让他们搜索近15分钟并尽可能多地阅读他们想要的内容,直到他们对应该投票给谁的想法更加坚定为止。然后再次问他们所有那些问题。喜欢谁?信任谁?如果今天投票,会投给谁?

我们在一个又一个的实验中发现,人们的观点发生了巨大的变化,而且我仍在进行这些实验。这种现象我至少复制出了15次。

实际上,德国的马克斯‧普朗克(Max Planck)研究所有一个小组复制了这种效应。我在2015年《美国国家科学院院刊》上发表了有关此问题的第一篇论文,该论文已被访问或从美国国家科学院网站上下载了20多万次,这在我的职业生涯中从未听说过。所以肯定引起了人们的兴趣。

那算是一个开始。也就是研究这第一个SEME效应。所以我在做这些研究。然后2015年的一天,我接到了一个州总检察长的电话,他问我有关谷歌及搜索结果的信息,因为我刚刚发表了这方面的重要研究,他想知道谷歌是否能以某种方式操纵搜索结果,影响他在即将举行的选举中的得票情况,因为他准备连任。我解释说,是的,他们一定能做到。

然后他问,我们怎么知道他们是否在这样做?好,我们这里有很多实验研究表明,像谷歌这样的公司有能力改变观点和投票倾向。事实在那,我们的工作是完全可靠的,它遵循非常非常高的科学研究标准。

但是现在这位总检察长给我们提了问题,我们怎么知道在选举前夕,搜索结果是否有偏见呢?于是我一头扎进去研究这个问题,我们怎么查出来呢?

建立了一个监视系统

因此,在2016年,我建立了有史以来第一个回答该问题的系统。我建立了一个监视系统,你可以将其视为一种尼尔森型(Nielsen)系统。自1950年以来,尼尔森公司就开始招募家庭。这些家庭的身份保密,在他们的允许下,在每家房子里安装了一个盒子。公司追踪这些家庭的成员观看的电视节目类型。这就是著名的尼尔森评级,该评级决定投入多少广告费用,决定哪些节目继续播放,哪些节目被取消。现在全球有47个国家/地区使用,因此该评级公司拥有非常好的方法来解决这些问题。

我创建了一个类似尼尔森型的系统,在24个州有95个实地调查员。我们努力确保他们的身份保密,我们将开发的软件安装在他们的计算机上,这些软件使我们可以在这些人使用计算机的过程中进行监测。当然,这样做是得到他们许可的。

然后,我们跟踪他们在谷歌及必应(Bing)和雅虎(Yahoo)上进行与选举相关的搜索时所看到的内容。这一点很重要。我们在研究三个搜索引擎。我们观察的这组人是来自24个州的一组多元化的美国选民。然后我们收集数据。数据流每天都传输过来。

实际上,2016年5月我们收到了第一组数据。在一段时间以来,我们建立起一支由实地调查员组成的队伍。选举前大约25天,我们有一个由调查员组成的完整小组。所以,在选举前的一个月左右,我们有大量数据流开始传输进来。并且,我们保留了13,207个与选举相关的搜索以及与搜索结果链接的98,044个网页。

那么,既然我们知道这些调查员看到了什么,所以我们知道他们看到的这些搜索结果在什么位置。换句话说,我们现在有了可以让我们确定搜索结果是否存在偏见的数据。为了衡量是否有偏见,我们使用了所谓的“众包”(Crowdsourcing)。因此,我们使用了互联网上的一个群体来衡量我们捕获的网页中的偏见。我们对网页有了偏见评级之后,可以为我们保留的搜索结果中的每个搜索位置计算平均偏见。

如何知道某个网站存在偏见?

人们会问,你如何知道某个网站存在偏见?我这个领域的人是专门做这个的。我们已经做了一百年了。通常,我们会给他们一个衡量尺度。在这次的实验中,我给他们的尺度是从-5(希拉里‧克林顿)到+5(唐纳德·川普)。然后,他们查看某个网页,确定了哪儿存在偏见(如果有的话)。如果没有偏见,结果就是零。然后,由多人对每个页面进行评分,我们就有了平均偏见评分。随后,我们就能够计算搜索结果中可能存在的偏见。

我们进行的实验性工作告诉我们,像谷歌这样的公司转变人们观点和投票倾向的影响力。我们有大量来自实际选民的数据,即由24个州的95名选民组成的多元化群体。我们有很多搜索,超过13,000个以及许多网页。然后开始分析这些数据。

选举前夕,我们故意将注意力集中在收集数据,故意没有对数据进行分析,因为如果我们在选举前发现存在偏见,该怎么办?换句话说,我该怎么办?我的意思是,如果我宣布这一消息,那将绝对引起混乱,尤其我认为,如果这个偏见是针对唐纳德‧川普的。如果我不宣布这一消息,我将是操纵选举的同谋。因此,我们专注于数据收集。在选举之后,我们花了几个月时间专注于分析。

2017年春季,我将结果提交给了一些科学会议。也就是说,将分析结果提交给了同行评审。当结果被一个会议接受后,我联系了一位《华盛顿邮报》的记者。

谷歌所有10个搜索位置都偏向希拉里

我告诉他我们做的研究,然后说,我们发现谷歌的搜索结果首页上,所有10个搜索位置都偏向希拉里‧克林顿,必应或雅虎却没有。这又是很重要的一点。我们发现谷歌有偏见,而其它搜索引擎没有。此外,我们还发现,不仅蓝州的人们看到了这种偏见,红州的人也看到了亲希拉里的偏见。

我们还采用标准的统计技术来检查我们的发现是否重大。我是说在统计学的意义上,我们的发现非常重要。对于那些知道一定统计学的人来说,我们的发现很有意义,不是在0.05的水平上。人们通常用0.05作为截断值。而是在0.001的水平上,亦即仅凭偶然获得此水平的偏差的可能性小于千分之一。

当然,到这一步的时候,我在公开宣布时遇到了一些新的阻力,因为我等于在说谷歌搜索结果存在很大的偏见。在选举前的几个月内,很多人看到这种搜索结果。

这会对选票产生什么样的影响?我进行了一些计算,这些计算是基于我在《美国国家科学院院刊》2015年的论文中的方程式。根据这些计算,我得出的结论是,如果谷歌搜索结果在全国范围内都存在这种程度的偏见的话,那么将操纵260万至1040万选票支持希拉里,我本人是希拉里的支持者。

换句话说,我的科学发现以及通过监视项目得出的发现在某种程度上有损我自己的政治偏好和政治倾向。但是我强烈认为由于我们的结果如此清晰,以至于我有责任公布调查结果。当然,国务卿克林顿以超过280万选票的优势赢得了普选。她选举失利是因为输在了选举人票上。但是我的研究和监控项目表明,如果谷歌的搜索结果没有偏见,普选结果可能有很大不同。这可能是一场非常接近的竞选。

再说一次,我不得不承认这一点,不得不宣布这一点,这让我感到不舒服。但这就是我从研究中得出的结论。

谷歌控制约90%的搜索 似乎偏爱希拉里

你可能会问,谷歌真的会产生如此大的影响吗?答案是肯定的。美国人每天用谷歌搜索约为5亿次。谷歌控制着大约90%的搜索。第二大搜索引擎必应控制着大约2%的搜索,影响不大。还要记住,我们只是在谷歌上发现了这种偏见。谷歌似乎出于某种原因偏爱希拉里‧克林顿。

当时谷歌做出回应,称这仅仅是用户与我们的算法进行交互的方式。我们没有刻意做任何事情。最终,数年后,在没有指出我的方法有何具体不足的情况下,谷歌开始对我的方法质疑。最初他们说,这是一种自然效应。谷歌经常用这个术语来归咎于算法中发生的问题。

在我看来,这完全是胡说八道。我从十几岁起就开始编程。我可以告诉你,当我们编写程序时,编程序的目的就是希望它们完全照我们的指令做。事实上,谷歌完全可以控制此类事情的发生,比如说有很多用户观点偏左或偏右。算法可以按照它被编写的任何方式进行回应。因此,我根本不认为这仅仅是算法的错误或用户的错误。对我来说完全是无稽之谈。

请记住,我们发现的数字(尽管非常清楚)在某种程度上无关紧要。我们做了一件非常了不起的事情。我们保留了谷歌内部所谓的“短暂体验”。要了解来自大型科技公司对我们的威胁的性质,这是关键。

谷歌最近发生的泄漏事件之一是,2018年从谷歌泄露到《华尔街日报》的事件。谷歌工作人员在一封电子邮件中说,我们如何利用“短暂体验”来改变人们对川普移民政策的看法?这是来自公司内部的电子邮件。

换句话说,谷歌了解“短暂体验”的巨大影响力。“短暂体验”究竟是什么?它是指你输入了一些内容,例如搜索一个词,于是一些结果会特意为你即时生成。它们影响你,然后消失不见了。而且它们不会存储在任何地方。你无法再回去找到它们。你无法重建这种体验。你刚才的那个经历是独一无二的。因此,这是一种绝佳的操控人的方式。

杨杰凯:没有留下任何记录。

爱泼斯坦:没有记录,你回不去,人们甚至看不到偏见。这是我们从不断的研究中发现的。只有极少的人能在搜索结果中发现有偏见。而让人不寒而栗的是,能够看出偏见的极少数人,反而更倾向于朝偏颇的方向走得更远。

杨杰凯:这本身是个了不起的发现。

爱泼斯坦:确实如此,我对这些事情的研究越多,对它们的了解也越来越多,而我也变得越来越担忧,因为这些都是前所未有的极其强大的技术。随着我意外地发现了它们一个又一个,我不得不给它们命名,因为它们是有了互联网之后才可能会有的。它们也不同于其它影响力来源。

在选举中,我们受到广告牌、广播、电视和宣传广告等的影响。所有这些都是竞争性质的。从这个意义上讲,这可能是一件好事。对于民主来说,这是一件好事,因为有如此多的竞争在吸引您的注意力,并试图说服您。

即使可以估量出,却也无法抵消这种偏见

但是,如果搜索结果存在偏见,被操作平台(在本例中以谷歌为例)控制。那就没有竞争,谷歌拥有100%的控制权。当然,即使你可以估量出,却也无法抵消这种偏见。即使你可以估量这种偏见,也无法抵销它。

第一,你必须能够看出它;第二,必须能够有衡量办法;第三,捕捉到它;然后呢,你如何应对呢?你无法更改谷歌算法的操作。因此,这里存在着很多危险,但是看出问题是开始,然后引起其它发现。但是我们的基本想法是,我们的程序可以非常准确地告诉我们像谷歌这样的公司拥有怎样的影响力,改变人们观点和投票倾向,还不只是谷歌,还有其它新兴的科技公司。

杨杰凯:拥有庞大的用户群的这些公司。

爱泼斯坦:是的。我们现在有了一套监视系统。我在2018年建立了第二个系统,有160多个实地调查员,这次保留了超过47,000个与选举相关的搜索和近40万个网页。我要申明,在每种情况下,我们使用的搜索词都是无偏见的﹐这非常重要。我们有独立的评估者对我们使用的搜索词进行评估。之所以如此重要,是因为如果我们使用有偏见的搜索词,例如“边境墙是个好主意”,那么我们当然会得到有偏见的结果。但是事实上,我们使用无偏见搜索词,如:“告诉我有关边境墙的信息”。

杨杰凯:或者是“告诉我候选人的名字”之类的。

爱泼斯坦:正确。我们使用无偏见搜索词就会得到无偏见的搜索结果。想一想,摇摆选民会输入什么搜索词?他们会输入相对中立、无偏见的词,不会输入“建边境墙是个好主意”。他们会输入“告诉我墙的信息”或者“建墙是个好主意吗?”他们会输入中性搜索词。

如果谷歌存在偏见 或转移数百万选票

我们在2016年和2018年的选举中都发现了偏见,即使使用中性词来搜索都会得到偏向自由派的结果,这确实令人不安。

杨杰凯:在2018年的调查中,估计会有多少选民可能因此改变投票对象?

爱泼斯坦:2018年是中期选举,我们必须采取截然不同的做法。我们集中在南加州的三个共和党选区,这些选区都位于坚定的支持共和党人的橙县。事实上,罗纳德‧里根(Ronald Reagan)曾经有句名言:橙县是老共和党人终老的地方。所以这些是共和党选区。我们将监控重点放在了这些地区。

我们再次很容易地在所有三个地区中发现了明显的亲自由派偏见,这足以说明发生了什么。因为这三个地区的议员最后都由民主党人当选。在那些地区,搜索结果非常亲民主党候选人。而且我们计算得出,如果谷歌在全国范围内都存在这种偏见,顺便说一下,这三个地区的自由派偏见只发生在谷歌上,必应和雅虎没有。

如果在2018年全国范围内与谷歌选举相关的搜索结果中存在这种偏见,我们计算得出将转变7820万选民的投票。现在听起来这个数字不可能,但是您必须记住……

杨杰凯:是的,听起来太离谱了。

爱泼斯坦:是的、是的。但是您要知道,这分散在成百上千个选举中。因为这是一次中期选举,所以包括州、地区和地方选举。因此,7820万是我们认为可能改变选票的上限。这些选票散布在许多选举中,但是,这个结果仍然令人不安。

偏见会影响人们对候选人的看法

杨杰凯:我想到一个问题。根据您的早期研究,我们可以在监控项目中明显看到偏见会影响人们对候选人的看法。但是,如何确定人们在实际投票时的行为又如何呢?

爱泼斯坦:这是一个很好的问题,我希望有更多的人问我这个问题,因为我看过提出这类问题的文章,该文章认为我并没有真正发现任何东西。事实是,我们非常确定,我们的发现会体现在人们实际的投票中,这有几个原因。

首先,我们可以从一项广泛的调查研究中了解到,如果你问人们将投票给谁,这已经基本预测了他们将实际投票给谁。虽然会有个别例外情况,但总的来说,我们所说的预测准确率为90%到95%。然后,会有投票后的民意调查。通常这个调查会非常非常准确。偶尔会有例外,这我承认。

但是,还有其它一些原因使我们相信,我们的发现不仅是正确和准确的,我们甚至低估了有偏见的搜索结果对人们实际投票的影响。我之所以这样说,是因为首先,在我们大多数的实验中,人们只进行一次在线搜索,而我们仍然发现这很大程度影响了他们的倾向。现实生活中是什么样的呢?在现实中,人们会在数周或数月的时间内进行与选举相关的许多搜索。如果是摇摆选民,他们会一次又一次地受有偏见的搜索结果影响,将他们带到偏向于某位候选人的网页上。如果人们一次次地看到有偏见的搜索结果,会发生什么?

事实上,我们做了一些实验来专门研究这个问题,并且发现如果我们让人们看一次有偏见的搜索结果,我们就能影响他们。如果我们再让他们看第二次有偏见的搜索结果,当然我们不会给他们看相同的搜索结果,而是给他们看具有相同偏见的结果,那么这种影响会增加。如果我们给他们看第三次,他们就被影响得更多。

摇摆选民数十次、数百次受到有偏见搜索结果的影响

因此,您可以想像一下到底在发生什么。实际发生的是,摇摆选民在很长一段时间内不止一次、两次、三次,而是可能数十次、数百次地受到有偏见搜索结果的影响。这意味着我们在实验中发现的结果极可能低估了像谷歌这样的公司对选民的真正影响。

杨杰凯:难以置信。在您描述所有这些内容时,我在想像这种情况……因为您打算进行另一个监测项目,我希望您稍后跟我们说一说。这次监测,您不会等到选举后才透露监测内容。我可以想像会出现您刚才描述的那种混乱。请谈一些有关此监测项目的情况,以及如何处理整个局面。

爱泼斯坦:我们希望在2020年推出更具规模的监测系统。可以说2016年的系统只是探索性的。这种事情以前从未做过。坦白说,无论我们获得多少统计数字,我们做这件事情的本身我认为是值得一提的。我的意思是,我们找到了一种以有意义的方式保存相当大规模的短暂经历的方法。

但是,到2020年,我觉得科技公司会肆无忌惮这样去做。他们2016年非常谨慎和过分自信。他们可以做很多疯狂的事情来改变选民的投票倾向,但他们之前没有这样做。但是2020年,我们预计在数月时间里,将会有很多很多的操纵手段和利用各种短暂经历去影响选民。

我们计划建立一个更大的实地调查员小组,在所有50个州中至少要有1000人。这次,我们计划使用人工智能(最近几个月我们一直在为此努力)实时分析每天收到的大量数据。

这意味着,如果我们发现存在偏见或某种操纵的证据,我们将予以公布。一旦证据确凿,立即公布。或者向媒体,或者向联邦选举委员会或其它当局公布。这势必将造成混乱,但这是我们需要的一种混乱。基本上,我猜这些公司或我们已经确定的公司将会反击。

但是也可能有好的结果。一种可能是这些公司……我们称其为作恶者,作恶者也许会退缩。如果这些公司退缩,如果他们停止使用这些技术,那么我们将有自由而公正的选举。如果他们不退缩,而我们继续发现并确认大规模操纵投票的证据,坦率地说,我认为这些公司将付出惨重的代价。我认为可能既有针对他们的民事诉讼,也可能有刑事诉讼。

设大型监视系统实时识别诡计 让科技公司住手

无论哪种方式,我认为民主必胜,这是我关心的问题。我不关注任何特定的政党或候选人,尽管我本人偏左。我关心的是民主和自由公正的选举,因为你不知道这些对公众不负责的私营公司如何运作,你也不知道他们将如何利用他们拥有的这些影响力。毫无疑问,他们拥有这些影响力。就目前而言,起码我个人认为,这些影响力正在被利用,这是毫无疑问的。

这些公司最近泄漏的一些材料进一步证实了这一点。一些内部人士亦即告密者挺身而出,并说公司实际上在故意操纵人们的观点、思想和投票偏好,并且在大规模地这样做。

关键是,如果我们拥有一个大型的监视系统,并且实时地识别一个又一个诡计,那么这些公司很有可能就此收手。底线是确保自由公正的选举。当然,除此之外,由于这些公司可以改变对任何事情的看法,因此我们需要密切注意这些公司还在做些什么。同样,这需要监视系统。

我想我们考虑的范围应不限于美国,因为像谷歌这样的公司正在影响全球20多亿人。在三年内,这个数字将激增至40亿以上。因此,谷歌在全球范围内都拥有这种影响力。它切实可以影响人们的思想、行为、态度、信念、甚至几乎每个国家的选举。在我看来,这意味着要建立更大、更好的监视系统,以密切关注谷歌等公司。我认为,这不仅对于保护全球民主是必要的,对维护人类自主权也是必要的。

杨杰凯:我想谈一谈其它一些方法。实际上,您9月在《大纪元时报》上发表的一篇文章中就报导了这些内容。您提到有10种方法,不仅(针对)谷歌,还有其它大型技术巨头。在那之前,我想讲另一件事。较早时我们谈到谷歌前资深软件工程师弗希斯(Zachary Vorhies)泄漏事件,我们请您对他泄露的内容进行过评论,您说了一些令我深感不安的事情,我想在这次采访中简要地探讨一下。您说过,如果是算法本身得出的这些偏向结果,而不是人为地使用类似twiddler的工具(我相信是这样的叫法)对结果进行重新排名,会让您感到更加不安。在我们探讨其它一些方法之前,您可以简单地谈谈吗?

爱泼斯坦:好的。最近我人生中较为瞩目的一件事情,就是川普总统发出了一条推文提及我的研究,虽然他没有提及我的名字,不过这显然是我的研究,因为我刚刚在国会作证。他发文说,这份新报告显示,谷歌操纵了2016年大选,让希拉里·克林顿多了2百万至1600万张选票。他说的数字稍微不太准确,但他也把操纵的概念理解错了。我从未说过谷歌操纵了选举。

操弄搜索结果 公司高管还是乱来的员工?

我承认我曾经一门心思想要知道是像谷歌这样公司里的高管,还是说只是某些乱来的员工在操弄搜索结果和搜索建议以及其它内容、YouTube视频等等。有一段时间,我醉心于想要了解他们是否是故意的。谷歌员工是故意的吗?后来我终于意识到,我不在乎了。无所谓了,我们姑且假设他们不是故意的,只是没有注意到这个问题。

想一想。他们正在影响全世界的思想和行为以及投票。我和妻子在斐济群岛住了一段时间,斐济90%以上的搜索都是使用谷歌。我们住在那儿时,是一个军事独裁政权统治。但是我们离开后那里进行了选举。

现在的问题是,谷歌会注意这一选举吗?我们姑且说他们一点也不在乎斐济的选举。他们没注意。假设许多国家的事情他们不在乎。对于许多选举,可以说他们不在乎。但是该算法仍将继续发挥作用。它始终将一种狗粮放在另一种狗粮之前,将一个品牌的牙膏放在另一个之前,将一个候选人放在另一个候选人之前。程序就是这样设计的。

谷歌的搜索算法没有对等时间规则。在进行实验时,我们总是有一个对照组,将结果混合排列。因此,没有偏见。但他们没有这样做。他们的算法旨在告诉你什么是最好的,并将最好的排在首位。如果你犹豫不决,排在首位的搜索结果会改变人们的想法和观点。

因此我意识到,当今许多重要历史事件不是由像谷歌这样的公司制定计划、目标和战略所决定的,而是由计算机程序决定的。对我来说,这远比谷歌高管要统治世界要可怕得多。事实是,我们制造出了这种能影响全人类的强大计算机算法,并听之任之。

程序员的意识形态偏见 会被纳入算法

杨杰凯:您之前说过这点,当时我听得毛骨悚然。您现在又说了一遍,我又听得后背发凉。首先,大量研究表明,程序员的意识形态偏见会被纳入算法。那可能需要在另一次访谈专门来探讨。但是谷歌如何抵消这种影响?假设他们决定以您希望的方式做出回应,但是要如何做呢?他们是否必须对搜索进行重新排序,以免出现偏见?这是如何运作的?

爱泼斯坦:几个月前,我可能对这个问题会支支吾吾,但是现在不必如此了,这要感谢告密者弗希斯,感谢他从谷歌拿出公布的一些文件。事实是,谷歌可以轻松解决搜索结果中的政治偏见。我是怎么知道的呢?因为谷歌一直以来都在关注这种它们内部称为算法不公平的问题,这个问题可能导致所谓的算法困境。所以谷歌开发了一些控制算法不公平的方法。他们开发了叫做“机器学习公平性算法”(ML Fairness Algorithms)。

我大致介绍一下该方法的工作原理。假设你正在谷歌上浏览图片,然后输入CEO(我最近试过),你会主要看到男性的图片,因为绝大多数美国的CEO是男性。这正是某些人称谷歌的算法不公平的一个具体例子。即使目前大多数首席执行官都是男性,这一事实可能会使某些人感到不快。

因此,他们开发了非常简单的方法来弥补,这样当您输入CEO时,您会看到一半是男性,一半是女性。天才呀,当然,这不一定符合真实情况,可以被认为是一种社会工程(social engineering),因为它制造的印象并不完全符合真实情况。而且,当然,如果你把这种逻辑应用于社会的许多不同方面,则你可能在进行大规模社会工程,或可能被指控在从事大规模社会工程。

撇开这个问题,我要说的重点是,谷歌有能力消除任何可能的政治偏见。他们可以很快做到,也许一天之内就可以。这就是为什么我在想,如果我们通过大型监视系统暴露各种偏见,就像我说的那样,公司可能会退缩,他们可能会使用已经开发的技术,即所谓的机器学习公平性算法来弥补这个问题。下次我们寻找偏见时,什么也找不到。消失了。

杨杰凯:十分吸引人的议题。您不但概述了问题,还提出了可能的解决方案。这在我们的采访中很少见的。请介绍一些目前使用的其它方法。我们一直在谈论谷歌和搜索引擎的操控问题。当然还有许多其它方法。比如另一个大型互联网平台脸书又如何呢?那里在使用什么类型的方法?

大选前提示参选 会影响选民投票意识

爱泼斯坦:脸书至少有五种影响人们意见和投票倾向的方法。我最早是在2016年写过这类文章。他们最简单的方法称为定向消息传递。我在一定程度上研究和量化过这个问题。我称之为“TME效应”,即“目标消息传递效应”。举个最简单的例子,顺便说一下,这是基于脸书2012年自己发布的数据。

如果在2016年选举日,马克·扎克伯格(Mark Zuckerberg)决定仅向民主党选民或偏左的选民发送“去投票”的提示,那一天希拉里‧克林顿的投票数将比她当天实际得票多至少45万。那么,因为马克‧扎克伯格偏左,我怀疑他可能因为没有想到要发出针对性的信息而懊恼不已。但关键是,他有能力那样做。定向消息传递有非常强大的影响力。

还有一个例子跟它差不多。在2018年,谷歌确实在其首页上发布了“去投票”的提醒。他们从主页上删除了彩色的“Google”(谷歌)一词,并换上了“Go Vote”(去投票)一词。如您所知,我发表了一篇文章,其中包含所有计算结果,文中表明如果这个投票提示发送给每个美国人,那么会有更多人投票,否则这些人将待在家里。但是由于使用谷歌的人群分布的原因,民主党获得的票数将比共和党获得的票数多80万。听起来像是很多选票,但这是中期选举。因此,这些选票分散在数百个选举中。尽管如此,这还是有利于民主党。毫无疑问,在谷歌发布提示之前,谷歌的数据分析师所做的计算与我的计算相同。

如果谷歌将该提示主要显示给民主党人,或者显示给左倾或偏左的人,那么将产生更大的影响。在极端情况下,民主党获得的选票将比共和党获得的选票多出460万。这是另一种效应。我们称其为“DDE”或“差异人口统计效应”。正如我之前说的,我一直偶然碰到这些现象,并且一直在努力尝试理解它们并对其进行量化。

但是,大多数这些影响类型在人类历史上从未发生过。互联网使它们成为可能。这些科技巨头垄断使它们成为可能,而它们完全掌握在这些科技垄断企业的手中。换句话说,你无法抵消它们。即使找到了它们,也无法抵消它们。

杨杰凯:因此,您建立了这个庞大的监视系统。您成功了。有至少一千甚至更多人在研究搜索引擎的操纵效应。我们有没有可能无法发现DDE或其它效应?

爱泼斯坦:当然。到目前为止,我已经确定了大约12种效应,例如SEME,DDE和TME。但是可能还有其它。肯定有其它方法。我的意思是,我不可能……我只是一个人研究。到目前为止,我是唯一一个一直努力去发现这些效应并对其进行量化和研究的人,事实上,我是唯一一个设置监视系统来捕获短暂经历的人。这令我觉得很奇怪。我不明白。这需要有所改变……到2020年,将非常棘手。如果只有我和我的同事收集所有这些数据,会产生影响吗?这会改变什么吗?

杨杰凯:您的意思是,需要有多个独立的实体来发现相同或可能不同的结果,是吗?

爱泼斯坦:确实如此。确实应该有很多像我这样的人,他们应该在不同的机构展开这样的工作。政府、非营利组织、大学里都应该有人在从事我做的这种研究。我猜想,如果在2020年我们有一些惊人的发现,并且我们做事认真、可信,并将我们的数据移交给合适的主管部门和专家,我想会带来一些真正的改变。我希望。

杨杰凯:爱泼斯坦博士,了不起的工作,非常感谢!

爱泼斯坦:谢谢。