logo
繁体
繁体

吹哨人爆料后,脸书罪名又加一条:隐瞒数据、学者发论文要审查

Madhumita Murgia、 Cristina Criddle和 Hannah Murphy在金融时报发表文章,越来越多的社交网络研究人员表示,他们在为自己的研究项目申请获得Meta的平台数据时,往往遭到Meta的各种阻挠,Meta以保护用户数据隐私为由,限制研究人员获得数据,并且要求研究结果在发表前必须先经过Meta的审核,研究人员对Meta这种不透明的做法非常反对,要求Meta开放平台数据,另一方面,Meta表示,它正在采取措施,在保障用户数据安全的前提下,尽可能地配合研究活动。

Photo by Dima Solomin on Unsplash 

去年3月,普林斯顿大学的研究员奥里斯提斯·帕帕克里亚科普洛斯(Oretis Papakyriakopoulos,下文简称帕帕克里)申请使用一种特殊的数据访问工具,这种工具允许学者在Facebook上进行研究,他的目的是调查社交网络上的政治竞选活动。

这个数据集包含与选举有关的广告信息,这些广告是如何传播的,向谁传播,花费多少。但是,当帕帕克里看到要求他签署的、设置了苛刻的访问控制的合同时,他撤回了数据访问申请。

根据英国《金融时报》看到的合同草案副本,“Facebook将保留在计划公布或披露日期之前充分审查草案的权利……以确定这些材料中是否包含或披露任何机密信息或任何个人数据,以及在公布或披露之前需要删除的内容。”

帕帕克里要求澄清什么是“机密信息”,但没有得到回复。

帕帕克里说:“我们不能刚开始做这个项目,就有人突然告诉我们,我们不能发布。”Facebook说这份合同是不可协商的,因为它是剑桥分析数据丑闻后,由监管机构规定的。

注:Facebook-剑桥分析数据丑闻是指英国咨询公司“剑桥分析公司”在未经Facebook用户同意的情况下获取了数百万Facebook用户的个人数据,用以分析并根据分析的结果为2016年泰德·克鲁兹和唐纳德·特朗普的总统竞选活动提供帮助,2018年事件曝光,同年五月,剑桥分析公司申请破产。

帕帕克里认为,这只是Facebook使用的一个通用借口。

本月早些时候,Facebook试图通过推出一个更新的工具来缓解这些担忧,这款工具被称为Facebook的“开放研究和透明度团队(Fort)的研究API(Researcher API)”,目前,这款工具可供由Facebook新命名的母公司Meta邀请的二十几家研究机构使用(机构名单未公布)。

然而,帕帕克里经历的事情是Meta公司与研究人员关系不融洽的众多例子之一,这些研究人员试图了解Facebook平台潜在的负面社会影响。越来越多的学者抱怨说,Facebook设置了过度的障碍,试图扼杀可能对其产生负面影响的研究。

最近,举报人弗朗西斯·豪根(Frances Haugen)泄露了公司内部研究人员的大量文件后,Meta与自己的研究人员的关系受到了考验。研究人员概述了平台的潜在危害,如Facebook上的选举错误信息,以及Instagram上的帖子,这些帖子加剧了关注身体形象的少女们的心理健康问题。

豪根的揭露助长了一种说法,即尽管社交网络对社会和政治的影响受到越来越多的批评,但Facebook仍以不惜一切代价的心态运作。

一些外部和独立的学者和研究人员告诉金融时报,他们担心Meta对数据的垄断,这是一个公众关注的问题。一些人甚至将Meta的做法与烟草等行业过去试图塑造和操纵学术研究的方式相提并论。

一位曾参与Meta资助的研究项目的研究人员说:“Facebook正试图系统性地阻止平台上的研究,这违背了学术界和公共利益原则,它的做法很接近大烟草公司:设立研究机构,委托进行不是真正意义上的研究。现在,这样的实例正在不断增加,这是一场针对独立学术界的持续战争。”(这位研究人员要求匿名,以防止专业上的攻击。)

Meta公司的一位发言人说,它与学术研究人员合作,并正在建立支持他们工作的产品。公司表示:“新技术和伙伴关系意味着我们可以在一个保护隐私的环境中分享数据集,并大大推进学术研究。与这个领域的其他人员一样,我们会继续学习分享这些数据的最佳方式,同时保护使用我们服务的客户的隐私。”

对一些观察家来说,豪根的揭露和学术研究人员的抱怨都指向同一个问题,即公众领域对社交媒体平台的算法以及如何运作缺乏真正的了解,这种不透明性可以帮助社交媒体公司抵御对其技术的负面影响的批评。

华盛顿特区美国大学和巴德学院的宣传和影响行动研究员艾玛·布里安特说:“举报人弗朗西斯·豪根文件的最大启示是Facebook能够隐藏什么,这适用于所有的大科技公司,它们完全不透明,我们的整个民主只能靠公司内部个人的道德选择和勇气,取决于他们是否站出来,这里出现了一个真正令人不安的模式。”

Image by Gerd Altmann from Pixabay 

剑桥分析公司丑闻的影响力

Meta公司有充分的理由对管理其数据的学术审查方式保持非常谨慎的态度。

在2018年剑桥分析公司丑闻发生后,公司对外界的限制变得更加严格,当时这家小型政治咨询公司在未经同意的情况下通过第三方获得了约8700万Facebook用户的个人数据。

2019年,Meta就这些侵犯隐私的行为向美国联邦贸易委员会支付了50亿美元的和解金,从那时起,Meta就一直在走钢丝,试图在用户的隐私与更多的透明度之间取得平衡,同时努力使平台的增长最大化。

研究剑桥分析公司十多年的布里安特说,如果对Meta公司数据的访问处理得不好,这些信息可能会被政府和其他行为者获得。她说:“众多研究人员正在寻求访问,但并不是所有人都会有严格的大学伦理程序、透明的目的和安全保证。”

Meta表示,其用户数据受世界各地的隐私法管辖,如欧洲的《通用数据保护条例》(GDPR),因此它需要仔细管理它给予第三方的任何访问。

Meta公司表示,就其为学术界开发的新工具而言,研究人员不需要签署这一合同,因为公司希望减少访问公共数据的负担,并积极听取了获得早期访问权的研究人员的反馈。

Meta公司希望从2月起向经过审查的研究人员更广泛地开放对新工具的访问,这些研究人员要证明他们是大学的附属机构,并接受一些关于如何使用这一系统的培训。

然而,Meta表示,当研究涉及敏感的用户数据时,它仍然需要进行发表前的审查。公司还表示,它永远不会要求学者们修改他们的研究结果,但它会强调需要删除的专有或识别信息。

豪根公布的文件表明,Meta公司曾向公众隐瞒了自己对潜在不良影响的内部研究。其中一些内部研究人员长期以来一直抱怨合同的限制性过强。金融时报看到的文件显示,与公司签订内部工作合同的学者,无论是作为临时人员还是长期人员,都受到与非学术人员相同的限制。

至少在一些合同中,Meta声称拥有所有“发现”的所有权,包括博客文章、书籍和未来的研究论文,只要这些研究结论使用了在工作期间获得的任何信息或知识。在学者进行研究后的一年内,所有新的研究结论(即使与社交网络无关)都必须向Meta申报,并详细说明为什么Meta公司拥有新的研究结论的所有权。

曾在Meta工作过的学者告诉金融时报,他们觉得这种合同让他们无所适从。研究人员担心,如果他们在公司的见解和经验被限制使用,他们未来的学术工作和出版物会受到影响,这也是研究人员选择首先去Meta工作的主要原因之一。

Meta公司表示,它雇用学术界人士是因为他们的专业性,但他们希望把这种关系解释得非常清楚,它承认保密条款是争论的根源,但表示合同是由其法律团队起草的。

Meta公司的一位女发言人说:“任何涉及数据访问的合同都涉及保密条款,没有例外,我们使用的是标准的保密语言,针对特定情况做了大量的附加条款,而且没有限制与我们合作的学者未来工作的非竞争条款。”

一位曾在Facebook人工智能研究团队工作但拒绝了一份全职工作的非正式职员说:“在所有大科技公司中,Facebook对学术人才的吸引力是最小的。”

Photo by Annie Spratt on Unsplash 

独立学者的抱怨越来越多

帕帕克里远不是唯一一个对Meta的强加条件表示不满的研究人员。

8月,Meta关闭了纽约大学两名研究人员对其平台的访问权限,声称他们违反了准则,同时这些研究人员指责公司试图打断他们的工作,因为它发现公司在推广的广告中放大了党派的错误信息。

参与这项研究的首席研究员劳拉·埃德尔森说:“Facebook在这里没有表现出自己是一个好的合作伙伴,如果你看看他们在自己的内部研究中所做的事情,如果不是因为其他事件,这些事情是不会见光的。我认为这种对待研究的态度让很多独立的研究人员非常警惕。”

“以前Facebook打开了所有的窗户,人们往里面看,发现我们不喜欢看到的东西,而Facebook的反应不是清理房子,而是关闭窗户。”

Meta还被指控干涉他们资助的独立研究人员的工作。2020年,Facebook向华盛顿特区卡内基国际和平基金会(Carnegie Endowment for International Peace,一个无党派智囊团)的一个研究项目“反影响行动伙伴关系”(PCIO)捐赠了100万美元,研究目的是对网上操纵和错误信息造成的影响进行独立调查。

虽然它开始是一个真正的研究项目,但据称Meta的影响力随着时间的推移而增加。一位熟悉PCIO的研究人员说:“它逐渐变得越来越受到Facebook的直接控制。Facebook发出日常指令,说它听到了什么,或者看到了他们不喜欢的论文。这写来自Facebook的微妙信息总是通过其他人传递过来的。”

这位研究人员表示,原创性的调查不被鼓励,他们的研究结果主要是当前文献的总结。

Meta公司说,它没有干涉其资助的研究工作。

乔治·华盛顿大学研究网上错误信息传播的教授丽贝卡·特朗布尔说,Meta公司以欧洲的隐私法GDPR为借口,阻止研究人员访问数据。

特朗布尔是“社会科学一号”(Social Science One)的原始成员之一,这是一个由哈佛和斯坦福教授在2018年成立的非营利性倡议,旨在成为Facebook和学术界之间的数据中介。提供的第一个数据集包括全球Facebook用户分享和点击的“几乎所有”的公共链接,大约有PB级别的数据(注:1PB=1000TBs)。

特朗布尔说:“对于学术研究人员和社会科学家来说,其中一件事令人十分担忧,如果我们想了解因果关系,我们必须能够查看个人用户层面的数据,但Facebook只是说不,并把GDPR作为他们设置障碍的关键原因。”

特朗布尔找到比利时的政策制定者进行澄清,发现GDPR有一个专门针对学术界能够访问数据的特殊例外。Meta说,这些例外情况确实存在,但对于这种例外这是否适用于公司缺乏明确的认识。

最终,当Facebook将一些研究人员声称是不完整的数据交给研究人员时,这项项目遭到了破坏,导致大约一半的美国研究人员,几个月都无法进行工作和分析。

脸书表示,数据集存在错误,影响了一些研究,但自事件发生以来,它一直在努力更新数据。

特朗布尔说:“问题是,只要Facebook和其他平台完全控制他们与研究人员分享内容的意愿,而且这些数据不能以任何方式进行独立验证,我们就总是容易受到批评,因为我们不确定我们的分析是否正确,我们看到的是,平台实际上利用这一点来对付我们。”

Photo by Glen Carrie on Unsplash 

社会媒体和民主

Meta说,在过去三年里,它与学术界的合作一直在发展,今年3月,它成立了一个专门的学术合作团队,作为那些想在Facebook或Instagram上进行研究的研究人员的内部联络人。

目前,一个由17名外部学者组成的团队正在与Meta公司合作开展一个名为“选举2020”的新项目,这是对社交媒体在当今民主中的作用进行的一系列研究,参与者希望它能为未来研究学者和Meta的合作提供一个模式。

为了保护学术独立性,研究人员不接受Meta公司的资金(但它确实资助了部分研究),Meta公司不能在发表前进行审查工作,一名独立的学术观察员正在监督研究过程,而且参与者必须选择参与个人层面的数据研究。英国《金融时报》采访的研究人员表示,这个项目进展顺利,到目前为止没有受到什么压力或干扰。

然而,为了保护用户身份,在某些情况下,研究人员不能直接访问数据,必须依靠Meta公司代表他们挖掘数据。

一位参与项目的研究人员说:“我对与Facebook建立研究伙伴关系有些警惕,我没有感觉到任何压力,但合作的过程很繁琐,我不太习惯。”

尽管在“选举2020”项目上表现出了初步的积极迹象,但一些参与这个项目的研究人员仍然认为,主动权完全在Meta公司,它可以选择分享什么数据以及如何分享。他们认为,要求公司为公众利益提供数据和信息的法律,对于学术界能够在社交媒体平台上进行真正的独立研究至关重要。

特朗布尔是“选举2020”项目的研究人员之一,她说:“我非常坚定地认为,如果没有法规来强制要求访问,我们根本无法获得我们渴望的那种透明度和问责制。”

弗朗西丝·豪根在欧洲议会就《数字服务法》(DSA)发言时对此表示赞同,这项法案建议明确大科技公司在欧洲的责任,豪根敦促立法者“鼓励平台让储存在平台上的信息被广泛使用,而不是像目前提案中建议的那样,只对“经过审查的学者”开放。

豪根告诉英国和欧洲议会,Facebook “非常善于在数据上做文章”,并表示立法应迫使Facebook解释它递交的信息,包括用于提取数据的查询。

欧洲数字权利运动者,如“算法监查”(AlgorithmWatch),也在争取更严厉的监管,迫使Meta允许数据访问。DSA目前只包括对大学学者的这一要求。Algorithm Watch的政策和宣传团队负责人安吉拉·穆勒说:“我们认为这很关键,但应该进行修改,不仅包括有学术背景的研究人员,也包括来自民间社会和记者的研究人员。”

在美国,学者们起草了一项法案,允许联邦贸易委员会为社交媒体平台制定强制性的数据和信息共享要求,对违反要求的研究人员和公司进行处罚。两名参议员(两党各一名)现在正计划在此提案的基础上提出立法。

斯坦福大学法学院教授内特·珀西里说:“如果社交媒体公司不这样做,我们需要有某种方式来施压,否则这就会是一种风险。” 珀西里起草了这项法案,并共同领导了“社会科学一号”项目,他说:“我的观点是,我们必须在2024年大选前尽快完成这项工作。”