榴榴杂谈

文字和数字本是工具,可利用工具的人有好有坏。

榴榴杂谈 2023-07-16 07:25 出处:网络 作者:原始欲望编辑:@榴榴

今天分享的书籍是《数据如何误导了我们》。

本书作者桑内·布劳(Sanne Blauw),荷兰计量经济学家、数据分析记者,博士毕业于拉斯谟经济学院,长期致力于数据研究,揭示数字对生活的影响,试图矫正荷兰人对数据的偏见。目前,她在荷兰门户网站“通讯员网”(De Correspondent)担任通讯记者。


有人说,“数据决定生活”。在大数据时代,这句话已成为不辩自明的真理。几乎无处不在的数据,小能反映成绩、体重、天气,大能左右投票结果、影响经济增速、抹杀气候变化。然而,许多数据其实并不像表面上标榜的那样客观、公正,反而常常被人操纵,来误导我们。


在本书中,荷兰计量经济学家、数据统计记者桑内·布劳就将带领读者“数”落世界,通过真实案例,从南丁格尔用大数据来挽救生命,到美国烟草业报告造假,再到欧盟公投中的票数摇摆,揭示日常生活中的数据偏见,教你如何不再盲信数字,练成大数据时代人人必修的“避坑大法”。


接下来我从两方面为大家解读这本书:第一方面,为何数据会误导我们?第二方面,我们如何避免落入数据的陷阱?


01、为何数据会误导我们




我们知道,数字在我们的生活中已经变得过于重要。数字的导向性已经大到让我们再也无法继续忽视滥用数字的现象。数据原本应该是客观、公正的,但是在很多时候,数字本身和文字一样是无辜的,犯错的是数字背后的人,他们操纵数据来误导我们,导致我们落入数据的陷阱。


比如心理学家用数字包装种族歧视的观点;世界顶尖性学研究员采集数据的过程其实见不得光;烟草巨头们滥用数据,上百万人为此赔上了性命等等。那么我们为何会陷入这种数据的骗局呢?为什么很多时候,一些看似客观的数据其实是有误导性的?作者从三个方面向我们解释了这个问题背后的真相。


1、数字标准化


数字标准化,指的是,给你的研究对象建立一个统一的测量标准。


比如,法国大革命(1789—1799年)之后,革命党人决定废除所有地方计量单位,他们提出公制单位的设想。比方说,革命党人想按土地面积征税,但国内每个人都有一套自己的距离单位,那税该怎么征呢?这场变革持续了一段时间,最终成功地将公制单位的概念(后来的国际单位制),从法国推广到了世界上绝大多数国家。现在只有3个国家——美国、利比亚和缅甸——仍旧使用英制单位,即质量单位为“磅”,长度单位为“英里”等等。
这么说可能不太好理解,我们换一个例子。如果我说我成功减肥了,这不是一种统一的衡量标准。但如果我换一个说法,我的体重成功地减掉了20斤,那么这就是一个标准的说法了。

我们日常生活的重量、公制单位概念、长短、尺度等等,都是客观存在的事情,所以非常容易衡量,这就是一种标准化。但是随着社会的发展,不是所有的概念都能转化为统一的标准,或者准确全面地表述出来。


比如,GDP,我们知道,GDP是国内生产总值,它是一个经济体在一段时间内所制造的商品和提供的服务的市场价格的总和。当我们在说一个国家贫穷或者富有的时候,主要看的是人均GDP,它能体现一个国家民众的平均收入水平。但是,多年来,很多人反对把GDP作为衡量一国富裕程度。
有的人说,GDP没有考虑到那些发生在市场交易以外的创造价值的行为,没有考虑环境恶化等隐性成本,没有考虑收入分配等等。人们也尝试提出过一些替代GDP的复合指标,比如“社会健康指数”“国民幸福指数”等等。但是,没有哪个指标能做到尽善尽美。

也就是说,对一件事物的衡量标准大多数是人为的价值判断,研究的人不同,那么标准也就不同。


比如,第一次世界大战期间,哈佛大学的心理学家罗伯特·耶基斯对175万名美军新兵进行了智力测试。耶基斯和其他智力研究专家一起拟定了一份可供大规模使用的智力测试题。让这些新兵填写,结果显示美国白人男兵的平均心智年龄只有13岁,再往下是来自东欧和南欧的移民,最后是黑人,平均心智年龄只有10.4岁。
不仅仅是罗伯特·耶基斯,耶尔纳兹·拉莫塔辛在2016年接受荷兰新闻网站Brandpunt+采访时就表示:“人种之间的智商存在着差异。这一点是经过科学证明的。两年后,由于拉莫塔辛的这番言论,作为荷兰民主论坛党候选人的他在阿姆斯特丹市政府选举中引发了不小的争议。排山倒海的批评声浪不断袭来,最终,他决定退出竞选。
持有这种观点的人可不止拉莫塔辛一个。从耶基斯的智力测试起,关于智商和肤色的讨论已经涌现了一浪又一浪。教育心理学家阿瑟·詹森在1969年就曾表示,黑人和白人学生之间的智商差异是由遗传基因决定的。当年的这番言论还引发了一场国际上的动乱。
但是这个结果准确吗?作者说,并非如此。对175万名新兵进行智力测试的项目看起来似乎令人印象深刻,但实际上,数据采集的过程既草率又匆忙。
再比如,“韦氏智力测试”,是美国医学心理学家大卫•韦克斯勒主持编制的。这是世界上应用最广泛的智力测试之一,里面的题目主要涉及常识题、算术题、找不同、拼图案等等,主要关注的是被试者的抽象思维能力。但问题是,抽象思维能力强,就意味着智力水平高吗?并不一定。这只是智力测试设计者的一个价值判断而已。

所以,作者说,如果换不同地区、不同种族的人来设计智力测试,那测试的内容可能完全不同,因为他们都会把自己认为重要的问题放进去。


2、数据收集


数据收集中有一个民意调查,想必大家都很熟悉。从本质上来看,民意调查其实就是从所有民众当中抽取一小部分作为样本,然后调查样本人群对某件事的看法,以此来判断民众对于这件事的整体意见。然而,在现实中,人们却经常发现,民意调查的结果,跟实际情况并不相符。


比如,1948年的美国大选,胜出者是杜鲁门,这我们都知道。但其实,在大选结果出来之前的民意调查里,候选人杜威的支持率是超过杜鲁门的。选举结果公布前,《芝加哥每日论坛报》的主编对杜威会赢得大选这一点深信不疑,以至于他甚至没有等待最终的结果出炉,在大选的前一天晚上就让人在报纸上印下了这条标题。

作者说,在2016年特朗普当选总统之前,也有许多媒体、专家曾根据民意调查的结果预测,特朗普会被希拉里打败。《纽约时报》在大选后的第二天发问:“他是怎么取得如此压倒性的胜利的?为什么之前几乎没有人——没有专家、没有民意调查、没有媒体预想过这种情况?”等等。


我们平时的生活中,这种情况比比皆是,比如很多网站,会通过问卷调查的方式统计用户对于网站的功能满意度。但是,在民意调查中获得高支持率的选项,却跟现实中的民众意愿相左的情况,也时有发生。


作者认为,如果调查问卷的设计是合理的、中立的,问卷上的问题不具有误导性,那么主要的问题大概率是出现在对于样本人群的选择上。很多民意调查,只是在某些特定群体中进行。


比如,知名心理学家亨里奇就曾经说过:心理学研究中的样本是“怪异”的,因为他们都是来自西方的、受过教育的……具有民主意识的人;最终的心理学研究结果通常会用“全人类”一词概括,但事实上,研究采用的那些“怪异的”样本,跟其他群体之间,其实存在着极大的差异。

对于这类“样本局限性”问题,人们也在努力寻找解决方案。比如,随机抽样调查,先把要调查的所有民众都列出来,然后从中随机筛选出要采访的样本去联系;按照真实的人数比例来设计样本人数,再去全国各地寻找受访者等等。


但这些方法也并不完美。比如,调查者可能会拒绝参与调查,那么最后被采访的那些人的代表性也会有所下降。


所以,作者提醒我们,人们采集到的数据永远不可能精准地反映现实;透过数据看现实,就像是透过磨砂玻璃看东西一样——你可以看到一个大致的轮廓,但永远都无法完全看清楚。


3、数据分析


作者认为,数据分析有时候会欺骗我们,将相关性和因果关系混为一谈。也就是说,由于两个事物之间存在着某种联系,人们便会自动认为是其中的一件事导致了另一件事。


哈夫在书中就曾举过一个很妙的例子:人们可以通过计算一户人家屋顶上鹳鸟巢穴的数量,估算这家有多少个婴儿。换句话说,婴儿和鹳之间是有联系的。但是孩子并非由这种黑白相间的鸟带来的。这两者之间的联系(相关性)并不意味着是其中一方导致了另一方(因果关系),因为很可能还有另外的因素在左右着这两件事物。

这是一种“伪因果关系”。首先,这种观察可能是一种偶然事件。因为还可能存在另外一种因素在同时影响着鹳鸟的数量跟孩子的数量。


比如,一个房子越大,房子里的孩子往往也就越多;而与此同时,这个房子上的烟囱数量也更多,于是就会吸引到更多的鹳鸟前来筑巢。也就是说,是房子的大小同时影响着鹳鸟的数量跟孩子的数量,并不是这两者之间真的存在因果关系。

除了偶然事件和缺少了一个因素以外,另一种情况可能是关联(也可能)是反着的。


比如,下雨的时候,你能看见街上有许多人带着伞。那我们能说,是雨伞导致了下雨吗?当然不是。是因为下雨人们才都带着雨伞。

哈夫表示,一件事情的起因和结果并不总是那么清晰。倘若一位有钱人持有很多股票,那么他是由于这些股票变得有钱吗?还是因为他很有钱所以购入了许多股票?两种说法都是成立的,而因果关系甚至可以两头都说得通:一个人很有钱—他去买股票—变得更富有—购进更多股票,等等。


所以,我们需要去识别这些数据,不要让这些数据误导我们。那么我们应该如何避免让这些数据误导我们呢?


02、如何避免落入数据的陷阱




我们先来看一个案例:
2018年4月作者在NOS的网站上看到一标题:“一杯酒实际上已经过量了。”标题下面的文章中写道,如果你每天不止喝一杯酒,那你就已经面临着早死的风险。
这篇文章引用了着名期刊《柳叶刀》上发表的一篇论文,总共涉及83项研究、60万名研究人员。尽管这个结论的确令人印象深刻,但相关性并不等于因果关系。
这一点,了解循证医学的研究人员维奈·普拉萨德也注意到了。于是,他在深入研究了《柳叶刀》上刊登的这篇论文后,简单粗暴地在推特上写道:“一组科学家证明,人们遏制不了对屁话科学和扯淡的健康新闻的渴望。”随后,普拉萨德又发了30多条推文来解释他先前的言论。
他提到了出版偏见,也就是只有发现了关联的研究才会被发表出来。他还指出,这项研究仅仅调查了很短一段时间内的酒精消费量,并且,尽管研究人员在喝啤酒的人中发现了较高的死亡风险,但在喝葡萄酒的人中却没有发现。于是,普拉萨德建议,与其说是酒精,还不如说喝啤酒的人的低收入才不健康。

一般来说,人们只需通过问几个问题就可以轻松地识别这些错误。第一,标准化是如何进行的?第二,数据是通过什么方式采集的?第三,其中是否存在因果关系?


但作者说,有时候我们还需警惕自己陷入非理性的思维当中,比如我们说到的酒精的案例,作者看到这项研究的后非常生气,认为这个结论大概率是假的。为什么?除了作者对数据持有怀疑的态度以外,另一个原因是她本身很喜欢跟朋友一起聚会喝酒,不想被这个数据影响了兴致。


后来,普拉萨德的医学研究人员在网上公开指出,这篇研究存在问题以后,她瞬间觉得很畅快,感觉自己可以放心喝酒了。但后来,她察觉到,自己的判断,其实严重地受到了个人感受的影响。


而当她再一次回头翻看普拉萨德在网上发的文字的时候,才发现,普拉萨德从来都没说过喝酒无害,他只是说这项研究本身有问题而已,是作者自己选择了一种符合自己理念的解读方式。这种情况在几乎所有人身上都会出现,我们都往往会以自己喜欢的方式,去解读我们所接收到的外部信息。


所以,我们首先要做的就是,察觉到自己在看到某个数据时候的感受。然后多点几下鼠标继续调查。


不管是线上还是线下,搜索一下对其持有相反意见的人怎么说。不要只读那些正好和你的意见相契合的文章,还要去寻找与你的信念背道而驰的文章来读一读,尽管它们可能会令你感到不适、生气或者绝望。正如作家蒂姆·哈福德所说:“再多点一下鼠标。”


作者做了一个测试。她在谷歌上搜索了一下有关酒精研究的更多信息,很快便找到了各类表明酒精与癌症之间存在因果关系的研究。
例如,曾有一项在狒狒身上进行的酒精实验,最终结果是狒狒患上了肝病。另外还有一项元研究的结果显示,患乳腺癌的风险与酒精摄入之间存在线性关系。搜索之后她便渐渐了解到,喝酒给身体带来的主要是负面影响,对于这一点专家们早就已经达成了共识。这也就是为什么,从2015年开始,作者所在国家——荷兰——的卫生委员会一直建议民众,每天最多只喝一杯酒。

作者认为,任何研究都不是百分之百确定,这就是科学的本质。大多数的研究,都是在某个特定的时间点,对某个国家内的某个特定群组进行的。人们永远可以说,某项研究结果只是一个偶然事件,因此它的结论的适用范围是特定的。


如果对于某件事情,有很多不同背景的研究人员,采用了不同的研究方法去研究,最后大多得出了相似的结论,那么就可以算是一项“科学共识”。


最后,作者还说,如果你想要鉴别某种行为是不是滥用数据,了解认知偏差以及个人直觉很重要。不过,也许最重要的,你得弄清楚这个问题:这份数据由谁提供?数据的结果与此人存在利益关联吗?


0

精彩评论