010-84476011
环球医学>> 医学新闻>> 医疗技术>>正文内容
医疗技术

研究显示 看护家门口的树苗有助于孩子长高…

来源:    时间:2018年12月19日    点击数:    5星

一位家长发现,随着家门口树苗的不断生长,自己家孩子的身高也在不断增长,于是乎得出结论:好好看护家门口的树苗,有助于自己孩子长个子。乍一听,这事很荒谬,但统计学结果表明,树苗生长与孩子身高之间确实存在正相关性。

小编听完简直蒙圈了。用数据说话,可是我们说服别人最好的武器了?这应该是统计学偶然的误读吧?但现实情况并非如此,科学研究中对统计学的错误运用常会得出梦呓一般的结论,例如:
雪糕卖的越好,游泳溺亡的人越多;
派往火灾现场的消防车越多,死亡的人愈多;
睡眠时间越短的人,收入越高;
……

最为客观的统计学何以变得“不着调”?


为什么我们印象中最为客观最不会撒谎的统计学,变得如此“不着调”?这得从相关性和因果关系的本质和关系说起。

相关指的是二者的变化趋势在某种程度上存在一致性,例如文章开头所述,家门口树苗的不断生长与自己家孩子身高不断增长,二者的趋势确有一致性,因此具有相关性。但是,相关性不一定有因果关系;因果关系则强调 “前和后”的关系,是因为某种变量有变化才导致了另外一个变量随之发生改变,强调的是二者存在某种逻辑上的关联,需要确定二者间具体的依存关系。因果关系有时候也不一定表现出明显的相关性。

因此,相关性与因果关系,抑或天涯,抑或比邻。


如果A和B相关,二者的关系至少有以下5种可能性:
1 A导致B
2 B导致A
3 C导致A和B
4 A和B互为因果
5 无因果关系,仅为巧合。


相关性的这5种情况虽然看似清晰,但在一些研究中错误解读甚至得出啼笑皆非结论的事情可谓比比皆是。今天,我们就一起来看看相关性研究结果被误读为啼笑皆非的因果关系的经典案例。

01 A导致B错解读为B导致A

依据相关性研究结果,与非母乳喂养婴幼儿相比,母乳喂养婴幼儿患某些传染病的风险更低,死亡率也更低,世界卫生组织拟定的《婴幼儿喂养指南》建议,需母乳喂养两年或更长时间。

然而,有研究也发现,接受母乳喂养时间更长(>12个月)的婴幼儿,营养不良的风险更高。1997年,来自Johns Hopkins等大学的研究人员,专门就此进行了分析,发现社会经济学地位(socioeconomic status) 较低的家庭,通常住在食物资源非常有限的社区内(如距离市中心、超市较远),因此新生儿会无法得到充足的其他食物,从而更倾向于接受更长时间的母乳喂养。于是出现了这个非常典型的因果倒置的研究。其正确因果关系是婴幼儿健康状况较差导致了更长时间的母乳喂养,而非更长时间的母乳喂养导致了更差的健康状况。

 另外,有糖尿病家族史的人,为了预防糖尿病可能会减少糖和脂肪的摄入,然而他们的糖尿病风险仍然很高。在队列研究中,研究人员如果没有考虑“家族史”这一危险因素的干扰,可能得出“低糖低脂饮食导致糖尿病”的错误的结论。

02C导致A和B错解读为A导致B

对于这一错误,不得不提的一个经典的例子就是:卖出的冰淇淋数量越多,溺水人数就越多。因此,为了防止人们溺水,我们应该禁止售卖冰淇淋。在这个例子中,我们很容易明白其背后的逻辑:夏天到了,气温升高导致卖出的冰淇淋数量增多、也导致了溺水人数增加。

另外一个简单的例子就是:派往火灾现场的消防车越多,死亡的人越多,因此推断出我们应该少派出消防车。其真正的逻辑关系是,火灾越严重,一方面导致派往火灾现场的消防车越多,另一方面导致死亡人数愈多。

这种错误往往是研究者带有非常强烈的愿望找到导致某一疾病的原因。而相关性恰好给了研究者一个错觉,其实两者之间与因果扯不上半毛钱的关系!

03A导致B错解读为A与B没有关系

“健康工人效应”是这方面的一个典型案例。调查发现,在铀矿工作的工人居然与其他人的寿命一样长,有时甚至更长。因此得出结论,在铀矿工作对身体无害。当然这不是真实情况!其实,是因为去铀矿工作的工人都是精心挑选的身强体壮的人,他们的寿命本就该长一些,正是因为在铀矿工作才把他们的寿命拉低到了平均水平。

类似地,有数据表明打太极拳的人和不打太极拳的人平均寿命相同。事实上呢,太极拳确实可以强身健体、延长寿命,但打太极拳的人往往是体弱多病的人。

04 仅为巧合 没有因果关系

例如有人发现,每年美国在科学技术、宇宙航天方面的花费与上吊、窒息自杀的人数的相关系数达到了99.79%。当然,这两件事因为在同一时间发生,拥有相似的增长模式,并不意味这二者必然有因果关系。

如果观察大气层中二氧化碳含量的变化和肥胖症人口数量的变化,你会发现一个非常有趣的现象:在1950年左右,二者都出现了一次非常剧烈的增长。事实上,这些数据背后的真实关系则是,上世纪50年代,汽车产业形成了一定的规模,尾气排放导致大气中的二氧化碳含量陡然增加:同时,人们也更多地用汽车代步,走路的时间越来越少,于是就越来越胖了。

 

相关性研究离因果关系相去甚远 它的价值在哪里?


没错,相关性确实不等于因果性,甚至有时候风牛马不相及。但因此而否认相关性研究存在的意义,那就是矫枉过正了。严谨的相关性研究,自有它的价值。

20世纪60年代,天文学家发现太空的高能伽马射线爆发。但并不知道原因是什么,却是发现这些爆发射线的空间分布与各向同性模型(isotropic model)相关,也就是说,爆发并非来自天空中任意的方向。尽管信息量很有限,这一相关性依然推动了天体物理理论的进步。首先推动了新技术的出现,加上科学家的持之以恒,经过几十年观察后,在20世纪90年代终于找到了原因。原来是一颗巨大的恒星爆炸,然后坍缩成黑洞。这种情况在整个宇宙中偶然才会发生。因此,该相关性研究结果推进了物理模型和太空天文仪器的改进,即便最初没有找到原因。找到因果关系固然可以一步到位,但在许多情况中,由于相关性的指引,进而可为我们找到进一步努力的方向,这一点也非常重要。

大数据时代的来临,更是将相关性研究提高到了前所未有的高度。维克托•迈克尔•舍恩伯格、肯尼斯•库克耶在《大数据时代》中表示:“重要的是要探求‘是什么’而不是‘为什么’,相关关系可帮助我们更好地了解这个世界。” 从逻辑上来说,我们可以把世间的万事万物均理解为不同概率下的相关关联。对于陌生的环境和陌生的领域,我们知道了哪些要素与哪些要素之间存在高度的相关性,我们就建立了对陌生场景的基本认知。当然,我们的认知系统并不是只使用相关性去认知这个世界,实际上还有更多维度的复杂的认知方式。

因此,相关性虽没有因果性那么出色,但依然在给科学进步和技术改进不断贡献力量。

 

寻找因果关系 只能为水中月镜中花?

 从以上分析我们可以看出,有些统计结论虽然荒谬,但数据本身并不会说谎,之所处出现不可思议的结论,是因为我们从数据中挖掘出正确的因果关系,并非易事。

既往很多研究结果只是相关,莫非在科学研究当中寻找因果关系只能为水中月镜中花?为了得到事物之间正确的因果关系,还有什么办法吗?

这是科学研究中一个非常核心的问题,在生物学、医学和心理学当中,人们常常用随机对照试验来挖掘因果关系。此外,研究人员们一直在创造各种新的模型,很多的因果推断理论和方法,用于各种研究之中,如于1965年流行病学家Austin Bradford Hill提出的九大因果推断准则,1973年David Lewis提出的Counterfactual理论、以及现在较新的DAGs理论等。

总之,判断因果关系非常复杂,特别是在现代社会,疾病谱已经从病因单一的感染性疾病、营养不良性疾病为主,逐渐转变成病因更为复杂的肿瘤、代谢性疾病、慢病为主的大背景下,仅仅依据相关性研究结果,既不能轻易得出存在因果关系的结论,也不能轻易否定两因素之间不存在因果关联。

相关性研究结果只是寻找因果关系万里长征重要的第一步!

来源:微信公众号《医粒种子》

评价此内容
 我要打分

现在注册

联系我们

最新会议

    [err:标签'新首页会议列表标签'查询数据库时出现异常。有关错误的完整说明,请到后台日志管理中查看“异常记录”]