2月2日,拜登总统公布了一项在未来25年内将癌症死亡率至少降低50%的计划。
这个计划到底是怎样的我并没有关注,倒是《纽约时报》报道这个新闻时引用的德克萨斯大学安德森癌症中心(University of Texas M.D. Anderson Cancer Center)的生物统计学家唐纳德·A·贝里(Donald A. Berry)的话引起了我的注意。
在过去的几十年中,癌症要早检查早治疗的概念似乎已经深入人心。但贝里说,提高癌症治疗效果,更多的筛查并不是答案——除了结肠癌和宫颈癌,其它癌症的筛查到底是给我们带来益处还是害处是有争议的。
比如,乳腺癌的死亡率的确下降了。但最主要原因是治疗的改善,甚至可能全部都归功于治疗手段的进步。“每个人都喜欢早期检测,但它是附带危害的。我们已经知道附带的危害是什么,而我们并不确定知道筛查带来了好处。”
什么?除了结肠癌和宫颈癌,“我们并不确定知道筛查带来了好处”?此话怎讲?
对癌症的筛查有可能造成过度诊断和过度治疗
贝里并不是唯一这样质疑筛查的人。
早在十多年前,就有人对癌症的筛查和治疗方向是不是对的提出质疑,后来有越来越多的癌症医疗工作者或生物统计学家加入这个行列。如果读者留心过美国癌症协会制定的预防和早期检测癌症的指南,就会发现乳腺癌、前列腺癌和肺癌等的筛查适龄范围越来越窄了,比如把定期做肠镜检查的年龄挪后了,把乳腺癌检查的年龄拖后、次数减少等。前列腺癌干脆不提倡普遍筛查了,只是特定群体才需要做,完全个性化。
遗憾的是,很多人没有明白这并不是为了费用最优化,而是这个范围之外的人做筛查的话,害大于益。贝里的观点则是更近一步,他认为更新后的指南范围内的筛查,可能还是害处大于益处。为什么这样说,我们不妨来看一个具体例子。
韩国1999年开始的一项国家癌症筛查计划为几种常见的癌症提供免费筛查,而甲状腺癌筛查作为一种廉价的附加项目也被广泛提供。因此,接受甲状腺癌筛查的韩国人数量激增。2011年,有4万韩国人被诊断出患有这种疾病——是那里每年死于这种疾病的人数的100倍以上。新增加的病例几乎全部是甲状腺乳头状癌。这是一种没有症状的早期癌症,发现于约三分之一的成年人中。
按照癌症筛查的理论,早检查早发现可以帮助降低该癌症的死亡率。以理想情况考虑,应该是下面这样的图表:开始筛查后,发现的病例会有一个大幅上升期,然后趋于平稳。死亡人数应该逐渐减少,但与发现病例的时间线比有一个滞后现象。(橙色线代表发病率,绿色虚线代表死亡率。)
但事实完全不是这样。下图所示为发生于韩国的实际情况。结论是:(1)很少有人死于甲状腺癌。(2)早发现和早治疗对死亡率没有任何影响。(图中橙色虚线为甲状腺乳头状癌发病率,实线为所有甲状腺癌发病率。可见绝大部分甲状腺癌是甲状腺乳头状癌。)
这种现象并不局限于韩国。自1975年以来,美国的甲状腺癌发病率几乎增加了两倍,而死亡率没有任何变化。
一个普遍现象是,随着技术的不断改进,我们检测癌症的能力不断提高。但是这些额外的病例中,大多数是类似甲状腺乳头状癌这样的病例,它们从未对人的生命构成威胁。研究人员对此有一个名称——过度诊断,它导致了另一个问题——过度治疗。体现在甲状腺癌上就是大多数被诊断的人通过手术切除他们的甲状腺,并且必须在他们的余生中服用激素。
不同计算死亡率的方法会造成同样的数据完全不同的解读
四、五十年前人们是谈癌色变,因为基本上没听说有人在发现癌症之后还能活个年把的,大多是一年左右就离世了。而现在存活过十年、二十年、三十年甚至更久的多得是,也就是说存活率在这几十年显著提高了。
本文前面提到生物统计学家贝里说乳腺癌死亡率的下降,有可能完全归功于治疗手段的进步,而不是筛查。我们知道这几十年来乳腺癌的筛查越来越普遍,我们身边被早诊断早治疗后一直存活的人比比皆是,为什么他会认为筛查有可能没有帮助呢?
为了理解这个问题,我们有必要审视一下医学界比较普遍用的生存率或死亡率的概念。
生存率一般是指癌症病人被确诊后在某个年限依然生存着的概率。假设某年总共有100个人被确诊为某种癌症,一年后所有人都还都活着,那么可以说这种癌症一年的生存率是100%。假设五年后95人还活着,那五年的生存率就是95%,以此类推。这是医疗界普遍的算法。用同样的方式也可以换算成死亡率,那么确诊一年后的死亡率是0,五年的死亡率是5%……请注意,这里的基数是所有被确诊的人。
但是,还有另外一种计算死亡率的方法:以总人口数为基数。
随着筛查的普及,美国乳腺癌的生存率迅速提高,数字好得惊人。但是,大概是十年前,我从一篇文章里读到,一位美国癌症专家说,如果看美国每年死于乳腺癌的人数在美国总人口的占比,那个数字几十年始终没变!
这等于是说,早检查早发现并没有救下更多的人。正是当人们开始从这个角度去查看死亡率时,才意识到,当初那个以所有被确诊病人为基数的死亡率很有误导性,不是一种好的判断方法。
只是,如何解释生存率的提高呢?
同样的癌,未必真正相同
人们早期对癌症的认识是,凡是癌细胞就一定会异常复制,并不可避免地扩散到身体的其他部位,最终杀死人。
后来随着癌症遗传学和肿瘤生物学的进步,人们懂得了癌症是光谱形式的多种疾病。在光谱的一端是那些从一开始就具有侵略性和侵入性的癌症,而光谱的另一端是那些始终保持非侵入性,因此无害的癌症。只是现在我们还无法判断单个癌细胞在光谱中的位置。
十多年前,美国癌症专家中有人提出了这样的概念:假设癌症是一种必须关起来的动物,如果动物逃走了病人就死了。在光谱一端的那种无害的,几乎不发展或发展极其缓慢的癌症就像是乌龟,只要偶尔关注一下就不会构成逃跑风险;然后光谱中间部分的癌症就像兔子(最早是用熊来比喻,后来改用兔子),会到处乱串,但如果发现及时,还是可以靠一定手段,比如围个栅栏,将其限制住;再有就是光谱另一端的极具侵略性的癌症,从一开始就很致命,像是根本无法抓住的鸟。
如此说来,鸟类癌症我们现在还没能力治,乌龟类癌症不需要治,只有兔子类的才需要积极治疗。按理,我们只需要去筛查兔子类癌症。但因为我们无法辨别癌细胞在光谱中的位置,我们现在就什么都筛查,也什么都治。
如果治疗的结果是,某个癌症每年以人口总数为基数的死亡率维持不变的话,就可以下结论,我们治疗成功的都是乌龟,不是兔子。而这也正好解释了生存率的提升。
为什么乳腺癌和前列腺癌生存率极大地提高了,却说筛查没有作用?
因为乌龟类癌症本来就不会要人的命,这样的癌症病人可以活很长。那么,筛查越推广,乌龟类病人就发现得越多,哪怕治疗技术没有改进,整体癌症病人的生存率也会越来越高,但很可能是治了不该治的病人。
要真正辨别出生存率的提高是因为治疗效果的提高,还是因为包括了更多的乌龟类病人,还是两者兼而有之,是一件非常难的事情。这就是统计学面临的挑战。就好像前面说的,生存率的设计不合理就会产生错误的解读。要搞明白到底效果来自哪里,需要有高质量的数据来源,还需要有高水平的统计分析。
说乳房癌筛查对延长病人寿命几乎没什么帮助来自于两个观察。
第一个观察是,以总人口数为基数的每年死于乳房癌的死亡率,在开始筛查后的几十年内一直没有变。后来随着癌症治疗技术的改进,这个死亡率下降了。但是第二个观察还是否定了筛查的效果——自开始普及乳房X光检查后的几十年里,初次确诊时就是转移性乳腺癌的妇女的比率始终没有下降过。
如果筛查中有抓到兔子,初次确诊的转移性乳腺癌的比率应该下降,因为它们被更早地发现了,在还没有转移时就发现了。现在的结果告诉我们,筛查抓住的都是乌龟类癌症。
这同时也告诉我们,乳腺癌生存率的提高是因为治疗手段的改进,而不是因为筛查。
同样道理,数据还告诉我们,患有最具侵略性的前列腺癌的男性,也没有被筛查拯救。
是不是查一下总比不查好?
查一查总没坏处是人们的普遍思维。但真的是这样吗?我们让数据说话。
上图为乳房X光检查效果图,以每1000个人检查来看效果。不同年龄组的效果不同。在40到49岁组,每1000人中将有0.1到1.6个人获益,即可能因为这个筛查而被救。但同时这1000人中可能会有高达11人接受了不必要的治疗,60到80人接受了不必要的活检,510到690人得到假阳性报告。高龄组的效果相对好些,在60到69岁组,可能有0.5到4.9的人会被救,同时假阳性也少些。
前列腺癌的筛查效果也并不更好(见下图)。以55到69岁组为例,每1000个筛查的人中,获益的仅为0到1人,而其中会有2人遭遇严重的心脑血管事件,还有近百人会发生尿失禁或性障碍等副作用……
我们不妨做个假设来看看癌症患者张三可能的两种活法。
活法一:张三75岁时被发现患癌,两年后不治而终,存活了2年。终年77岁。
活法二:张三50岁筛查时确诊癌症,治疗后生存了20年,终年70岁。
如果以查出癌症后存活的年数算,显而易见,第二种活法的张三多存活了18年。但是第一种活法的张三不仅寿命更长,而且生活质量可能也更高。但是,为什么会有第二种活法的可能性呢?
就医学上来讲,要知道一个人的真正死因,唯一可靠的方法是尸解。这也就是为什么破案都要靠法医的尸解结论。有医生说现在绝大部分人的死因是不准的,只是医生估计是死于这个原因。到底是不是,不做尸解是没有人能真正下结论的。
几十年前,医院会定期对部分死者做尸解,所以那时的死亡原因还比较准确。现在则是基本上不做尸解了,所以死亡原因也越来越不准。甚至有学者推断现在70%以上的死因是不准确的。
大概是十年前我读到过一个瑞士的研究报告报道,那是一个花了几十年时间跟踪癌症患者的研究,并在病人死后对每一个人做了尸体解剖。结论是,总体来说,癌症治疗稍稍缩短了病人的寿命。很多人虽是死于心脏病,其实是病人的心脏在癌症治疗中受损太过,真正的死因是癌症治疗。
这是一个非常经得起推敲的研究,因为数据绝对严格、可靠,唯一的不足是样本的量比较小。遗憾的是,我现在找不到这个报告的相关信息了。但是,化疗、放疗极其伤身实在是众所周知的事实,所以,说治疗会缩短寿命也是大家已经普遍理解的常识。
考虑到所有这些因素,就很难说查一下总没有坏处了。尤其是前列腺癌或乳房癌筛查,被查出来的人大概率是不需要治疗的。更何况现在还发现有些被筛查抓出来的癌症实际上可能会自行消失或自动灭绝。
人是感性动物,有时候不那么愿意接受冰冷的数字
纽约市前市长鲁迪·朱利安尼(Rudy Giuliani)在担任纽约市长期间被检查出前列腺癌,他后来在公开场合多次号召大家都去筛查,说他就是筛查的获益者,被救了一命。我当时对着电视嘀咕了一句:谁知道你到底是被救了还是被害了。
但是,人是感性动物,有时候不那么容易接受冰冷的数字。只有当你以统计学家的眼光来看,筛查的弊端才会显现。
当美国预防服务工作组(U.S. Preventive Services Task Force,简称USPSTF)在2009年更新其指南,不再建议所有40多岁的妇女做乳房X光检查,而是在与医生讨论后视每个人情况而定后,许多妇科和放射科医生指责该小组,说它专注于统计数据而不是一个个女人。一些人还批评说,该小组居然没有包括任何乳腺肿瘤学家。但这正是关键所在。如果不检查整个人群的统计数字,根本就无法区分筛查的危害以及它的好处。
正是在分析了统计数据后,USPSTF在大概10年前就停止推荐常规的前列腺癌筛查,美国泌尿外科协会和美国癌症协会也呼吁做个性化的决定,而不是对所有人进行全面的筛查。一些指南要求每两年而不是每年做一次乳房X光检查,以减少危害。
有意思的是,本文开头提到的《纽约时报》的文章出来后,我送了几个微信群,并特别指出生物统计学家贝里说的那几句话后,某个群里有人就特别不满于贝里根本不是医生,只是个统计学家。但这才是关键啊!医生不一定擅长分析数字,没有专业人物把关,很可能出差错。
还有一个非常重要的方面:我们也不能忽略了医疗界很可能有其利益驱动。
结 语
最后必须特别强调,生物统计学家贝里说的是,除了结肠癌和宫颈癌,其它癌症的筛查到底是给我们带来益处还是害处是有争议的。就是说,并不是所有研究人员意见都是一致的,认为筛查有效的有,认为筛查无效的也有。
统计学是个很容易出错的学科。稍微有一个条件没控制好,或者是没意识到需要控制某个条件,数据的解读就可以偏十万八千里。我们从本文中分析的两种死亡率就可看见一斑。
本文的目的只是为读者提供一些信息,因为我相信很多人对这方面的争论细节不了解。如果是在认真考虑筛查一事的,多知道,多了解一些相关内容不是坏事。而且我们要避免一种倾向,即多做总好过少做。有时候真不是这样。
如果有人认为过度治疗只是缩短了一点点寿命,兴许自己就是那个千分之一、万分之一的被筛查救了命的人呢,那可就什么都值了!这倒也是一种选择。在医学还不能给我们完美答案时,我们的选择也只能是有很多局限的,甚至是仁者见仁,智者见智的。
我只是想说,在决定做筛查之前,做个知情者,就像美国癌症协会所倡导的那样。
参考资料
https://www.nytimes.com/2022/02/02/us/politics/biden-cancer-moonshot.html
https://fivethirtyeight.com/features/the-case-against-early-cancer-detection/
https://www.womenshealthcouncil.org.nz/Womens+Health+Issues/Diagnosing+Cancer+-+turtles+birds+or+rabbits.html