『双盲实验』的前世今生
阎兆珣
编辑于 2023年05月10日 05:05
收录于文集
共6篇

『中医没有双盲实验』是攻击中医的一个重要论点。那么什么叫『双盲实验』?它是什么时候成为西方各国检验药物疗效的金标准的?『双盲实验』的科学性在哪里?或者说,它究竟多大程度上代表真理?这些其实都是要事先搞清楚的大问题。我们不要忘了,在美国对中国进行贸易战之前,『自由贸易』曾经是经济领域的『政治正确』,是西方学术界和政界的主流话语。西方人重复一万遍的话语,并不天然就是真理,我们有必要对其进行彻底的考察和辨析。

前世

之所以提出双盲实验,是因为在止痛剂的评价中,发生了患者吃了假药依然觉得疼痛减轻了的奇迹。假药被称作placebo即『安慰剂』。这个实验现在已经在各个生物统计教科书里介绍,并没有争议,以下援引百度百科的介绍。

https://baike.baidu.com/item/%E5%AE%89%E6%85%B0%E5%89%82%E6%95%88%E5%BA%94/189579

安慰剂效应于1955年由毕阙博士 (Henry K. Beecher)提出,亦理解为“非特定效应”(non-specific effects)或受试者期望效应。一个性质完全相反的效应亦同时存在——反安慰剂效应 (Nocebo effect):病人不相信治疗有效,可能会令病情恶化。反安慰剂效应(拉丁文nocebo解“我将伤害”)可以使用检测安慰剂效应相同的方法检测出来。例如一组服用无效药物的对照群组(control group),会出现病情恶化的现象。这个现象相信是由于接受药物的人士对于药物的效力抱有负面的态度,因而抵销了安慰剂效应,出现了反安慰剂效应。这个效应并不是由所服用的药物引起,而是基于病人心理上对康复的期望。

毕阙博士的研究(1955年)

有报告纪录到大约四分之一服用安慰剂的病人,例如声称可以医治背痛的安慰剂,表示有关痛症得到舒缓。而触目的是,这些痛症的舒缓,不单是靠病人报称,而是可以利用客观的方法检测得到。这个痛症改善的现象,并没有出现于非接受安慰剂的病人身上。

由于发现了这个效应,政府管制机关规定新药必须通过临床的安慰剂对照(placebo-controlled)测试,方能获得认可。测试结果不单要证明患者对药物有反应,而且测试结果要与服用安慰剂的对照群组作比较,证明该药物比安慰剂更为有效(“有效”是指以下2项或其中1项:1)该药物比安慰剂能影响更多病人,2)病人对该药物比安慰剂有更强反应)。由于医生对有关疗程实用性的观感会影响其表现,亦可影响病人对疗程的观感。因此,此药物测试必须以双盲(double-blind)方式进行:医生及病人都不会知道该药物是否安慰剂。

最近亦发现,模拟手术亦会出现相似的现象,所以,有部份的外科手术技术必须进行安慰剂对照研究(极少会以双盲方式进行,原因很明显)。为了使测试得到支持,药物测试群组会比安慰剂对照群组获得更好的待遇。

几乎所有以这个对照方式进行的研究都显示安慰剂对可改善病情。举例:Kahn公布了一项有关抗抑忧药的整合分析(meta-analysis),发现服用安慰剂的群组中出现自杀或企图自杀的情况下降了30%,而服用抗抑忧剂的群组则下降40%。

质疑

所有的『安慰剂』实验都基于『未治愈』的舒缓剂的『主观疗效』。何谓『未治愈』?就是镇痛剂无论多好,都不能解决疾病,只是降低疼痛而已。而『疼痛多少』是『主观疗效』,即患者不说,医生就不知道,而患者自己也并未有定量的标准。疼痛过的人都知道,疼痛这个感觉,是可以定性为疼痛,但是疼痛多少并不是个恒定值,可能早晨多疼些,晚上少疼些,也可能相反,也会受天气影响。那么当医生问患者服药之后疼痛是否减轻,患者需要把服药前的疼痛做个平均,再把最近几天的疼痛做个平均,事实是谁能做得到算平均疼痛度?

如果此药是『治愈』型,即患者接受完治疗后,病彻底好了,根本不疼了,那么根本就不会存在『究竟减少了多少疼痛』的争议,即性质彻底变了,而不是一个只能主观估计的量发生了微调。治愈的案例本身就是随便一种『安慰剂』无法企及的——如果随便一种『安慰剂』都能把病治好,那我们不需要吃药,许愿就够了,或者请巫婆神汉搞个『开光水』喝了就行。

换句话说,即使我们无法解释的『开光水』之类能持续普遍的『治愈』某些病,我们也应该事实求是的承认其疗效。这也是『中医黑』的另一个逻辑错误——他们把自己和现有的某一领域的专家可以解释的事物称为『科学』,不能解释的称为『迷信』,把真相偷换概念为他们可以理解的事物;凡是违背他们的理解,即使救了人,都要像宗教裁判所那样加以迫害。

即使此药不是『治愈型』,如果有一些客观的测量标准,比如高血压、高血脂,可以通过物理或化学的方法无争议的检验,也不存在此『安慰剂效应』发挥的余地。因为『高血压』和『高血脂』的疾病可以通过医院的长期监测得出大样本下的病情指标的整体均值和方差,统计结果本来就可以作为对照,用不着单独找一群只吃假药的病患作对照,这是统计学一开始就讲过的。

现在的问题是,『安慰剂效应』本来是存在于『无法根治』的『舒缓剂』的主观疗效误差,却为了这止痛剂的疗效争议,强行推广到所有药物的治疗效果上,成为FDA、欧盟和日韩等国的金标准。难道是因为发达国家做事更加严谨和科学?这种实验的『双盲』是指受试的病患和给他们发药的医生或护士都不知道发的是真药还是假药,即『双盲』,是真药假药只有药厂代表秘密知道。当然,为了『公正』,药监局的代表也知道。

今生

新冠『神药』瑞德西韦曾经在我国先做了双盲实验,可惜我国的药监局说它效果一般。于是又在美国做了更大范围的双盲实验,终于证明它有疗效。『真相只有一个』——究竟谁在说谎?

『魔鬼在细节中』,实验结果的差异其实源自于实验的设计。随便搜了一下,就发现了原因:

https://www.thepaper.cn/newsDetail_forward_7201845

这份题为《瑞德西韦用于新冠肺炎成人重症患者:一项随机、双盲、安慰剂对照的多中心试验》的报告中介绍,研究团队在中国湖北的10家医院中进行了一项随机、双盲、安慰剂对照的多中心试验。

在2020年2月6日到2020年3月12日,237名患者入组并随机分配到治疗组,其中158名患者接受瑞德西韦治疗,79名患者接受安慰剂治疗,其中安慰剂组一名患者随机退出。

https://www.tmtpost.com/4342210.html

根据《柳叶刀》论文提供的说法,中国试验允许患者同时使用洛匹那韦利托那韦、干扰素和糖皮质激素,但并未透露患者应用其他药物以及中药是否会造成入组排除。

曹彬指,患者此前可使用治疗指南推荐的药物,且试验组和对照组患者用药相匹配,除是否使用瑞德西韦外,没有其他干扰因素。

根据Clinicaltrials.Gov(临床试验数据库。它是NIH下属机构)提供的数据显示,在核酸检测确诊的前提下,中国临床试验入组均为重症患者,即要求出现影像学特征,且血氧浓度低于94%,NIH入组患者并未区分轻、中、重症,仅需满足有影像学证据、血氧低于94%、需要给氧、需要呼吸机四个条件之一,即可入组。此外,中国试验要求入组患者出现症状在12天内,且30天内未接受其他试验性药物治疗,NIH对此无要求。(30天内未接受其他试验性药物治疗是否可以理解为中药入组排除?这也是中国的实验未达到300人的重要原因)

https://www.zhihu.com/question/391627238

中国的研究采取了随机、双盲、安慰剂对照法,患者以2:1的比例随机分配,瑞德西韦组的患者以第1天200 mg,第2-10天100 mg,每日一次的方式静脉输注,而对照组以相同剂量的安慰剂输注10天,但同时允许患者接受背景支持治疗,即同时使用洛匹那韦-利托那韦,干扰素和皮质类固醇。这种试验方法可以最大程度地保证结果的有效性和结论的正确性。

还提到了美国除了NIH做的1063个受试者实验之外,制药公司自己做了揭盲实验(开放标签实验)

而吉利德公司的这次试验,采用的是开放标签试验,意味着研究参与者和研究人员都知道患者正在接受哪种治疗。患者以1:1的比例随机分配至为期5天或10天疗程的瑞德西韦治疗组。

https://www.niaid.nih.gov/news-events/nih-clinical-trial-shows-remdesivir-accelerates-recovery-advanced-covid-19

Hospitalized patients with advanced COVID-19 and lung involvement who received remdesivir recovered faster than similar patients who received placebo, according to a preliminary data analysis from a randomized, controlled trial involving 1063 patients, which began on February 21. The trial (known as the Adaptive COVID-19 Treatment Trial, or ACTT), sponsored by the National Institute of Allergy and Infectious Diseases (NIAID), part of the National Institutes of Health, is the first clinical trial launched in the United States to evaluate an experimental treatment for COVID-19.

Preliminary results indicate that patients who received remdesivir had a 31% faster time to recovery than those who received placebo (p<0.001). Specifically, the median time to recovery was 11 days for patients treated with remdesivir compared with 15 days for those who received placebo. Results also suggested a survival benefit, with a mortality rate of 8.0% for the group receiving remdesivir versus 11.6% for the placebo group (p=0.059).

双盲实验的问题

中国试验的问题有两大方面,一是样本数不够多,特别是对照组的样本数明显偏少,二是并未严格的按照双盲实验的安慰剂标准,而是无论吃瑞德西韦还是不吃的病人都有权选择当时被中国卫建委推荐的三种西药进行治疗。那么很可能迟到假药的病人感觉病情加重了,就要求医生给自己加那三种西药。所以瑞德西韦是在和那三种西药进行竞争,得出的结论是不比推荐的三种传统西药治疗效果好。

问题来了——为何中国的双盲实验要特地做得不标准?也有很多人爆料,当时有很多中药实验组在『抢』受试患者,致使双盲试验最终也没凑齐300人的理想标准。代入患者角度想一下,如果参加中药试验,则不管医生水平如何,至少吃到的是那个医生自己心中最理想的药方,而参加双盲实验,搞不好自己吃到的就是假药(美名其曰安慰剂),最后自己成了对照组里面那个死亡率的分子,这不是拿命来证明美国药有效吗?这是谁出的破主意?

于是,中国的医生做了两大妥协——一是吃到假药的概率由一半降到1/3,即2/3吃瑞德西韦,1/3吃安慰剂;二是并不排斥其它西药的用药。就这样,总共也只找到了237名受试者。

反观美国的实验,其实有两个,药厂自己的实验,连双盲都没做到,而是分了两组,一组给吃5天药,另一组给吃10天药,做对照分析。从纯粹『科学』的角度讲,这简直接近胡闹。但是谁愿意做『科学的』小白鼠?

所幸美国的卫生部NIH的权威够大,终于找到了1063名受试者,应该是一半采用了瑞德西韦,一半给了假药,即实际没有用药,终于对比出死亡率是8.0%和11.6%了,但是p值只有0.059达不到公认的显著标准,于是想办法把治好速度给表现得好些,这就是『后来改了治好标准』的原因,终于得到31%的康复速度改善,p值降到奇迹一样的千分之一以下。但是,具体的实验报告没有公布,就是那个网址的简报是全部数字。

既然NIH不报告具体实验过程,我按照最标准的双盲实验推测,530名受试者吃到的是假药,其中11.6%死亡,61.48人死亡。这个数带了个小数,肯定不对,没办法只好取61死。而吃到的死了533*0.08=42.64人,取证后为42人。这件事既可以认为是为了科学的证明瑞德西韦是治疗新冠的神药,故意杀了61人,也可以打个折扣,认为是故意杀了两者的差值,19人。

原来『严谨』的代价是杀人!我翻开西方医学的实践,看得晕乎乎,居然在字里行间读出了『杀病人』!

双盲实验的真面目

前面已经讲过,『双盲实验』是把止痛剂的主观有效性,硬性推广到所有药物乃至治疗手段上。那为什么要以病人签生死状,一半概率吃假药耽误治疗的代价来推广『科学』呢?

幸好我在人民大学期间,顶着高鸿业的密集批判读全了《微观经济学》。这套东西叫『软性行业壁垒』。大药厂希望医药产业归它们几家垄断,不希望小药厂挤进来,除了增加生物专家外,还有这招——名义上是科学,实际上是恐吓。既然任何一个新药受到政府批准都要经过『双盲实验』,患者都要签试药生死状,那患者一害怕,就不敢在小药厂的新药生死状签字,而去签大药厂的新药生死状咯~ 这一招『法制』与『自由』的组合拳,打得小药厂没辙,打得患者自认倒霉,各安『天命』。

大药厂这么搞以后,越发有钱了,但是万一遥远的东方有一帮人用点树皮草根,就破了他们的治不好病但能卖止疼片的一本万利生意呢?于是铺天盖地的『中医没有双盲实验,不科学是迷信』就来了。数量不少,但是遇到这种人,请把我这篇文章转出去,虽然叫不醒装睡的人,但叫醒了一时受蒙蔽的也行。