近日,大家都在问下面这个信息是不是真的?真是造谣一张嘴,辟谣跑断腿。造谣只要臆想+博眼球即可,而辟谣是要有严谨的数据和逻辑支撑的。特别是要辟以科学论文为基础的谣言,那是要掉层皮的……

可是如果不辟谣,这阴谋论调一夜之间就会传播成百万群体,比当前的疫情还可怕……

算了,看看还有几个还没睡的小伙伴,来来帮个忙,咱们用神文的数据做个生物信息分析吧,用实锤砸向阴谋论者!

由于分析过程比较烧脑,不想看过程的直接看结论:

1.文章最惊掉眼球的发现——4个肽段,并非HIV特有,在多个物种(包括真核生物、原核生物)中都有比对上,which means:也没啥稀罕的;

2.经过比对6种代表性冠状病毒,发现也能找到这些肽段,所以并非新冠独有!而且,绝大部分HIV都未包含前3个肽段,且它们处于HIV的高突变区;(说到这里,是不是论文赖以依存的基石都已近崩塌了呀)

3.再来回答一个问题:这些插入片段是如何自然发生的?这要讲一讲微生物“水平基因转移”这一特殊的能力。额,这个要1-2句话解释清楚实在太难了。

下面开始硬怼,为了雅俗共赏,特有“术语版”和“说人话版”。

来自神秘东方古国印度的“惊天大作”

术语版

1月31日,BioRxiv预印本网站刊登了一篇来自印度理工学院德里分校研究人员的文章:Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag。

该论文声称通过比对2019新型冠状病毒的插入序列,发现有四小段与HIV-1 gp120和Gag蛋白具有相似性。据此,有人声称新型冠状病毒是人工制造的,也有人联想到前一阵抗艾滋病药物可能对抑制新型冠状病毒有效的新闻,病毒与艾滋病病毒有关的谣言四起。

此文章一出学术界哗然,以及有众多遗传学家、生物学家发声批判此文章的哗众取宠与断章取义;最后,2月2日凌晨,该论文的作者之一在BioRxiv回应称将撤回稿件。

一群印度研究人员,在一个未经专业意见审核的网站上,公布了一个不靠谱但很吓人的结论,发现了这次的新冠病毒里面居然有艾滋病病毒的插入序列!

细思恐极!这肯定不能是病毒自己干的啊,这一定是人工合成的,要不然怎么能用治疗艾滋病的药物治疗这个病毒呢?再一想,武汉病毒所可是有最高等级病原安全P4实验室啊,而正好他们去年也发现了另外一种新冠状病毒,这个病毒看来未必是华南海鲜市场的野生动物,也不一定是蝙蝠,很有可能是P4实验室发生了泄漏啊……

科学辨真伪:用数据说话

既然都是搞学术的,那我们就以学术的方式来为大家拆招,一起来看看这篇所谓的”论文“是如何分析科学问题和得出结论的。

术语版

他们收集了NCBI上55株可用的冠状病毒序列,从中选出32株代表性基因组进行了进化树分析,发现与2019-nCoV在序列上最相近的是SARS-CoV。接下来,他们比对了2019-nCoV和SARS-CoV的spike糖蛋白的氨基酸序列,发现在2019-nCoV的spike糖蛋白中存在4个新插入片段。这4个插入片段,在除2019-nCoV外的其他54个冠状病毒基因组中都没有发现。并在全部已公开的28株2019-nCoV基因组中发现这4个插入片段的核酸序列都是保守存在的。

为了鉴定这些插入序列的来源,他们以这4个插入序列的氨基酸序列为输入进行了比对,发现这4个插入片段都在HIV-1中存在。插入片段1-3比对到了HIV-1的gp120基因,插入片段4比对到了HIV-1的Gag基因。但比对到gp120的3个片段分别处于gp120的V4、V5和V1可变区,并且这4个插入片段并不是广泛存在于HIV-1的gp120中,仅限于主要来自非洲和东南亚的特定HIV-1序列。

根据蛋白建模之后他们发现这些插入位点虽然处于非连续位置,但在2019-nCoV的spike糖蛋白中,它们折叠成识别宿主受体的结合位点的一部分。他们推测,这些插入通过形成一个亲水环可能促进病毒和宿主之间的相互作用。

文章认为虽然这些插入片段很短,但4个插入片段都能与不相关的病毒(HIV-1)匹配上,他们认为这不是偶然(原文:This uncanny similarity of novel inserts in the 2019- nCoV spike protein to HIV-1 gp120 and Gag is unlikely to be fortuitous.)直指2019-nCoV存在非自然形成的可能(这跨越天马的想象力!)。

印度科研人员们用这次的新冠状病毒,和之前公布的54种原来就存在的冠状病毒做了比较(类似“大家来找茬”这样的玩法),然后居然发现,这次的新冠状病毒居然独有4个片段是之前没有的。

再进一步分析,这些片段居然是艾滋病病毒独有的,这些特定型别的艾滋病病毒还主要来自非洲和东南亚。

再进一步分析,这些插入虽然不连续,但是可以大大加强病毒的传染能力。

最后得出了时空穿越版的结论:这玩意不是自然形成的!(潜台词:一定是人工合成的,2019-CoV:我真不是人整出来滴;HIV:我惹谁了么?)

辟谣

下面辟谣开始,谢谢我的生信小伙伴们给力的工作:

一、这4个片段为HIV特有么?非也

术语版

针对印度人文章发现的4个插入片段进行分析后发现:

1)4个肽段的长度非常短;

2)将4个肽段序列在NCBI进行比对,发现每段都能比对上多种物种,包括真菌,细菌,果蝇,线虫,疟原虫等。4个肽段比对结果的E value都很高(E value越高说明比对可靠性越差,一般小于0.00001 (10e-5)才认为可信),说明这些序列随机匹配的可能性非常高(图1);

(NCBI比对前100结果统计)

图1:肽段1与NCBI比对结果

这些序列非但不是HIV特有,而且上百个物种,从病毒到昆虫都可能存在。相当于说,所有的狗都有尾巴,你专门拿了一只狂犬病的来说,尾巴只有狂犬病的狗才长。

二、其它冠状病毒没有这4个片段?非也;HIV都包含这4个肽段?也不是!

术语版

1)文章的4个肽段来源于spike protein,将新型冠状病毒的spike protein和其他六个有代表性冠状病毒的spike protein(中东呼吸综合症病毒MERS-CoV, 猪瘟病毒SADS-CoV,03 SARS病毒SARS_CoV_BJ01,03 SARS病毒SARS_CoV_GZ02,蝙蝠来源的Bat_SARS-like_CoV_ZXC21,Bat_SARS-like_CoV_TG13)比较发现:从spike protein进化树来看,和新型冠状病毒2019-nCoV最近源的冠状病毒是一个蝙蝠来源的Bat_SARS-like_CoV_TG13(图2)。

图2:2019-nCoV spike protein与其它冠状病毒spike protein的进化树

通过比较氨基酸序列进一步发现,在这个同源的病毒中,能找到新型冠状病毒的4个肽段,其中肽段2和3完全一致,肽段1有1个氨基酸不一致,肽段4有5个氨基酸不一致(文章中在核酸水平进行了比较)。而2015年分离的Bat_SARS-like_CoV_ZXC21的第1个和第2个肽段与新型冠状病毒的4个肽段具有少量的相似性(第1个有3个氨基酸一样,第2个只有2个氨基酸不一样),剩余的其他病毒序列和这四个肽段差异性较大(图3)。所以,这4个片段并不是2019-nCoV单独特有。

图3:4个肽段在7个冠状病毒spike protein的序列比较

HIV都包含这4个肽段?也没有!what?

文章指出这4个肽段分别在HIV的envelope glycoprotein和gap protein具有同源序列。分析比较四个肽段序列和HIV的envelope glycoprotein(NCBI 414个蛋白序列)和gap protein(NCBI 396个蛋白序列)相似度发现:除了文章中提到的序列以外,绝大部分HIV的蛋白序列都不包含前3个肽段序列(见下表),而且这些序列处于HIV的高变区(图4)。第4个肽段总体还是比较保守,前面4个氨基酸能在另外15个HIV中找到,肽段PRR也能在多个HIV中找到,最后的氨基酸A在文章提到的序列中特异。但是该肽段在细菌噬菌体内能找到完全一样的序列(图4)。

图4:4个肽段在HIV中的序列比较结果

在进化上,文章提到的10个具有肽段1的HIV序列单独为一个进化分支,4个具有肽段3的HIV序列单独为一个进化分支,而这些肽段只是少部分HIV特有,并不是所有HIV共有的序列特征(图5)。

图5:HIV envelope glycoprotein进化树

印度团队的生物信息分析能力太弱,得出了极其不严谨的结论。

三、这些插入片段不可能是自然发生的?那是你不懂微生物的“转基因”

术语版

微生物有种特殊的能力,就是“水平基因转移”。目前已知在阿米巴原虫中存在可能的病毒水平基因转移情况。病毒Mimivirus和Sputnik都会感染阿米巴原虫,但Sputnik需要在Mimivirus已感染的情况下才能够在细胞内增殖,并且Sputnik中有13个与已知基因无相似性、但其中三个却与mimivirus基因相关,说明Sputnik和mimiviru间很可能发生了水平基因转移。(https://www.nature.com/articles/nature07218)理论上,如果病毒同时感染一个细胞,是有可能发生病毒间的水平基因转移的。

蝙蝠是唯一自带飞行动力的哺乳动物,相比于其他哺乳动物,其飞行活动需要消耗大量的能量。在高强度运动下,运动产生大量的自由基在细胞内堆积会破坏DNA结构产生游离的片段DNA。在其他哺乳动物体内,如果免疫系统观测到游离的DNA/RNA会当做入侵信号直接清除。但为了保护自身组织,蝙蝠的免疫系统进化出了对游离DNA较弱的免疫反应,使得病毒可以与之共存。

(https://www.newscientist.com/article/2161942-bats-spread-ebola-because-theyve-evolved-not-to-fight-viruses/)蝙蝠的免疫系统使得数种病毒同时感染同一细胞的情况成为可能。

微生物之间转基因,就像我们互相发个快递一样容易。病毒之间发生基因融合在自然界是普遍现象,只不过之前测序比较少,大部分人不知道。就如没有显微镜之前,我们看不到细菌但不等于没有细菌。少见必然多怪,只凭可见光认知世界是可悲的。

结论

结合以上分析我们可以得出结论:该文章在新冠病毒的S蛋白(刺突蛋白)发现的4个插入片段长度非常短,比对结果随机匹配的可能性很高,且在真核,原核,病毒中都有分布,与其他六种病毒序列相比,和其最近源的是一个蝙蝠来源的病毒(Bat_SARS-like_CoV_TG13)。

对于文章中作者提到的和4个插入片段相似的HIV的序列,我们发现这些序列只是在少部分HIV存在,并不足以严谨科学地支持文章中的结论。

以上论文不严谨,推论无下限,发表不严格,如果有严格的同行评议一定会被拒稿。

题后记

为啥阴谋论总是盛行?

因为简单,过瘾。

特别是夹杂着各种高科技术语的阴谋论,既充实了好事之徒的谈资,更满足了“总有刁民想害朕”的妄想综合症病理需求。

根据统计,突发公共事件总会伴随着谣言的传播。大的公共卫生事件,总会伴随着生物阴谋论的兴风作浪,常见的梗估计大家都看过:注射XX疫苗会引发痴呆和自闭症啊;吃某某食物会引发不孕不育啊;啥啥又是针对某一人种的生物武器啊……但是真相:比如吃野生动物会引发新发传染病,大家反而当成段子,一笑而过。

2019-nCov新型冠状病毒导致的肺炎疫情爆发,从2020年1月23日武汉封城至今已经过去11天,确诊总病例数超过14000例,全民抗击疫情的战斗在全国各地打响,然而在大家众志成城抗击疫情的行动中,“生物战争阴谋论”再掀热议。

从SARS到新冠,“生物战在延续”?

2003年春节,中国出现严重急性呼吸综合征(SARS)。当时的俄罗斯科学家、俄罗斯医学科学院院士Sergei Kolesnikov首次公开了“该病毒不可能在自然界中形成”的说法,并认为该病毒是在实验室由麻疹和腮腺炎合成的。而这一“权威”的言论,无疑为国人怀疑“SARS病毒可能是其他人或别国制造的生物武器”这一推演增添了不少可靠性,其中一个重要原因就是SARS再没出现过。

而后来啪啪打脸的是,科学家在中国的蝙蝠中发现了类似于SARS的冠状病毒,表明蝙蝠可能是该病毒的宿主,也算是为“别国”洗刷了冤屈。

17年后新一轮的疫情再次袭来,阴谋论再次在更“专业”的论文背书之下,引起轩然大波,触动了疫情当前大家脆弱的神经。

当我们在无比揪心武汉新冠时,世界的其他地方面临着不同的际遇以及同样严峻的考验!根据美国CDC网站,从2019年10月到2020年1月25日,估计有1900万~2600万人感染甲型H1N1流感,其中1万~2.5万人死亡;H5N8病毒正在为祸波兰、德国、匈牙利;澳洲山火的肆虐还未停歇;非洲面临3600亿蝗虫的大浩劫;日本在经受猪瘟的洗劫……疫情从来都是人类共同应对的灾难,疫情当前,没有国家乃至个人能独善其身!

比人的病更可怕的是病的人。

相比于瘟疫本身,治疗愚蠢更难,不过最难的是治疗偏执。

量子力学奠基人之一马克斯·普朗克,早在1930年就如实讲:“科学事实的胜利往往并不是通过使反对者们信服,让他们领悟真相,而是因为反对者们最终都会死去,新一代在成长起来的过程中潜移默化地接受了它。”

而科技日报原总编辑刘亚东在微信公众号发表《给武汉肺炎“阴谋论者”进言”》的一段更是一针见血的写出这个问题的真相:“无知不可怕,可怕的是无耻。无知顶多带来固执,无耻才会导致偏执。对偏执的人,无论常识还是理性,都不管用。就像人们常说的,你无法唤醒一个装睡的人!眼下国难当头,中国人需要团结一心,尽快降服病魔。帮不上忙没关系,别添乱就行,尤其不要蛊惑人心,煽动民粹。”

让我们擦亮双眼,理智对待,不信谣、不传谣,众志成城,共克时艰!