撰文 | 存中一贯 DNA测序在微生物群落分析中具有非常重要的作用,然而现在常用的方法很难解决污染问题,污染源一方面可能来自周围的环境,比如皮肤和土壤等,另一方面则可能来源于实验过程,比如DNA提取试剂盒中携带的微生物【1-3】。污染问题会导致微生物群落分析出现不可避免的结果偏离,甚至是得到完全错误的实验结果。 为了在微生物测序数据中检测和去除污染,一些分析原则被用于相关数据处理中,比如出现在对照组中的数据作为污染源去除,或者样品组中低于某个阈值的数据也作为污染源去除【4】。应用类似上述数据处理原则的常用方法有Decontam,microDecon等【5,6】,但这些还是无法避免一些其他的污染源,比如来自相邻样品孔的污染,因此,即使是最完美的步骤也无法保证完全避免污染的出现。 2023年3月16日,来自美国哥伦比亚大学欧文医学中心的Tal Korem和洛克菲勒大学的Liat Shenhav团队联合在Nature Biotechnology杂志发表了他们最新的研究成果,题目是Contamination source modeling with SCRuB improves cancer phenotype prediction from microbiome data ,研究人员发展了一种新的微生物测序数据处理方法SCRuB(Source-tracking for Contamination Removal in microBiomes),能够更准确的区分实验中的污染,获得更精确的微生物组数据,并在癌症分型预测中发挥更多的作用。 SCRuB是一种高效的数据处理方法,其原理是分别将实验组和对照组的测序数据输入,将实验组看作是一个混合数据,包括样本真实数据、环境中的污染数据以及邻近样品孔的污染数据;将对照组看作是环境中的污染数据和邻近样品孔的污染数据。通过数据回溯分析得到最终的实验组数据和对照组数。 为了检测SCRuB方法在数据处理中的作用,研究人员选择了国内环境中不同样本数据进行模拟,同时采用其他三种方法进行比较:microDecon、decontam以及严格将对照组中数据完全作为污染源。当实验中没有出现孔间污染时,后面三种方法比没有去除污染的方法表现好,但即使是非常低水平的孔间污染也会让这三种方法的表现变差,甚至比没有去除污染的方法准确性还要差。以上结果说明了孔间污染对真实结果的影响非常大。而SCRuB方法的准确度在有或者没有孔间污染的情况下表现都很好,除非孔间污染的水平超过50%。 研究人员还对不同方法的测序深度进行了检测,在外源污染以及孔间污染率为5%的情况下,SCRuB方法的测序深度可以达到1000-25000读数,而decontam的测序深度只有1000,这个结果表明SCRuB的测序深度也是几种方法中最好的。 为了继续检测SCRuB在处理孔间污染中的性能,研究人员在96孔板上分别添加了16个孔的细菌,48个孔的Aliivibrio fischeri以及32个空白孔,通过不同的方法处理数据。结果表明,有些孔发生了相邻孔之间的污染,导致对照孔中出现了相邻孔中的微生物,但在处理数据时,其他方法都把对照孔中的微生物认定为污染去除,而只有SCRuB将相应微生物认定为样品组正确数据,所以保持了很高的测序准确性。 研究人员对来自人体的样本也进行了检测,发现SCRuB依然能够有效去除孔间污染,准确分析样本数据,即使所进行的实验步骤中引入了额外的污染,SCRuB依然能够准确区分这些额外污染。 最后,研究人员对不同癌症病人样本进行了检测,发现在通过血液宏基因组学预测肿瘤发生的数据处理中,SCRuB方法表现出对黑色素瘤预测准确性明显高于其他方法,但在预测肺癌以及前列腺癌上,SCRuB的准确性则与其他方法相当,这为黑色素瘤病人预测提供了一种更高的可能性。 总之,本研究建立了一种新的处理微生物群落测序数据的方法,能够更好的从实验组中去除污染造成的数据不准确,但又最大程度上保证了样品信息的完整性,不会因为处理数据时把部分数据认为污染数据而损失掉。
原文链接:
https://doi.org/10.1038/s41587-023-01696-w
制版人:十一
参考文献
1. Salter, S. J. et al. Reagent and laboratory contamination can critically impact sequence-based microbiome analyses. BMC Biol. 12, 87 (2014).2. Weyrich, L. S. et al. Laboratory contamination over time during low-biomass sample analysis. Mol. Ecol. Resour. 19, 982–996 (2019).3. Kim, D. et al. Optimizing methods and dodging pitfalls in microbiome research. Microbiome 5, 52 (2017).4. Nejman, D. et al. The human tumor microbiome is composed of tumor type-specific intracellular bacteria. Science 368, 973–980 (2020).5. Davis, N. M., Proctor, D. M., Holmes, S. P., Relman, D. A. & Callahan, B. J. Simple statistical identification and removal of contaminant sequences in marker-gene and metagenomics data. Microbiome 6, 226 (2018).6. McKnight, D. T. et al. microDecon: a highly accurate read‐subtraction tool for the post‐sequencing removal of contamination in metabarcoding studies. Environ. DNA 1, 14–25 (2019).