技术交流
扫描二维码
或添加“GeneGroup003”
获取更多更新资讯
商城订购
扫描二维码
或添加“基因商城(GeneMart)”
手机下单,快人一步
售后服务
扫描二维码
或添加“GeneGroup005”
获取更快速售后支持
揭秘时刻!PacBio VS ONT:谁才是cfDNA检测的优胜者?
背景介绍 分析血浆中细胞外游离DNA (cell-free DNA,cfDNA)已成为不同临床场景中有价值的诊断指标,包括怀孕、癌症和移植。PacBio的测序数据显示,孕妇和癌症患者的血浆中存在大量的长cfDNA,检测到的最长的胎儿源性cfDNA和肿瘤源性cfDNA分别为23.6 kb和13.6 kb。这种长cfDNA分子上的一系列CpG位点的甲基化模式有可能揭示单个cfDNA分子的组织起源,在无创产前检测癌症患者检测中具有潜在的临床应用价值。 基于此,我们已经了解到PacBio SMRT测序在cfDNA的检测上有很好的表现,但目前尚不清楚使用PacBio SMRT测序检测血浆中长cfDNA的最新发现是否可以通过同样是长读长测序的ONT的最新技术实现。 近日,香港中文大学卢煜明教授团队对这两种长读长测序平台用于血浆cfDNA分析的表现进行了系统的比较,再一次证明了PacBio SMRT测序有着更低的错误率和更优异的读取性能,在无创产前检测和癌症相关的临床检测上表现出更大的应用潜力。
方法 1. 使用Covaris S220超声处理人类和小鼠DNA,按长与短DNA片段1:1混合后评估PacBio SMRT测序和ONT纳米孔测序的长度偏好。 2. 分别对不同妊娠期孕妇、乙型肝炎携带者(hepatitis B carriers, HBV)和肝细胞癌(hepatocellular carcinoma, HCC)患者的血浆样品进行cfDNA测序,评估PacBio SMRT测序和ONT纳米孔测序测序表现,包括测序长度、片段末端谱以及基于cfDNA单分子甲基化模式的起源组织分析。 文中所用到的测序平台:Sequel II(PacBio)和PromethION(ONT) 图1. 实验设计 结果 1 使用超声后的人鼠DNA混合物评估PacBio和ONT测序长度偏好 超声处理的人类和小鼠基因组DNA预期的长与短DNA片段的比例为1:1。PacBio和ONT在两种混合物中观察到的长片段和短片段的比例分别约为5:1和2:1,这表明两种平台都表现出对长片段测序的偏好,其中PacBio表现出比ONT更强的偏好,表明PacBio测序更适合测定长cfDNA(表1)。 表1.使用人鼠DNA混合物进行的PacBio和ONT测序的长度偏好评估结果 结果 2 PacBio和ONT的cfDNA测序数据 对于31份母体血浆cfDNA样本,研究人员分别从PacBio和ONT获得中位数为1,309,281(范围:89,586-3,406,954)的高质量CCS数据和中位数为12,570,183(范围:755,935-40,128,142)的ONT数据。PacBio测序的所有高质量CCS数据均可直接用于下游测序长度和末端基序分析,但ONT数据需要额外的生物信息学处理,处理后仅有约1/3的数据可用于下游测序长度和末端基序分析,中位数为4,822,493(范围:208,457-19,003,253)。 2.1 PacBio和ONT数据中cfDNA的长度分布 虽然从PacBio和ONT中都获得了长度超过500 bp的cfDNA片段,但PacBio测序的cfDNA片段比ONT测序的长得多(图2)。例如,对于妊娠晚期母体血浆样品,PacBio中长度超过500 bp、1 kb和3 kb的片段百分比分别为39.3%、23.5%和 2.78%,ONT为4.42%、0.74%和0.10%(图2A)。HBV携带者和HCC患者的血浆样品的测序结果也与图2A结果相似,使用PacBio测序的cfDNA长片段比ONT测序多。 研究人员在孕妇妊娠阶段每隔3月取1次母体血浆样本,在两测序平台上对cfDNA大小进行分析。与PacBio相比,ONT数据中单核小体和二核小体峰较高,但超过400 bp的寡核小体峰更低(图2B,C)。此外,PacBio数据中明显的具有短cfDNA特征的10 bp周期峰在ONT数据中并不明显(图2B)。从ONT中获得的妊娠早期、妊娠中期和妊娠晚期> 500 bp cfDNA片段的中位数百分比分别为4.30%、2.62%和5.37%;而从PacBio获得的>500 bp cfDNA片段的中位数百分比分别为15.5%、16.1%和36.4%(图2D)。从PacBio获得>500 bp的cfDNA片段的百分比均显著高于ONT(P < 0.001,图2D)。这说明同为长读长测序,PacBio比ONT更擅长分析长cfDNA。 图2. PacBio和ONT测序得到的母体血浆cfDNA的长度图谱。 作者还研究了胎儿和母体特异性cfDNA的大小分布,PacBio数据中特异性长cfDNA的比例(图3A,B)比ONT高(图3C,D)。两种测序数据中胎儿特异性cfDNA最长片段分别为23,635 bp(PacBio)和13,989 bp(ONT)。 图3. PacBio和ONT测序得到的母体血浆中胎儿和母体特异性cfDNA的长度图谱。 2.2 PacBio和ONT数据中cfDNA片段末端谱 比较从PacBio和ONT中获得的cfDNA的5 '端核苷酸谱发现,在< 500 bp的cfDNA片段中,C端片段在PacBio和ONT数据中都是最丰富的,紧随其后的是PacBio中的G端、T端和A端片段(图4A)和ONT中的G端、A端和T端片段(图4B)。从500 bp开始,PacBio和ONT数据中C端和T端片段百分比逐渐下降,A端片段百分比大幅上升,G端片段百分比略有上升(图4)。在从ONT中获得的cfDNA的5 '端核苷酸谱中,从1 kb开始有一些噪声,这可能是由于ONT数据中长度超过1 kb的片段数量要少得多,而PacBio测序则能更稳定的检测100-2000 bp的cfDNA(图4B)。例如,从7个孕早期母体血浆样本的ONT测序中获得的> 1 kb的片段总数比从PacBio中获得的片段总数少6倍(即从ONT测序中获得188,270个片段,从PacBio测序中获得1,095,190个片段)。因此,相比于ONT测序,PacBio测序更倾向于测定长cfDNA的序列信息。 根据256个4-mer 5 '端基序的频率进行分层聚类时,PacBio和ONT测序的血浆cfDNA样本形成了不同的聚类(图4C),且存在很强的正相关关系(P < 0.001)(图4D)。进一步检查在PacBio中排名前10位但在ONT中排名11或更低的基序,发现4-mer末端基序CAAA,CCAT,GAAA,GAGAG和GGAA在ONT的结果中更多,而4-mer末端基序CCCT,CCAG,CCAA,GCCT和GCTT在PacBio的结果中更多。 准确的末端检测的意义就在于可以更有利地进行后续分析或疾病诊断,比如有无子痫前期的孕妇患者具有不同的4-mer端基序特征。而PacBio测序更稳定的测序表现表明其在片段末端检测上能发挥更大的作用。 图4. PacBio和ONT测序数据的母体血浆中cfDNA的片段末端谱分析 2.3 用PacBio和ONT数据分析cfDNA的单分子组织来源 当使用31份母体血浆DNA样本的PacBio和ONT数据进行组织来源分析时,PacBio和ONT数据中符合条件的cfDNA片段中位数大小分别为667 bp(IQR: 329-1-288 bp)和462 bp(IQR: 337-728 bp)。与PacBio之前的研究数据相似,ONT数据的单分子来源组织分析确定的胎盘来源的cfDNA百分比也与基于SNP的方法独立确定的胎儿DNA分数强相关(P < 0.001)(图5)。 图5. 基于ONT数据的血浆cfDNA的单分子组织起源分析与基于SNP的方法的相关性分析 研究人员进一步比较了PacBio和ONT在使用HBV携带者和HCC患者血浆样本进行cfDNA组织来源分析时的性能。在HBV携带者和HCC患者中,通过ONT数据进行单分子来源组织分析得出的肝源性cfDNA百分比与PacBio数据得出的结果呈正相关(P < 0.001)(图6A)。对甲基化进行评估发现,HCC患者在PacBio(P < 0.001)和ONT数据(P = 0.0026)中均比HBV携带者表现出明显更高的HCC甲基化评分(图6B)。 图6. 基于PacBio和ONT的数据对HBV携带者和HCC患者的血浆样品中单分子组织起源分析之间的相关性(A)以及甲基化评分的比较(B) 讨论 1. PacBio测序性能更稳定: ①PacBio比ONT更擅长分析长cfDNA。与ONT测序相比,PacBio对血浆中的cfDNA进行测序产生的长cfDNA比例更高(PacBio 5:1;ONT 2:1)。PacBio数据中cfDNA片段长度大于1 kb的百分比是ONT的30倍左右。 ②从cfDNA的大小分布来看,不难注意到具有cfDNA特征的10 bp周期峰在PacBio数据中很明显,但在ONT数据中几乎不可见。这很可能是由于少于150 bp的cfDNA片段被连接到大约80 bp的适配器上,通过纳米孔时快速且不稳定,所以少于200 bp的短适配器连接片段可能无法被ONT有效测序。 ③使用PacBio和ONT的数据都可进行基于单分子甲基化模式的cfDNA的组织来源分析,但PacBio是真正的单碱基实时测序,更加精准。 ④与ONT reads相比,PacBio的CCS reads显示出更低的替换错误率(PacBio为0.8%,ONT为3.4%),使其成为需要准确变异识别的临床应用的更有利平台,例如,单基因疾病的无创产前检测和癌症相关单核苷酸变异的检测。 2. PacBio仪器内部即可进行基本数据处理,下机即可获得高质量HiFi数据: 当使用ONT数据对cfDNA进行长度和末端基序分析时,需要进行额外的测序数据处理步骤,包括两端适配器序列的识别和修剪,以及用软剪辑(soft clips)去除reads以准确确定片段大小和末端。 3. 升级版的Revio通量提升至360 G高质量HiFi数据/24 h,是文中提及的Sequel II的15倍,成本更是低到超乎想象! 浏览原文请点击左下角“阅读原文” 如果您对HiFi测序技术感兴趣, 欢迎与我们联系! 公司简介 基因有限公司作为PacBio公司在中国区的独家代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。