TSO500靶向測(cè)序平臺(tái)與軟件間的比較
如圖1a和1b所示,NovaSeq 6000,NextSeq 550,GenoLab M和FASTASeq 300四個(gè)測(cè)序平臺(tái)在SNP和InDel檢測(cè)的靈敏度(sensitivity)方面表現(xiàn)出幾乎一致的結(jié)果,雖然SiNVICT和Mutect2在InDel的calling上有一些細(xì)微差異。FASTASeq 300測(cè)序儀基于SNVer和VarScan2軟件,可以檢出樣本中全部的SNP和InDel突變(sensitivity=100%)。對(duì)于F-score和精確度(precision),SNVer和VarScan2在SNP和InDel檢測(cè)上也表現(xiàn)最好。此外,與ddPCR驗(yàn)證的真集相比,四個(gè)測(cè)序平臺(tái)一致性都比較高,特別是使用SNVer和VarScan2兩個(gè)分析工具(1c)。
Pearson相關(guān)系數(shù)(r)熱圖(圖1d)顯示,在相同的軟件下,不同測(cè)序平臺(tái)呈現(xiàn)出相似的整體性能。隨后,研究者比較了不同測(cè)序平臺(tái)與分析軟件間高置信度變異的檢測(cè)數(shù)量(圖1e),發(fā)現(xiàn)所有數(shù)據(jù)集的一致性高達(dá)93.4%(198/212)。其中,F(xiàn)ASTASeq 300能檢測(cè)到更多的特有突變,特別是通過(guò)SNVer和VarScan2兩個(gè)軟件。
綜上,在SNP和InDel的突變檢出方面,分析軟件間比測(cè)序平臺(tái)間表現(xiàn)出的差異更大,F(xiàn)ASTASeq 300在SNVer和VarScan2軟件下表現(xiàn)更優(yōu)。
一般而言,測(cè)序深度的增加有助于變異檢測(cè)結(jié)果的重現(xiàn)和低頻突變的檢出,但需要更長(zhǎng)的分析時(shí)間、更高的計(jì)算復(fù)雜度以及成本。研究者以突變檢出表現(xiàn)最好的FASTASeq 300測(cè)序平臺(tái)和SNVer以及VarScan2兩款軟件為研究重點(diǎn),比較了不同測(cè)序深度下變異檢測(cè)時(shí)間、內(nèi)存使用、SNP和InDel檢測(cè)靈敏度的差異,期望探索到保證高靈敏度的情況下所需的最低測(cè)序深度(圖1f和1g,結(jié)果表明:至少500x的測(cè)序深度可以保證全部突變的檢出,而VarScan2軟件消耗內(nèi)存更少,運(yùn)行時(shí)間更短)。
TargetSeq One捕獲的cf DNA測(cè)序平臺(tái)與分析軟件的比較
對(duì)于cf DNA樣本,軟件SNVer和VarScan2在SNP和InDel檢測(cè)方面表現(xiàn)出色。F-score, 召回率(recall)和精確度都接近100% (Fig. S2),三個(gè)測(cè)序平臺(tái)NovaSeq 6000,MGISEQ 2000和SURFSeq 5000結(jié)果也很一致。
cell line樣本的分析軟件比較
通過(guò)下載公開(kāi)數(shù)據(jù)集,研究者獲取到3個(gè)乳腺癌和3個(gè)卵巢癌的panel測(cè)序結(jié)果,并使用上述五款軟件進(jìn)行突變檢測(cè),結(jié)果表明:SNVer和VarScan2兩款軟件同樣表現(xiàn)更優(yōu),其檢測(cè)結(jié)果最接近真集。