必要性:
隨著醫(yī)學(xué)項(xiàng)目在范圍內(nèi)的不斷開(kāi)展,基于新一代測(cè)序(NGS)技術(shù)的大規(guī)模基因組數(shù)據(jù)采集已經(jīng)成為重要的研究手段之一。在此基礎(chǔ)上建立起來(lái)的大數(shù)據(jù)平臺(tái),輔以、的健康和醫(yī)學(xué)數(shù)據(jù),將為疾病的診斷與治療,藥物的研發(fā)與個(gè)體用藥,人群的健康保障等臨床與轉(zhuǎn)化醫(yī)學(xué)研究帶來(lái)極大的推動(dòng)。
在大規(guī)模人群中開(kāi)展NGS測(cè)序工作時(shí),樣本的性、可溯源性將會(huì)對(duì)終的大數(shù)據(jù)質(zhì)量產(chǎn)生不可忽視的影響。由于NGS測(cè)序流程的復(fù)雜性(參見(jiàn)下圖,NGS測(cè)序工作經(jīng)典流程),在樣本庫(kù)內(nèi)得到標(biāo)記的樣本,在測(cè)序流程中仍然有一定幾率會(huì)發(fā)生混淆或者污染。根據(jù)上大型測(cè)序中心的估算,隨著測(cè)序樣本量的增加,一個(gè)操作流程完善、工作人員受過(guò)培訓(xùn)的基因檢測(cè)實(shí)驗(yàn)室,仍然有可能產(chǎn)生千分之一左右的樣本偏差。
因此,一種有效卻又成本低廉的樣本標(biāo)記與追蹤手段,在大規(guī)模NGS測(cè)序工作中具有重要的現(xiàn)實(shí)意義。在美國(guó)ACMG(美國(guó)醫(yī)學(xué)遺傳學(xué)與基因組學(xué)學(xué)院)發(fā)布的“臨床實(shí)驗(yàn)室NGS測(cè)序標(biāo)準(zhǔn)”中指明:“相關(guān)實(shí)驗(yàn)室必須采取措施,避免樣本混淆,并能夠隨時(shí)追蹤與確認(rèn)終結(jié)果”。2017年3月,中華醫(yī)學(xué)會(huì)病理學(xué)分會(huì)發(fā)布的“臨床分子病理實(shí)驗(yàn)室二代基因測(cè)序檢測(cè)共識(shí)”中進(jìn)一步闡明:“為確保檢測(cè)過(guò)程中樣本沒(méi)有混淆或污染,可選用多個(gè)SNV位點(diǎn)或其他標(biāo)簽作為樣本身份標(biāo)識(shí)(sample ID),在檢測(cè)前對(duì)每個(gè)樣本進(jìn)行SNV位點(diǎn)信息的測(cè)定,在NGS檢測(cè)后對(duì)上述位點(diǎn)進(jìn)行追蹤,證明沒(méi)有交叉污染”。
同時(shí),一個(gè)大型測(cè)序數(shù)據(jù)庫(kù)中面臨的樣本種類較為繁雜,其中與腫瘤相關(guān)的樣本類型如石蠟包埋切片(FFPE)中提取的DNA、血漿中提取的循環(huán)腫瘤DNA等,均在正確標(biāo)記、追蹤之外,還需在NGS文庫(kù)制備之前,對(duì)其中DNA片段降解程度進(jìn)行有效評(píng)估,從而防止質(zhì)量較差的樣本帶來(lái)的測(cè)序成本損失。
技術(shù)方案:
樣本標(biāo)記與跟蹤目前的主要方案,是從待測(cè)序列(全基因組、全外顯子組、靶向片段等)中選擇若干標(biāo)志性單堿基核苷酸變異(SNV),在樣本入庫(kù)及測(cè)序前,進(jìn)行基于這些位點(diǎn)的等位基因分型,從而確保樣本的收集與使用流程中沒(méi)有發(fā)生混淆。在測(cè)序完成后,再次利用之前這些位點(diǎn)的基因數(shù)據(jù),與測(cè)序結(jié)果進(jìn)行再次驗(yàn)證比對(duì),如果信息一致,即可確認(rèn)樣本正確性,以及測(cè)序覆蓋范圍與數(shù)據(jù)質(zhì)量均達(dá)到標(biāo)準(zhǔn)。
為達(dá)到足夠的區(qū)分效果,SNV需要滿足以下兩點(diǎn)標(biāo)準(zhǔn):1)在待檢測(cè)人群(中國(guó)人群)中具有較高的雜合度與區(qū)分力;2)需達(dá)到一定數(shù)量(30-40個(gè))以在大規(guī)模樣本庫(kù)中仍可區(qū)分所有個(gè)體樣本。根據(jù)這兩點(diǎn)標(biāo)準(zhǔn),國(guó)內(nèi)外人類基因組測(cè)序中心Broad Institute與華大基因均采用了美國(guó)Agena Bioscience公司基于核酸質(zhì)譜MassARRAY®開(kāi)發(fā)的樣本標(biāo)記/追蹤技術(shù)。
該技術(shù)是利用MassARRAY®可以在一個(gè)反應(yīng)中完成40多重SNV分型的特點(diǎn),根據(jù)不同測(cè)序項(xiàng)目目標(biāo)片段,選擇約40個(gè)SNV位點(diǎn)(包括性染色體標(biāo)記位點(diǎn),用于追蹤樣本性別信息),并加入用于樣本降解程度評(píng)估的片段完整性內(nèi)參標(biāo)記,在同一次反應(yīng)中,同時(shí)完成對(duì)樣本的標(biāo)記與質(zhì)控,隨后以報(bào)告軟件自動(dòng)生成檢測(cè)結(jié)果,并整合進(jìn)入樣本庫(kù)相關(guān)數(shù)據(jù)。
根據(jù)樣本庫(kù)與數(shù)據(jù)庫(kù)規(guī)模,MassARRAY®平臺(tái)可采用384格式。在一天內(nèi),該平臺(tái)可完成對(duì)6張384孔芯片(即2304個(gè)樣本)的標(biāo)記/追蹤與質(zhì)控。
利用MassARRAY®強(qiáng)大的定制功能,對(duì)不同的測(cè)序項(xiàng)目可以選取不同的SNV位點(diǎn),整合為新的檢測(cè)組合,因此具有更高的靈活性與針對(duì)性。