UDI的全稱為Unique Dual Index,譯為雙端唯一標簽技術(shù)。 UMI的全稱為Unique Molecular Identifier,譯為分子條形碼或者分子標簽技術(shù)。 別急,要弄清這兩個概念,還得從二代測序的那些事情說起: 我們都知道二代測序技術(shù)是近十年來曝光率非常高、非常受關(guān)注的基因組分析技術(shù)。以Illumina為代表的測序儀廠商不斷推出更新型號的測序儀,不斷刷新測序通量,但不變的仍是多樣本混合后測序的策略。 要實現(xiàn)對多個樣本同時測序,必須在各樣本PCR擴增階段,往DNA片段上添加一段分子序列作為樣本標簽,這種標簽叫做index。 |
這樣,每個樣本就帶上屬于它的“專屬號碼牌”,在多樣本混合測序后,生信工程師能通過“翻牌”,確定這個“號碼”所代表的就是“尋尋覓覓”的那個“它”。 |
Index一般由8位堿基所組成,常有單端與雙端兩種添加模式,為了增加同時上樣的通量,大家一般在面臨大量樣本同時測序時,會選擇雙端index↓ |
目前常用的雙端index策略是通過少數(shù)幾種index序列排列組合,去實現(xiàn)更多樣本的標簽區(qū)分(如96種),但這種方式一直存在交叉污染的可能。 |
同時,為了進一步提升通量與擴增效率,降低測序成本,Illumina為Novaseq等高通量型測序儀引入了圖案化流動槽(Patterned Flow Cell Technology,PFCT)和排他性擴增(Exclusion Amplification,ExAmp)成簇技術(shù)。這兩個看似美好的技術(shù)卻無意間放大了一種叫做標簽跳躍(index hopping)的樣本標簽錯配的現(xiàn)象,導(dǎo)致科研人員無法正確拆析樣本與數(shù)據(jù)的關(guān)系,最終可能與重大發(fā)現(xiàn)“失之交臂”。 |
為了降低標簽跳躍,Illumina在白皮書[1]中提到可以使用UDI雙端特殊標簽對樣本進行標記,混樣后進行測序。 |
UDI的引入使得文庫兩端的index序列是唯一,且一對一組合的,不存在共用。換句話說,只有兩端帶有完全正確index序列的reads才能進入后續(xù)的樣本分析,從而可以剔除標簽錯配的reads,有效避免樣本之間的數(shù)據(jù)串?dāng)_。 |
一句話總結(jié):采用UDI策略,能更正確拆解測序數(shù)據(jù)與樣本之間的一一對應(yīng)關(guān)系,減小樣本“戴錯號碼牌”的概率。 |
下面再來講講名為分子標簽技術(shù)的UMI: |
UMI的原理就是給每一條原始DNA片段加上一段特有的標簽序列,經(jīng)PCR擴增后一起進行測序。這樣根據(jù)不同的標簽序列,生信人員就能區(qū)分不同來源的DNA模板,分辨哪些是PCR擴增及測序過程中的隨機錯誤造成的假陽性突變,哪些是患者真正攜帶的突變,從而提高檢測靈敏度和特異性。 |
一些需要較高正確度的應(yīng)用,如腫瘤稀有突變分析,常會對5%、甚至1%左右的稀有變異作檢測。這時一旦出現(xiàn)測序錯誤、或者PCR偏差,便會產(chǎn)生大量假陽性結(jié)果,因此需要添加UMI進行校正。 |
一句話總結(jié):做稀有突變檢測、校正測序錯誤與PCR偏差,UMI“勞苦功高”。 |
實際案例 |
① 最近正在研發(fā)腫瘤稀有突變分析的項目; ② 樣本類型主要是FFPE(石蠟包埋樣本)、cfDNA(游離DNA); ③ 起始量大概在幾十ng;④準備自己建庫,然后送樣測序,平臺是Novaseq; ⑤ 由于是剛接觸建庫實驗,不希望操作太復(fù)雜。 我思考了大概1秒鐘,就從我們豐富的DNA-Seq文庫構(gòu)建產(chǎn)品線中找到了一款合適的產(chǎn)品↓ |
為什么說這款產(chǎn)品合適呢?我們來對標幾個需求。 |
需求1:希望操作簡便,不要太繁瑣 |
對標1:ThruPLEX Tag-Seq HV這款試劑盒支持單管、三步操作,手動15 min,全程2 h,無需在建庫過程中轉(zhuǎn)管或純化。 |
我們比較了ThruPLEX HV和K、N兩家公司的試劑盒,只有ThruPLEX是單管操作、時間最短、操作最便捷的系統(tǒng)。 |
所以,無論新手還是老手,都能很快上手! |
需求2:樣本類型為FFPE DNA、cfDNA,起始量大概在幾十ng |
對標2:ThruPLEX Tag-Seq HV支持5-200 ng FFPE DNA、cfDNA起始,input volume為30μl,無需樣品濃縮。 |
需求3:Novaseq測序分析稀有變異 |
對標3:ThruPLEX Tag-Seq HV搭配UDI建庫,可以有效降低index hopping效應(yīng),是高通量型Illumina測序儀的“友好伙伴” |
ThruPLEX Tag-Seq HV莖環(huán)形接頭上還包含7位堿基的固定型UMI,雙端總共可有144種UMI連接到DNA分子兩端,以識別一致序列,減少擴增或者測序錯誤帶來的假陽性突變。 |
再舉幾個例子 |
Takara科學(xué)家采用ThruPLEX Tag-Seq HV對10 ng起始的Quan-Plex Patient-Like ctDNA標準品(AccuRef)構(gòu)建文庫,腫瘤相關(guān)的基因采用IDT xGEN Pan Cancer Panel進行捕獲富集,隨后用UMIs鑒定了ctDNA標準品中特定位點的實際突變頻率。結(jié)果顯示,檢測到的突變頻率分別與預(yù)期1%、5%的等位突變頻率接近,而陰性對照組沒有在位點處檢測到任何突變。 |
同時,為了比較UMI與常規(guī)使用的坐標法之間的效果差異,Takara科學(xué)家先使用未去重或者僅用坐標法去重的文件分析,在預(yù)期的EGFR L858R突變附近觀察到大量的低頻及隨機等位基因頻率突變。而隨后用UMI校正、過濾數(shù)據(jù)后,清除了假陽性突變,得到了預(yù)期的突變分析結(jié)果! |
經(jīng)過幾場對標,我們明確了ThruPLEX Tag-Seq HV能滿足開發(fā)cfDNA/FFPE DNA稀有突變項目的需求。 |
當(dāng)然,若小伙伴們也有同等需求,ThruPLEX Tag-Seq HV定能不負所望。 |
相關(guān)產(chǎn)品推薦:
品牌 貨號 產(chǎn)品名稱
TAKARA R300381 PicoPLEX DNA-seq Kit
TAKARA R300669 SMARTer? PicoPLEX? Gold Single Cell DNA-seq Kit
TAKARA R300671 SMARTer? PicoPLEX? Single Cell WGA Kit
TAKARA R300718 PicoPLEX Single Cell WGA Kit v3
TAKARA R400406 ThruPLEX DNA-seq 48D Kit
TAKARA R400428 ThruPLEX DNA-seq 12S (48)Kit
TAKARA R400523 ThruPLEX DNA-seq 6S (12 )Kit
TAKARA R400492 ThruPLEX Plasma-seq 96D Kit
TAKARA R400586 ThruPLEX Tag-seq 96D Kit
更多TAKARA相關(guān)產(chǎn)品,歡迎進店咨詢!