1?基因組和基因測序
根據(jù)人類基因組計劃(The Human Genome Project)估計,人類擁有20000-25000個蛋白編碼基因。基因組(genome)指一個生物體所包含DNA的全部遺傳信息。基因組由基因區(qū)域和非編碼區(qū)域組成。人類的基因組大小約為30億個堿基對(bp)(3GB),其中非編碼區(qū)域占到絕大多數(shù),編碼蛋白質(zhì)的區(qū)域僅占約2%左右。
外顯子是基因組中能夠轉(zhuǎn)錄組出成熟RNA的部分。一個基因組中所有外顯子的集合,即為外顯子組(exome)。人類擁有約18萬個外顯子,約占人類基因組的1%,即約3000萬個bp(30MB)。通常所說的全外顯子組測序,是指針對蛋白編碼基因的外顯子,很少涉及非編碼基因。
基因(gene)是DNA中含有特定遺傳信息的一段核苷酸序列的總稱,是具有遺傳效應(yīng)的DNA分子片段,是控制生物性狀的基本遺傳單位。人類基因區(qū)間的大小可從數(shù)百個bp至超過200萬個bp不等。
?

圖:蛋白編碼基因由內(nèi)含子(非編碼序列)和外顯子(包括編碼序列以及UTR區(qū)域)組成。要翻譯有功能的蛋白,要進(jìn)行以下步驟:基因從DNA轉(zhuǎn)錄為RNA前體,通過剪接形成成熟RNA,成熟RNA序列翻譯成氨基酸鏈,以及蛋白質(zhì)分子的翻譯后修飾。圖源:https://www.britannica.com/science/gene
關(guān)于外顯子,需要注意的一個特殊情況是非翻譯區(qū)(UTR)。在mRNA的兩側(cè)分別存在5'UTR(前導(dǎo)序列)和3'UTR(尾部序列),它們的作用分別是調(diào)控翻譯的啟動和終止。它們由外顯子序列構(gòu)成,但不會被翻譯成氨基酸。所以,并非所有外顯子序列都會被翻譯成氨基酸。
?

圖:信使RNA前體(pre-mRNA)中的外顯子。外顯子既包括編碼氨基酸的序列(紅色),也包括不被翻譯的序列(灰色)。?圖源:https://en.wikipedia.org/wiki/Exon
2?全外顯子測序
2.1?簡介
對外顯子組(基因組里的所有外顯子)進(jìn)行測序的方法,即為全外顯子組測序(Whole-Exome Sequencing,WES),也稱為外顯子組測序、全外顯子測序,全外測序等。全基因組測序(Whole-Genome Sequencing,WGS)是對整個基因組進(jìn)行測序。靶向測序(Targeted-sequencing,也稱Panel sequencing)是對選定的基因進(jìn)行測序,通常有幾十個至一千個基因不等。因而,從覆蓋基因組的范圍來說,全基因組測序>全外顯子組測序>靶向測序。全外測序可以視作一種特殊的靶向測序——它靶向的區(qū)域是基因組上的所有外顯子。打個比喻:我們?nèi)ゲ耸袌鲑I菜,菜市場里有豐富多樣的瓜果蔬菜肉類(WGS),任君挑選。我們一般會根據(jù)自己的喜好需求挑選自己喜歡的(WES或者其他定制化panel),如果我們能確定吃飯的客人的喜好,那我們可以直接選擇對應(yīng)的菜品(定制化panel),如果我們不確定客人的喜好,或者吃飯的人多,那我們可能要多選一些菜品,做一大桌,客人喜歡哪個就吃哪個(WES)。
| | | |
| | | |
| | | |
| | | |
| | | |
| SNPs、InDels、CNV、Fusion、SV | | |
(1)SNP: single nucleotide polymorphism,單核苷酸變異; (2)InDels:insertions,deletions,小片段插入缺失; (3)CNV:copy-number variations,拷貝數(shù)變異; (4)Fusion:基因融合; (5)SV:Structural Variants,結(jié)構(gòu)變異,常指的是那些在染色體水平發(fā)生了較大片段(大小至少為50 bp)的變異 |
2.2?WES的優(yōu)勢
科學(xué)家們可以選擇全基因組測序(WGS)或一種更有針對性的方法,只關(guān)注外顯子,即全外顯子測序(WES),和WGS相比,WES在以下三個方面具有優(yōu)勢(1)時間:與WGS相比,進(jìn)行WES需要的時間更少;(2)數(shù)據(jù):與WGS相比,WES產(chǎn)生的數(shù)據(jù)集要小得多,對于生物信息學(xué)分析來說更容易管理;2.3?WES技術(shù)適用的臨床人群
??具有非典型性疾病特征,或經(jīng)過多種醫(yī)學(xué)檢測未查明致病原因的患者。??涉及某一臟器或多臟器綜合征的、臨床表型提示涉及單基因疾病的患者。??不明原因體格發(fā)育遲緩、智力發(fā)育遲緩、多神經(jīng)發(fā)育異常、精神狀態(tài)異常的患者。??患專科疾病反復(fù)發(fā)作久治不愈的患者。
2.4?WES的應(yīng)用方向
人類全外顯子組所占基因組比例不超過2%,但它包含了約85%與疾病相關(guān)的變異,因此在研究編碼基因變異層面,全外測序是比全基因組測序更為經(jīng)濟(jì)高效的替代方法。全外測序適用于孟德爾疾病、腫瘤、復(fù)雜疾病等多個研究領(lǐng)域。對于表現(xiàn)出異質(zhì)性的疾病,或者患者表現(xiàn)出多個系統(tǒng)受累的復(fù)雜疾病癥狀時,尤為適合使用全外測序。?

圖:外顯子組僅占整個基因組的不到2%。圖源:https://www.my46.org/intro/whole-genome-and-exome-sequencing
由于外顯子組僅占基因組的不到2%,WES相比于WGS,能夠減少測序費用、提高測序深度、縮短測序周期,從而以更低的成本檢測到更多的低頻變異。而相對于panel測序,WES有著廣闊得多的覆蓋范圍。(1)例如在腫瘤臨床檢測中,尋求肺癌靶向治療的患者通常會先做panel測序,因為與肺癌靶向治療相關(guān)的基因是比較明確的,幾十至一百多個基因的panel測序通常就可以滿足需求。(2)而對于尋求免疫治療的患者,通常會使用全外或大panel測序,來評估腫瘤突變負(fù)荷(Tumor Mutational Burden, TMB),TMB高的患者通常對免疫治療有更好的響應(yīng)。全外測序是業(yè)內(nèi)公認(rèn)的評估TMB的金標(biāo)準(zhǔn)。(3)在腫瘤方面,除臨床檢測外,WES也適用于類似繪制突變圖譜、探索耐藥機(jī)制這樣的研究場景。(4)全外測序也適用于遺傳疾病檢測。遺傳疾病,尤其是單基因遺傳病(又稱孟德爾疾病),種類多,涉及的基因也多。在OMIM數(shù)據(jù)庫中收錄的單基因疾病已有超過5000種,相關(guān)基因已有近4000個。如果要進(jìn)行一次全面的單基因遺傳病的篩查,全外無疑是全面、方便、合適且具性價比的選擇。(5)如果我們只想檢測常見的某十幾種遺傳病,定制panel來進(jìn)行檢測也是可行的,但全外無疑會更具研究價值。隨著新的疾病及其分子機(jī)制被不斷揭示,需要加入解讀列表的基因會越來越多。如果某人接受過全外檢測,數(shù)年后他想看看自己有沒有攜帶新發(fā)現(xiàn)的致病突變,那么他只需要帶著檢測數(shù)據(jù)請一位遺傳咨詢師為他解讀就可以了,而不用再做一次檢測。從這個角度來說,全外從長遠(yuǎn)來看也是更具性價比的。2.4.1 WES應(yīng)用于孟德爾遺傳疾病
人體基因組中直接參與蛋白質(zhì)編碼的區(qū)域稱為外顯子。人類外顯子組序列包括22000多個基因的180000多個外顯子,雖然僅占人類全基因組的1-2%,但約85%的疾病相關(guān)遺傳突變都在這個區(qū)域,涵蓋了與個體表型相關(guān)的大部分功能性變異。2.4.2?WES應(yīng)用于產(chǎn)前診斷
研究發(fā)現(xiàn),在妊娠過程中,大約2%~4%的胎兒存在明顯的結(jié)構(gòu)異常,目前常用的染色體核型分析和染色體拷貝數(shù)分析技術(shù)只能為20%左右的這類胎兒提供診斷,還有一半以上的病例未能得到有效的診療。大規(guī)模的前瞻性研究表明,在染色體核型和染色體拷貝數(shù)分析均未見異常的胎兒中,產(chǎn)前WES可將結(jié)構(gòu)異常胎兒的診斷率提高8.5%~10%。而且單基因變異在嬰幼兒期疾病中的占比較高,因此產(chǎn)前WES對于部分嚴(yán)重先天性疾病在孕期的診斷可能發(fā)揮重要的作用。2.4.3?WES應(yīng)用于癌癥研究
WES是對基因組外顯子以及周邊區(qū)域DNA進(jìn)行富集捕獲,然后利用二代測序獲得序列信息,最后結(jié)合外顯子公共數(shù)據(jù)庫和生信分析方法來解釋變異與疾病之間關(guān)聯(lián)的一種技術(shù)。同時WES容易實現(xiàn)大于100X的測序深度,因此WES是高效的發(fā)現(xiàn)人類疾病信息的研究手段。目前WES技術(shù)已被廣泛應(yīng)用在多個方面,其中癌癥研究是最熱門、最復(fù)雜、也是全人類最想攻克的難題。下圖是研究腫瘤外顯子的14個分析內(nèi)容,左邊是比較常見的分析點,右邊是比較新穎的分析點,如突變特征分析、腫瘤突變負(fù)荷分析(TMB)、雜合性缺失分析(LOH)、同源重組缺陷分析(HRD)、微衛(wèi)星不穩(wěn)定分析(MSI)、新抗原變異分析(HLA)。2.5?WES的局限性
首先,WES對于涉及拷貝數(shù)變異、非編碼區(qū)變異和結(jié)構(gòu)變異的疾病研究不適用。其次,在對目標(biāo)區(qū)域進(jìn)行捕獲時,存在捕獲不均、捕獲偏差等現(xiàn)象,可通過增加測序深度,獲得更多的序列信息進(jìn)行統(tǒng)計分析,盡可能彌補(bǔ)這些偏差。3?檢測項目介紹
| | |
| 檢測先證者(有癥狀)及其父母樣本中核基因組的20000多個基因以及先證者線粒體基因組,檢測變異類型包括SNV、Indel和CNV。家系全外相較于單人全外能有效排除可能遺傳自父母的非致病位點,更方便分析新發(fā)變異 | 輔助醫(yī)生進(jìn)行罕見病、疑難病臨床診斷或輔助排除遺傳因素 |
| 檢測先證者(有癥狀)樣本中核基因組的20000多個基因以及線粒體基因組,檢測變異類型包括SNV、Indel和CNV,并通過一代測序進(jìn)行父母樣本的疑似致病SNV/Indel變異的驗證 | 輔助醫(yī)生進(jìn)行罕見病、疑難病臨床診斷或輔助排除遺傳因素 |
| 檢測先證者(有癥狀)樣本中核基因組的20000多個基因,檢測變異類型包括SNV、Indel和CNV,并通過一代測序進(jìn)行父母樣本的疑似致病SNV/Indel變異的驗證 | 輔助醫(yī)生進(jìn)行罕見病、疑難病臨床診斷或輔助排除遺傳因素 |
| 檢測先證者(有癥狀)及其父母樣本中核基因組的20000多個基因,檢測變異類型包括SNV、lndel和CNV。家系全外相較于單人全外能有效排除可能遺傳自父母的非致病位點,更方便分析新發(fā)變異。 | 輔助醫(yī)生進(jìn)行罕見病、疑難病臨床診斷或輔助排除遺傳因素 |
??
參考資料:
1.https://www.my46.org/intro/whole-genome-and-exome-sequencing.
2.https://en.wikipedia.org/wiki/Exon.
3.https://www.britannica.com/science/gene.
?
?
?
?
請按如下流程進(jìn)行檢驗項目咨詢:微信搜索“中景醫(yī)學(xué)檢驗”—點擊關(guān)注—點擊公眾號下方“檢驗服務(wù)”—點擊“項目查詢”—彈出公司官網(wǎng)—搜索框輸入項目名稱—點擊“搜索”—查詢項目詳細(xì)信息—聯(lián)系我們的客服熱線:020-82108960,進(jìn)行項目檢驗咨詢。
?
?

掃二維碼|關(guān)注我們
廣州中景醫(yī)學(xué)檢驗實驗室
關(guān)注我們,了解更多動態(tài)