
今日,最新一期《自然》雜志如約上線,而登上封面的“癌癥全基因組”則是本期的主題:在本期《自然》雜志上,一共發表了6篇相關的論文。而在Nature Genetics、Nature Biotechnology、以及Nature Communications等子刊上,也有系列論文發表。
那么,是什么樣的研究項目引起了如此的重視呢?具體來看,主導這些研究的是“泛癌癥全基因組分析合作項目”(Pan-Cancer Analysis of Whole Genomes Consortium),而“全基因組”是其中的關鍵詞。過去,很多研究都在尋找哪些編碼蛋白質的基因在突變后會導致癌癥。但事實上,編碼蛋白質的基因序列,僅為人類基因組的約2%。在剩下的98%中有哪些變異可能與癌癥有關,我們尚不是非常了解。而這正是“全基因組分析”的意義所在。
在這個合作項目的主導下,來自全球四個大洲744個組織的科研人員們對2658份癌癥樣本做了全基因組測序工作,涵蓋了38種不同的癌癥類型。此外,來自同一名個體的非癌變樣本也被用于對照。從獲取樣本、保護患者隱私、獲取測序數據、分析測序數據等一系列流程來看,這一研究的工作量極為龐大。而這些努力,也最終帶來了可喜的回報。對于癌癥全基因組,我們有了新的認識。
平均來看,每一個腫瘤基因組樣本里,大約有4到5個驅動癌癥發展的突變,這會給這些癌細胞帶來生存上的選擇性優勢。《自然》的一篇總結性文章里也提到,研究中使用的腫瘤樣本里,很多出現了復雜的DNA重排(17.8%為chromoplexy,22.3%為chromothripsis,這兩個單詞的解釋請見下圖)。相比之下,只有5%的樣本沒有查出驅動性的突變。
第二篇文章里,研究人員們則嘗試從非編碼DNA里尋找癌癥的驅動因素。研究發現了一些全新的癌癥驅動突變,譬如抑癌基因TP53的一段非編碼區里,反復出現了一種突變;而編碼端粒酶的基因TERT的非編碼區,也有會導致其過度表達的突變。這或許會促進癌細胞異常分裂。
第三和第四篇文章側重講的是一些具有特征性的基因組變異。這是啥意思呢?原來當DNA修復出現錯誤,或是接觸到環境里的誘變劑時,都會在DNA里留下一些具有特征性的變化,但這些變化并不好找。研究人員們在大量數據的支持下,找到了97個類似的特征性變化,極大地拓展了我們的認知。
第五篇論文專注于癌細胞的演化。通過比較不同細胞亞群里的突變,我們可以倒推出這些突變出現的先后順序。分析發現在癌癥早期,最常出現的是驅動型突變。這甚至可以在診斷的數年前出現,因此可能對癌癥早期診斷或是生物標志物的開發有著意義。而隨著時間的推移,環境造成的影響會越來越小,DNA修復缺陷造成的影響則會越來越大。
最后一篇論文里,研究人員們分析了1188個轉錄組的數據,發現拷貝數變異仍然是癌細胞中驅動基因表達變化的主要因素,但數百個單核苷酸突變也會影響到周圍的基因表達。此外,癌細胞里的一些突變還會引起轉錄信息的變化,如產生新的蛋白編碼序列等。
數千位科學家們合力帶來的這些突破,讓我們對癌癥基因組有了全新的認識。《自然》同期的一篇報道也指出,目前我們還比較缺乏臨床上與患者的治療和預后相關的數據。這些數據能幫助我們更好地理解這些基因組的信息和癌癥治療之間的關聯。