在一項新的研究中,來自西班牙巴塞羅那生物醫學研究所的研究人員開發出一種計算工具,它可以識別每種腫瘤類型的癌癥驅動突變。這一發現有助于加速癌癥研究,并提供工具幫助腫瘤學家為每名患者選擇最佳治療方法。相關研究結果于2021年7月28日在線發表在Nature期刊上,論文標題為“In silico saturation mutagenesis of cancer genes”。論文通訊作者為巴塞羅那生物醫學研究所的Ferran Mui?os博士、Nuria Lopez-Bigas博士和Abel Gonzalez-Perez博士。
每種腫瘤---每名患者---都積累了許多突變,但并非所有的突變都與癌癥的發展有關。在這項新的研究中,這些作者開發出一種基于機器學習方法的工具BoostDM,可以評估特定類型的腫瘤中所有可能的基因突變對癌癥的發展和惡化的潛在貢獻。
在之前提供給科學界和醫學界的研究成果中,巴塞羅那生物醫學研究所生物醫學基因組學實驗室已開發出一種方法來確定那些導致癌癥發生、發展和擴散的基因。López-Bigas博士解釋說,“BoostDM更進一步:它模擬了特定癌癥類型的每個基因內可能發生的突變,并指出哪些基因是癌癥過程中的關鍵。這些信息有助于我們了解腫瘤是如何在分子水平上引起的,它可以促進關于患者的最適合療法的醫療決策。此外,該工具將有助于更好地了解不同組織中腫瘤發展的初始過程。”
這種新工具已經被整合到這些作者開發的IntOGen平臺,旨在供科學界和醫學界在研究項目中使用,并被整合到他們開發的癌癥基因組解釋器(Cancer Genome Interpreter)數據庫中,該數據庫更側重于腫瘤醫學家的臨床決策。BoostDM目前正在研究從66種癌癥中分析的28000個基因組的突變譜。BoostDM的應用范圍將隨著公眾可獲得的癌癥基因組的增加而擴大。
建立在進化生物學基礎上的進步
為了確定參與癌癥的突變,這些作者以進化中的一個關鍵概念為基礎,即正向選擇(positive selection)。與那些隨機發生的突變相比,推動癌癥生長和發展的突變在不同的樣本中被發現的數量更多。
Mui?os博士說,“我們開始的前提是,我們只能觀察到一些突變,因為有這種突變的腫瘤細胞會引導腫瘤的發展,我們猜測這些突變與其他可能存在的突變有什么區別。手工進行分析會非常費力,但有一些計算策略可以讓這種分析有系統性地有效地組織起來。”
特定的模型概述了癌癥驅動突變的特征,圖
從這些數據中,他們提出的方法可以了解哪些基因突變的特征有利于癌癥的發展,這些信息對開發新的治療方法是有用的。
為每個基因和癌癥類型建立計算模型
這些作者開發的這種工具已經產生了185種模型,以確定特定類型的癌癥中特定基因的突變。例如,它已經產生的一種模型確定了在一些肺癌中觸發腫瘤發展的EGFR基因的所有可能的突變,另一種模型確定了膠質母細胞瘤(一種影響大腦的癌癥類型)病例中觸發腫瘤發展的EGFR基因的所有可能的突變。
隨著腫瘤測序數據的公開化,它可以被納入該系統,使其能夠在未來幾年為所有癌癥基因生成新的模型。
當一種模型被開發出來后,這些作者可以在一種組織類型中研究癌基因的每個可能突變(在一種稱為飽和誘變的過程中),并確定每個可能突變是否與疾病的發展有關。這個過程產生了一系列關鍵突變,這對癌癥研究和個性化的癌癥醫學以及醫療決策都很有價值。他們已證明,這種預測模型工具BoostDM比實驗方法更有效和準確。
參考資料:
Ferran Mui?os et al. In silico saturation mutagenesis of cancer genes. Nature, 2021, doi:10.1038/s41586-021-03771-1.