英國《自然》雜志8日在線發表了一項人工智能及生物技術研究:科學家報告了一種方法,可通過機器學習對致病基因變異實現精準且可預測的編輯。這項成果為研究遺傳疾病,開發潛在療法提供了新的可能性。
雖然CRISPR-Cas9徹底改變了用于研究的基因組編輯技術,但目前認為,保證這項技術的準確性尤其重要。
CRISPR-Cas9基因組編輯常用DNA“模板”來確保DNA修復的準確性,或將特定的DNA序列導入基因組中。因此,缺少這些模板的DNA修復常被認為不夠準確。
現在,美國布列根和婦女醫院及哈佛醫學院科學家理查德·舒爾伍德及同事,發明了一種用機器學習預測基因組修復結果的方法,實現了精準的無模板Cas9編輯。研究團隊用一個含有近2000對Cas9向導RNA(gRNA)和人體DNA靶點的數據庫,訓練了一個名為inDelphi的機器學習模型。
經該模型識別,5%—11%靶向人體基因組的Cas9向導RNA能在超過50%的情況下(被稱為“精準-50”)產生單一且可預測的修復結果。inDelphi還能利用無模板Cas9編輯識別并預測出合適的致病基因變異靶標,包括一些曾被認為無法用該方法找到的靶標。
最后,研究團隊通過實驗證明,人體細胞中與赫曼斯基—普德拉克綜合征(HPS、白化病綜合征的一種)、Menkes病(又稱毛發灰質營養不良)以及家族性高膽固醇血癥這三種疾病有關的近200種致病變異,其編輯和修復的準確性都能達到精準-50的標準。
研究人員表示,這一結果建立了一種實現精準、無模板基因組編輯的方法。(記者張夢然)
標簽: 機器學習