作者 / Shekoofeh Azizi,Google DeepMind 研究科學(xué)家、研究主管;Bryan Perozzi,Google Research 圖挖掘資深研究科學(xué)家
我們很榮幸發(fā)布與耶魯大學(xué)合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),這是一個(gè)新的 270 億參數(shù)基礎(chǔ)模型,旨在理解單個(gè)細(xì)胞的 "語言"。C2S-Scale 建立在 Gemma 開放模型系列的基礎(chǔ)上,代表著單細(xì)胞分析領(lǐng)域的新前沿。
此項(xiàng)成果的發(fā)布標(biāo)志著 AI 在科學(xué)領(lǐng)域取得了新的里程碑。C2S-Scale 針對癌細(xì)胞行為提出了一個(gè)新穎的假說,并且后續(xù)已經(jīng)在活體細(xì)胞中的實(shí)驗(yàn)證實(shí)了這一預(yù)測。這一發(fā)現(xiàn)為開發(fā)抗癌療法開辟了一條具有前景的新途徑。
此次發(fā)布的模型建立在我們今年早些時(shí)候的研究成果上,我們當(dāng)時(shí)證明了生物模型遵循明確的規(guī)模定律 (Scaling Law)。就像在自然語言領(lǐng)域一樣,越大規(guī)模的模型在生物學(xué)任務(wù)中表現(xiàn)越出色。這項(xiàng)研究提出了一個(gè)關(guān)鍵問題: 更大規(guī)模的模型只是在現(xiàn)有任務(wù)中表現(xiàn)更好,還是可以使其具備全新的能力?規(guī)模化的真正意義,在于創(chuàng)造新想法,以及探索未知。
C2S-Scale 27B 的工作原理
癌癥免疫療法的一個(gè)主要難題在于許多腫瘤屬于 "冷腫瘤",難以被人體的免疫系統(tǒng)識別。使這些腫瘤細(xì)胞變 "熱" 的關(guān)鍵策略是通過被稱為抗原呈遞的過程,迫使腫瘤細(xì)胞發(fā)出能夠激活免疫反應(yīng)的信號。
我們給新的 C2S-Scale 27B 模型布置了一個(gè)任務(wù): 找到一種充當(dāng) "條件放大器" 的藥物,這種藥物只在特定的 "免疫激活環(huán)境" 中增強(qiáng)免疫信號,在這種環(huán)境中本身已經(jīng)存在低水平但不足以自行誘導(dǎo)抗原呈遞的干擾素 (一種關(guān)鍵免疫信號蛋白)。要完成此任務(wù),需要一定程度的條件推理能力,而這種推理能力似乎是模型規(guī)模擴(kuò)大后呈現(xiàn)出的新能力;我們通過較小規(guī)模的模型無法解析出這種依賴特定環(huán)境的效應(yīng)。
為了實(shí)現(xiàn)此目標(biāo),我們設(shè)計(jì)了一個(gè)雙重情境虛擬篩選來尋找這種特定的協(xié)同效應(yīng)。虛擬篩選包括兩個(gè)階段:
免疫激活環(huán)境: 我們?yōu)槟P吞峁┝司哂型暾[瘤-免疫相互作用和低水平干擾素信號傳導(dǎo)的真實(shí)患者樣本。
免疫惰性環(huán)境: 我們?yōu)槟P吞峁┝巳狈γ庖攮h(huán)境的分離細(xì)胞系數(shù)據(jù)。
隨后,我們模擬了超過 4,000 種藥物在這兩種情境下的效果,并要求模型預(yù)測哪些藥物只會在免疫激活環(huán)境中促進(jìn)抗原呈遞,從而使篩選結(jié)果與患者相關(guān)的環(huán)境更接近。在模型篩選出的眾多候選藥物中,一小部分 (10-30%) 符合條件的藥物已出現(xiàn)在先前的文獻(xiàn)中,而其余的候選藥物則在意料之外,此前并未發(fā)現(xiàn)它們與本次篩選目標(biāo)有任何關(guān)聯(lián)。
從預(yù)測到實(shí)驗(yàn)驗(yàn)證
該模型的預(yù)測結(jié)果清晰明了。它識別出名為 silmitasertib (CX-4945) 的激酶 CK2 抑制劑擁有顯著的 "環(huán)境分離" 能力。該模型預(yù)測,在免疫激活環(huán)境中應(yīng)用 silmitasertib 時(shí),抗原呈遞急劇增加,但在免疫惰性環(huán)境中收效甚微。這個(gè)預(yù)測之所以如此振奮人心,是因?yàn)檫@是個(gè)十分新穎的觀點(diǎn)。雖然 CK2 與許多細(xì)胞功能有關(guān),包括作為免疫系統(tǒng)的調(diào)節(jié)劑,但文獻(xiàn)中尚未提到過通過 silmitasertib 抑制 CK2 來顯著增強(qiáng) MHC-I 表達(dá)或促進(jìn)抗原呈遞。這表明,該模型產(chǎn)生了一個(gè)可檢驗(yàn)的全新假說,而不僅僅是重復(fù)已知的事實(shí)。
然而,預(yù)測只有在臨床應(yīng)用中得到驗(yàn)證時(shí)才有價(jià)值。真正的檢驗(yàn)首先需要在實(shí)驗(yàn)室進(jìn)行,最終才能走向臨床實(shí)踐。
在該項(xiàng)目的下一階段,我們將這一假說帶到實(shí)驗(yàn)室,并在人類神經(jīng)內(nèi)分泌細(xì)胞模型中進(jìn)行了測試。這種細(xì)胞類型從未出現(xiàn)在模型訓(xùn)練過程中。實(shí)驗(yàn)證明:
單獨(dú)使用 silmitasertib 處理細(xì)胞對抗原呈遞 (MHC-I) 沒有影響。
單獨(dú)使用低劑量干擾素處理細(xì)胞的效果有限。
而使用 silmitasertib 配合低劑量干擾素處理細(xì)胞使抗原呈遞產(chǎn)生了顯著的協(xié)同擴(kuò)增。
值得注意的是,在我們的實(shí)驗(yàn)室測試中,silmitasertib 和低劑量干擾素的組合讓抗原呈遞顯著增加了約 50%,這使免疫系統(tǒng)更容易識別腫瘤。
該模型的計(jì)算機(jī)模擬預(yù)測結(jié)果在體外實(shí)驗(yàn)中多次得到證實(shí)。C2S-Scale 已成功識別出一種全新干擾素條件放大器,揭示了一個(gè)使 "冷" 腫瘤變 "熱" 的潛在新途徑,并可能使免疫治療產(chǎn)生更佳的反應(yīng)。雖然這只是初步的嘗試,但它為開發(fā)新的聯(lián)合療法 (即多種藥物協(xié)同使用,以實(shí)現(xiàn)更強(qiáng)效果) 提供了經(jīng)實(shí)驗(yàn)驗(yàn)證的強(qiáng)有力方向。
這一結(jié)果也為新的生物學(xué)發(fā)現(xiàn)方法提供了可參考的藍(lán)圖。它表明,通過遵循規(guī)模定律并構(gòu)建像 C2S-Scale 27B 這樣更大的模型,我們可以創(chuàng)建出足夠強(qiáng)大的細(xì)胞行為預(yù)測模型,使其運(yùn)行高通量虛擬篩選,發(fā)現(xiàn)基于特定情境下的生物學(xué)現(xiàn)象,并生成具備生物學(xué)基礎(chǔ)的假說。
目前,耶魯大學(xué)的團(tuán)隊(duì)正在探索本文中發(fā)現(xiàn)的機(jī)制,并在其他免疫環(huán)境中驗(yàn)證 AI 生成的其他預(yù)測。通過進(jìn)一步的臨床前和臨床驗(yàn)證,這些假說有望加速新療法的研發(fā)。
開始使用 C2S-Scale 27B
新的 C2S-Scale 27B 模型及相關(guān)資源現(xiàn)已可供研究人員使用。誠邀您探索這些工具,在我們研究的基礎(chǔ)上持續(xù)創(chuàng)新,共同探索生命的語言。
-
Google
+關(guān)注
關(guān)注
5文章
1799瀏覽量
60143 -
AI
+關(guān)注
關(guān)注
89文章
37535瀏覽量
293277 -
模型
+關(guān)注
關(guān)注
1文章
3627瀏覽量
51613
原文標(biāo)題:C2S-Scale 27B 模型: AI 解碼 "細(xì)胞語言",發(fā)現(xiàn)癌癥療法新途徑
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
FD40-110S48B3C3 FD40-110S48B3C3
FD30-36S18B3(C) FD30-36S18B3(C)
FD50-110S48B3C3 FD50-110S48B3C3
FD50-18S15B3C2 FD50-18S15B3C2
FD30-110S48B3C3 FD30-110S48B3C3
FD20-36S24B2C5 FD20-36S24B2C5
FD50-110S48B3(C)3 FD50-110S48B3(C)3
FD50-48S09B3(C) FD50-48S09B3(C)
FD50-18S15B3(C)2 FD50-18S15B3(C)2
FD20-110S40B3C3 FD20-110S40B3C3
FD12-36S24B2C5 FD12-36S24B2C5
PFD12-36S24B2(C)5 PFD12-36S24B2(C)5
FD6-36S24B2C5 FD6-36S24B2C5
FW2-24S15C3 FW2-24S15C3

谷歌與耶魯大學(xué)合作發(fā)布最新C2S-Scale 27B模型
評論