全球觀天下!生成式AI走紅,如何搭建生命科學(xué)的ChatGPT?
(資料圖)
“ChatGPT引起了廣泛的關(guān)注,我們有沒有可能在生命科學(xué)領(lǐng)域搭建一個(gè)類似ChatGPT的模型呢?”加拿大魁北克省人工智能研究中心(Mila)副教授、加拿大高等研究院(CIFAR)人工智能講席教授唐建在近日召開的《理解未來》科學(xué)講座AI for Science系列第三期上說。
這期講座主題為“AI4Science和ChatGPT,生物醫(yī)藥的契機(jī)?”,由未來論壇理事、北京大學(xué)李兆基講席教授謝曉亮主持。講座上,中國(guó)科學(xué)院院士、北京大學(xué)教授鄂維南和唐建分別圍繞“AI for Science科技革命”“生命科學(xué)中的生成式人工智能”話題分享了觀點(diǎn)。
唐建指出,人工智能和生物技術(shù)的研究正處于黃金時(shí)期。語言生成模型如ChatGPT在對(duì)話系統(tǒng)領(lǐng)域取得了很大的突破,研究者們正在探索是否能在生物制藥領(lǐng)域搭建類似的人工智能模型。目前,研究人員在人工智能與生物醫(yī)藥的交叉領(lǐng)域已有了諸多探索。他舉了一些例子:GeoDiff應(yīng)用在小分子的三維構(gòu)象預(yù)測(cè),E3Bind應(yīng)用在蛋白質(zhì)-配體復(fù)合物結(jié)構(gòu)預(yù)測(cè),ProtSeed同時(shí)生成新的蛋白質(zhì)結(jié)構(gòu)和序列等。
唐建認(rèn)為,AI分析數(shù)據(jù)以及機(jī)器學(xué)習(xí),為科學(xué)規(guī)律的表達(dá)提供了可能性。“AI將可能的文本、知識(shí)、代碼進(jìn)行訓(xùn)練,當(dāng)AI能力達(dá)到一定強(qiáng)度后,我們就通過模型的開發(fā),對(duì)大量數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練。其中,ChatGPT可以產(chǎn)生全新的原創(chuàng)內(nèi)容,具有一定的創(chuàng)造力,像一本百科全書,用戶可以很快從百科全書中獲取需要的知識(shí)。在蛋白質(zhì)設(shè)計(jì)領(lǐng)域,不論是小分子還是蛋白質(zhì)分子,本質(zhì)而言都需要生成一些新的結(jié)構(gòu),融入ChatGPT,可以提升蛋白質(zhì)設(shè)計(jì)的創(chuàng)新度和多樣性。”
謝曉亮在前瞻對(duì)話環(huán)節(jié)分享了他對(duì)于AI+生命科學(xué)領(lǐng)域應(yīng)用的思考。他指出,基于技術(shù)上的突破,生命科學(xué)基因組學(xué)、冷凍電鏡等生命科學(xué)領(lǐng)域,逐漸從“數(shù)據(jù)缺乏學(xué)科”轉(zhuǎn)變?yōu)?ldquo;大數(shù)據(jù)科學(xué)”,從“定性學(xué)科”轉(zhuǎn)變?yōu)?ldquo;定量學(xué)科”。他還提到,AI需要大數(shù)據(jù),數(shù)據(jù)質(zhì)量非常重要。
以藥物設(shè)計(jì)為例,鄂維南介紹,“現(xiàn)在很多團(tuán)隊(duì)都在通過將數(shù)據(jù)驅(qū)動(dòng)的方法和模型驅(qū)動(dòng)的方法有機(jī)結(jié)合,構(gòu)建更加系統(tǒng)、高效、自動(dòng)化的藥物研發(fā)過程。”他指出,化學(xué)、材料、生物、工程等傳統(tǒng)領(lǐng)域都將成為AI的主戰(zhàn)場(chǎng),同時(shí)也將催生新一代的產(chǎn)業(yè)模式。另一方面,在AI+Science的驅(qū)動(dòng)下,科學(xué)研究將從“小農(nóng)作坊”模式轉(zhuǎn)變到“安卓”模式,“平臺(tái)科研”將成為全新的科研范式,“社區(qū)建設(shè)”將成為重要趨勢(shì)。
“希望我們有效地利用機(jī)會(huì),將AI+Science的‘安卓’模式基礎(chǔ)設(shè)施建設(shè)起來,充分利用這一科學(xué)發(fā)展空間,讓中國(guó)走在全球科學(xué)領(lǐng)域的前沿。”鄂維南說。
《理解未來》科學(xué)講座是未來論壇面向公眾開放的高質(zhì)量公益科普講座。據(jù)了解,講座目前已成功舉辦70余場(chǎng),超過140位科學(xué)家參與其中。