AI又當(dāng)醫(yī)生了,這次是通過血液識(shí)別癌癥
近日,頂尖學(xué)術(shù)期刊《自然》上線了一項(xiàng)有關(guān)癌癥診斷的重要研究。
與以往不同的是,來(lái)自美國(guó)加州大學(xué)圣迭戈分校的科學(xué)家,通過訓(xùn)練人工智能從血液中鑒定微生物的遺傳物質(zhì),不僅可以識(shí)別出癌癥,還能對(duì)不同類型的癌癥做出區(qū)分。
“這是一個(gè)很有前景的方向,改變了傳統(tǒng)的檢測(cè)方法,而且運(yùn)用人工智能技術(shù),使得海量的檢索和比對(duì)工作得以快速而準(zhǔn)確地完成。”南京信息工程大學(xué)教授徐軍評(píng)價(jià)道。
微生物與腫瘤微環(huán)境息息相關(guān)
菌群與人體的關(guān)系毫無(wú)疑問是十分密切的。有科學(xué)家估計(jì),在每個(gè)人的身體中細(xì)菌的數(shù)量占到了人體所有活細(xì)胞的90%。此外,我們體內(nèi)還有許多病毒存在。
這些常駐人體的微生物幾乎參與了人體的一切生命活動(dòng),所以,它們的核酸片段(DNA或RNA)也就經(jīng)血液游蕩在我們體內(nèi)。
近年來(lái),許多研究證據(jù)顯示,人體微生物對(duì)多種類型的腫瘤有“貢獻(xiàn)”??茖W(xué)家猜想,這些微生物在癌癥中所起的作用也許比我們已知的更多。因?yàn)橐郧暗陌┌Y研究工作,忽略了人體癌細(xì)胞與微生物可能有復(fù)雜的相互作用。
這也就提供了一種全新的檢測(cè)癌癥的思路:用正常人血液中與癌癥患者血液做對(duì)比,其中的微生物是否會(huì)有差別呢?
于是,美國(guó)加州大學(xué)圣迭戈分校的科學(xué)家有了一個(gè)大膽的設(shè)想:分析血液中來(lái)自微生物的遺傳物質(zhì),可以根據(jù)其特征模式來(lái)識(shí)別體內(nèi)的腫瘤。
如果在過去,這種設(shè)想真的只能是想想罷了,“這是因?yàn)榧?xì)菌的數(shù)量十分龐大,檢測(cè)它們的基因序列將是一個(gè)海量工程。”徐軍說,但是得益于基因測(cè)序技術(shù)的發(fā)展,現(xiàn)在測(cè)序的費(fèi)用與時(shí)間都在大幅下降,同時(shí)微生物的基因測(cè)序也能夠運(yùn)用AI技術(shù),效率能大大提升。
徐軍告訴記者,疾病的檢測(cè)、診斷和治療是一個(gè)非常復(fù)雜的過程,需要借助多方面信息,比如圖像數(shù)據(jù)、基因數(shù)據(jù)、分子和蛋白的表達(dá),患者的病史、遺傳背景、家族史等其他數(shù)據(jù)化信息,以及患者的臨床數(shù)據(jù),微生物的核酸特征等等。大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)的加入,從基因?qū)用?、?xì)胞層面、以及微生物層面展現(xiàn)患者個(gè)體化的信息。
“我們對(duì)這些問題理解越深刻,治療疾病的成功率就越高。”徐軍說,在沒有AI技術(shù)之前,盡管我們能夠采集大量的數(shù)據(jù),但是由于能力限制,能夠獲取的知識(shí)很有限。比如盡管我們能夠破譯人類的基因,但是目前90%以上的信息我們還不能理解對(duì)疾病的診斷和治療有什么作用。
人工智能測(cè)癌可靠性有多高
研究人員在幾千份樣本中找到相應(yīng)的微生物特征后,把工作交給了人工智能。通過相應(yīng)的機(jī)器學(xué)習(xí)模型來(lái)挖掘大量數(shù)據(jù),把特定的微生物序列特征與特定的癌癥相匹配。
“機(jī)器學(xué)習(xí)的方式主要有監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),從這個(gè)項(xiàng)目公開的信息來(lái)看,采用的是監(jiān)督學(xué)習(xí)模式。”徐軍分析說,監(jiān)督學(xué)習(xí)的特點(diǎn)是人類會(huì)把知識(shí)傳授給計(jì)算機(jī),計(jì)算機(jī)根據(jù)樣本的特征進(jìn)行學(xué)習(xí),接下來(lái)就能夠自動(dòng)區(qū)分疾病或者健康的樣本。
另一種非監(jiān)督學(xué)習(xí)將能夠使得機(jī)器具備更高的智能,即人類沒有給計(jì)算機(jī)提示,計(jì)算機(jī)通過歸納的樣本之間的規(guī)律和模式,突破了以往需人類干預(yù)才可學(xué)習(xí)的局限。
“現(xiàn)在還有一種新的非監(jiān)督學(xué)習(xí)模式——對(duì)抗學(xué)習(xí),其特點(diǎn)是人類設(shè)計(jì)出兩個(gè)模型,一個(gè)用于制造偽裝數(shù)據(jù),另一個(gè)用于鑒別偽裝,在你來(lái)我往中實(shí)現(xiàn)互贏,最后達(dá)到納什均衡狀態(tài)。”徐軍認(rèn)為,我國(guó)擁有大量的疾病數(shù)據(jù),醫(yī)學(xué)和人工智能領(lǐng)域之間如果能夠長(zhǎng)期深入合作,將能夠更好地為患者服務(wù)。
從此項(xiàng)研究的結(jié)果來(lái)看,這套AI模型在實(shí)際診斷中是可靠的??茖W(xué)家讓AI對(duì)100名患者的樣本血漿進(jìn)行分析,并與69名健康無(wú)癌個(gè)體的血樣進(jìn)行比較。機(jī)器學(xué)習(xí)模型不僅可以區(qū)分患癌和無(wú)癌的樣本,還能區(qū)分不同類型的癌癥:以86%的敏感性識(shí)別出肺癌患者,對(duì)于無(wú)肺部疾病的個(gè)體沒有出現(xiàn)假陽(yáng)性報(bào)告,并且以81%的準(zhǔn)確率區(qū)分出前列腺癌和肺癌。
“達(dá)到這個(gè)準(zhǔn)確率具備了參考價(jià)值,但需要注意的是,這個(gè)結(jié)果可能是在理想的條件下得到的,論文作者可能也剔除了許多不規(guī)范的樣本和數(shù)據(jù)。”徐軍認(rèn)為,這還是一項(xiàng)早期的概念驗(yàn)證研究,應(yīng)用到臨床還需要做大量工作。
專家認(rèn)為,AI和大數(shù)據(jù)的加入,可以完成更加復(fù)雜的任務(wù)。比如基因序列的讀取,是人的眼睛和智力水平基本上無(wú)法完成的,而人工智能和大數(shù)據(jù)技術(shù)的廣泛使用將能夠很好地解決這個(gè)問題。
徐軍告訴記者,人工智能技術(shù)在醫(yī)學(xué)領(lǐng)域得到廣泛的關(guān)注,它并不是偶然發(fā)生的,而是建立在近年來(lái)以機(jī)器學(xué)習(xí)為代表的深度學(xué)習(xí)技術(shù)取得了巨大突破的基礎(chǔ)上。
“2019年,《自然·醫(yī)學(xué)》出版了一期特刊,該特刊的12篇論文全部和人工智能相關(guān),這說明人工智能技術(shù)和醫(yī)學(xué)結(jié)合的爆發(fā)點(diǎn)已經(jīng)到來(lái)。”徐軍說,以人工智能技術(shù)為核心的機(jī)器能夠極大地彌補(bǔ)人類的不足。
但徐軍也指出,人類醫(yī)生的優(yōu)勢(shì)是冷冰冰的機(jī)器無(wú)法代替的,機(jī)器不具備人對(duì)疾病的認(rèn)知和理解,同時(shí),治療的過程不僅僅是數(shù)據(jù)處理過程,更重要的是醫(yī)生和患者之間的溝通和互動(dòng)。醫(yī)生對(duì)于患者的關(guān)懷和安慰是機(jī)器無(wú)法做到的,而這在治療過程中有時(shí)非常關(guān)鍵。因此,未來(lái)最好的模式是機(jī)器與醫(yī)生協(xié)同開展工作。