曾經(jīng)人工智能的翹楚IBM Watson,如今為何成為笑柄
早在2011年時,Watson(沃森)就在智力競賽節(jié)目 Jeopardy! 中獲勝,自此之后IBM 就在一直積極宣傳沃森。然而最近一段時間沃森帶來了許多壞消息。沃森曾與休斯敦安德森癌癥研究中心合作,去年雙方分道揚鑣。IBM營收停止增長,股價起起落落,分析師甚至開始質疑:沃森真能帶來更多價值嗎?知名科技投資人 Chamath Palihapitiya 今年5月接受 CNBC 采訪時表示:“沃森就是一個笑話。”
保羅·唐(Paul Tang)的妻子在醫(yī)院做了膝關節(jié)替換手術,他陪妻子住院。每年,美國有大約70萬人做這樣的手術。外科醫(yī)生來了,唐本人就是初級治療內(nèi)科醫(yī)生,他問醫(yī)生,預計什么時候妻子才能回歸正常人的生活,根據(jù)他的經(jīng)驗判斷。外科醫(yī)生一直含糊其辭,沒有明確答案。唐說:“我真是被打敗了,他居然不知道。”Paul Tang很快了解到,大多數(shù)內(nèi)科醫(yī)生基本上都不知道病人回到家、回到工作中的生活是怎樣的,他們無法對病人的生活進行評估,對于病人而言,這種評估至關重要。
沃森是一個機器學習系統(tǒng),IBM 將未來押在沃森身上。沃森可以給內(nèi)科醫(yī)生提供信息,例如,告訴醫(yī)生還要等多長時間,病人才能正常行走或者爬樓梯,不會疼痛。它還可以分析圖片和組織樣本,為特定病人制定最佳治療策略。
自從沃森在智力競賽節(jié)目 Jeopardy! 中獲勝之后,衛(wèi)生保健便成為機器學習技術瞄準的熱門市場。研究公司 CB Insights 在報告中指出,自2013年以來至少出現(xiàn)106家創(chuàng)業(yè)公司,它們?nèi)匀辉跔I業(yè)。
今年,沃森曾與休斯敦安德森癌癥研究中心分道揚鑣。針對沃森的批評(包括安德森癌癥中心的批評)似乎與技術無關,并不是說技術存在缺陷。只是IBM對于目前沃森所處的水平太過樂觀,這才招來批評。事實上,談到將AI應用于衛(wèi)生保健,沃森健康有很大的可能會成為領導者。如果說現(xiàn)在還沒有取得很大的成就,那么最大的障礙于數(shù)據(jù),IBM需要特定類型的數(shù)據(jù),用來訓練系統(tǒng)。在多種環(huán)境下,數(shù)據(jù)供應嚴重不足,很難獲得。這個問題不只是沃森的問題,其它系統(tǒng)也一樣。對于整個衛(wèi)生保健機器學習領域而言,都面臨這樣的問題。
缺少數(shù)據(jù)、無法獲得數(shù)據(jù)可能會讓沃森的發(fā)展速度變慢,同樣的,IBM的競爭對手也會受到傷害。為什么呢?因為要獲得數(shù)據(jù),最好的辦法就是與大型衛(wèi)生保健機構密切合作,而這些機構在技術面前有點保守。與創(chuàng)業(yè)公司相比,有一點IBM做得比較好:它得到了大機構高管和IT經(jīng)理的信任。雖然安德森項目存在一些問題,IBM仍然有著很大的優(yōu)勢。許多醫(yī)療中心、衛(wèi)生保健管理團體、生命科學企業(yè)都引進了沃森,它們都會提供關鍵數(shù)據(jù),正是這些數(shù)據(jù)為未來的醫(yī)療模式奠定了基礎。
時間表不切實際
沃森與安德森癌癥中心“分手”說明IBM對沃森鼓吹過度,結果招來麻煩。
2012年,安德森癌癥中心與IBM開始合作,它們的目標是讓沃森閱讀數(shù)據(jù),數(shù)據(jù)涉及病人的癥狀、基因序列、病理報告,然后將信息與內(nèi)科醫(yī)生的報告、重要期刊論文整合,幫助醫(yī)生制定診斷和治療策略。IBM和安德森癌癥中心對技術期待過高。2013年,IBM曾經(jīng)豪言壯語說“計算新時代來了”,這種論斷給了《福布斯》一種錯覺,似乎沃森“現(xiàn)在可以處理臨床實驗”問題,再過幾個月就能用在病人身上了。2015年,《華盛頓郵報》引述一名IBM沃森管理者的話說,沃森正在構建集體智慧模式,介于機器與人之間。《華盛頓郵報》還說,訓練時機器系統(tǒng)的目標是成為醫(yī)生的助理,幫助他們做之前不能做的事。
今年2月,德州大學(安德森癌癥中心就是它運營的)宣布項目終結,癌癥中心向IBM支付3900萬美元賠款,原本項目合同的規(guī)模只有240萬美元。研究4年之后,雙方?jīng)]有開發(fā)出一個可以用在病人身上的工具,技術只能用在實驗性測試中,沒辦法投入使用。關于沃森一事,安德森癌癥中心不予置評,內(nèi)部不知道如何管理項目,如何獲得資金,這可能才是問題的根源。
并不是說IBM沃森沒有問題,事實上,它的問題比任何其它的項目都要大。
到底是什么使得研究受挫?首先你要深入理解機器學習系統(tǒng)(比如沃森)的訓練方式。沃森持續(xù)對內(nèi)部處理流程進行微調(diào),從中學習經(jīng)驗,這樣一來解決某些問題時獲得正確答案的概率就會提高。正確答案必須是已知的,這樣系統(tǒng)才會知道什么時候對了,什么時候錯了。系統(tǒng)處理的訓練問題越多,結果就會越好。
要訓練系統(tǒng)在X線中識別惡性腫瘤還是比較簡單的。如果解決的謎題大大超出人類的已知范疇,比如了解基因變異與疾病的關系,沃森就會顯得無能為力,它會碰到“雞與蛋”的問題:數(shù)據(jù)沒有經(jīng)過專家的篩選,沒有有效組織過,如何用這樣的數(shù)據(jù)訓練系統(tǒng)呢?紐約斯隆-凱特琳癌癥中心計算病理學家Thomas Fuchs解釋說:“如果你正在訓練自動駕駛汽車,任何人都可以給樹、標志貼標簽,這樣系統(tǒng)就可以學習如何識別它。但是醫(yī)學是一個特殊的領域,需要專家訓練幾十年,給信息貼上正確的標簽,輸入計算機。”
IBM希望沃森能夠在一些領域做出貢獻,其它企業(yè)的機器學習解決方案也是樣打算的,在所有這些領域都有障礙存在。要訓練沃森處理海量數(shù)據(jù),從中挑選出少數(shù)與單個病人有關的重要信息,首先需要人親自訓練,用成千上萬個案例訓練。
例如,為了讓沃森識別與疾病有關的基因,它需要成千上萬的病歷,這些病人患有特殊疾病,他們的DNA已經(jīng)分析過。然而,要獲得“基因-病歷”結合的數(shù)據(jù)相當難。許多時候,數(shù)據(jù)并沒有以正確的格式記錄,或者根本不存在,又或者數(shù)據(jù)來自于幾十個不同的系統(tǒng),很難處理。
如果將更好的數(shù)據(jù)交給臨床醫(yī)生,就可以提高初級治療水平。在日常的初級治療過程中,當問題不太嚴重時醫(yī)生如果錯過了治療機會,等到病情變得嚴重起來,病人進了急診室或者讓專家治療,此時承受的痛苦會更大,成本也會大幅增加。IBM沃森健康首席醫(yī)療官Anil Jain說:“在健康方面花的錢有三分之一是不需要的。”人們認為,機器學習有機會解決這個問題。
診斷病人時,為了讓醫(yī)生得出更好的結論,沃森需要找到彼此的關聯(lián),也就是健康記錄和健康社會決定因素的關系。這些因素包括:病人是否吸毒、飲食是否健康、呼吸的空氣是否清新等等。唐認為,今天,幾乎沒有醫(yī)院或者醫(yī)療實踐從大量病人身上獲得可靠的數(shù)據(jù)。部分是因為醫(yī)生接受現(xiàn)代數(shù)據(jù)驅動型醫(yī)療實踐方法的速度有點慢。克利蘭夫診所(Cleveland Clinic)的內(nèi)科醫(yī)生、衛(wèi)生保健信息專家Manish Kohli認為:“衛(wèi)生保健行業(yè)接受技術的速度很慢,真是讓人尷尬。”
如果存在這樣的數(shù)據(jù),IBM一般會花錢購買。IBM收購了一些企業(yè),比如Truven Health Analytics、Explorys和Phytel,它們都是處理大數(shù)據(jù)的企業(yè),這些數(shù)據(jù)來自醫(yī)院和病人群體。雖然與安德森癌癥中心的合作終止了,IBM還是與其它機構達成了重要合作,進一步獲得更多的病人數(shù)據(jù)。
與IBM合作的就有Atrius Health,它是一個網(wǎng)絡,里面有將近900位內(nèi)科醫(yī)生,主要是初級護理內(nèi)科醫(yī)生,他們來自波士頓地區(qū)。合作的目標是為開發(fā)、測試以沃森作為基礎的系統(tǒng)功能,從筆記、記錄、文章中提取面向獨立個體的關鍵信息。Atrius Health首席醫(yī)療官Joe Kimura說:“對于初級護理內(nèi)科醫(yī)生而言,提取所有相關信息是一項繁重的任務。”他還說,每一次訪問數(shù)據(jù)都會增加,有了這樣的系統(tǒng)數(shù)據(jù)會大幅增加,不需要按標準格式提交,檢索很方便。
還有,病人病歷中許多重要的筆記是以句子的形式存在的,傳統(tǒng)IT系統(tǒng)無法識別。沃森使用了自然語言處理技術,這種技術當時是為參加 Jeopardy! 開發(fā)的,它可以從句子中提取意義。在理想的情況下,系統(tǒng)可以給內(nèi)科醫(yī)生提建議,給病人更好的幫助,省去不必要的護理。Kimura說:“病人臀部受傷,我們?nèi)娜庹湛?,為什么我們只關心這個?為什么不能提前預測,判斷病人有跌倒的風險,讓他們避免臀部受傷?我們要讓護理朝著上游延伸。”
沃森健康還與紐約中央醫(yī)療中心(Central New York Care Collaborative)合作,這是一個州政府提供資金成立的機構,與6個國家大約2000個衛(wèi)生保健提供商合作。合作的目標很明確:將急診數(shù)量、再入院數(shù)量降低25%,有時病人已經(jīng)獲得批準出院,結果又因為相關的問題重新回醫(yī)院治療。合作還帶來了大量的病人數(shù)據(jù)。
拿到更多數(shù)據(jù)
獲得數(shù)據(jù)還有其它的辦法。谷歌有一家姊妹公司,它想直接從病人身上提取數(shù)據(jù)。這家公司就是Verily Life Sciences,它是Alphabet的衛(wèi)生保健部門,該公司與杜克大學、斯坦福大學合作,開發(fā)一套高度結構化的健康數(shù)據(jù)庫,里面有1萬名志愿者。數(shù)據(jù)庫包含了門診信息,還有穿戴健康監(jiān)測設備提供的數(shù)據(jù)。這樣一來數(shù)據(jù)就會大大增加,只是要生成高度可用的結果,可能還要等10年甚至更長時間。
紀念斯隆-凱特林(Memorial Sloan-Kettering)癌癥研究中心的Fuchs率領團隊訓練一個AI系統(tǒng),它可以閱讀“組織染色幻燈片”(tissue-stain slides),在訓練過程中,研究人員需要建立一個龐大的數(shù)字幻燈片庫,幻燈片上有注釋信息,包括確診及其它關鍵數(shù)據(jù)。每個月,團隊自己會制作4萬張幻燈片。Fuchs說:“數(shù)量比其它人多很多,任務很龐大,因為在生物領域變量太多了。”
雖然沃森項目失敗,安德森癌癥研究中心還是在繼續(xù)執(zhí)行一個大項目,它要收集1700種門診數(shù)據(jù),走進中心的每一個人病人都會貢獻自己的數(shù)據(jù)。項目負責人Andy Futreal說,要讓沃森這樣的AI系統(tǒng)發(fā)揮作用,將病人信息與研究數(shù)據(jù)結合起來至關重要。他還說:“一旦我們獲得了數(shù)據(jù),就可以進入AI機器學習業(yè)務,看看在各種治療方法下什么原因導致誰的效果好、誰的效果不好。”
IBM繼續(xù)從合作伙伴手中獲得數(shù)據(jù)。在癌癥診斷與治療方面,IBM與紀念斯隆-凱特林癌癥研究中心、Mayo Clinic、哈佛和MIT附屬研究所、醫(yī)療測試巨頭Quest Diagnostics攜手合作。通過與紀念斯隆-凱特林癌癥研究中心合作,IBM開發(fā)出一套系統(tǒng),它可以篩選期刊文獻,形成正式的治療決策,佛羅里達Jupiter Medical Center(木星醫(yī)療中心)和印度一家醫(yī)院連鎖企業(yè)已經(jīng)引進系統(tǒng)。在發(fā)現(xiàn)藥物方面,沃森健康與Barrow Neurological Institute(巴羅神經(jīng)學研究所)合作,它幫助該機構找到了5種與ALS有關的基因,之前人們并不認為這些基因與該疾病有關;通過與Ontario Brain Institute(安省腦科研究所)合作,沃森篩選出21種最有希望的候選藥物。
提供更好的醫(yī)療結果,降低成本,沃森真的能帶來變革嗎?Bessemer Venture Partners基金的合伙人Stephen Kraus認為的確有這種可能,他專注于衛(wèi)生保健行業(yè),投資了許多與衛(wèi)生保健有關的AI創(chuàng)業(yè)公司。Kraus說:“它是真實存在的,不是用來刺激股價上漲的‘霧件’。”和大多數(shù)專家一樣,Kraus也對不切實際的時間表、承諾保持謹慎態(tài)度,當中一些過高的承諾來自于IBM自己。Kraus說:“相當難,今天沒有發(fā)生,再過5年可能也不會發(fā)生,這種技術不會替代醫(yī)生。”





