CCAI素來秉承中國國內(nèi)級別最高、規(guī)模最大的品質(zhì)追求,匯集全球人工智能領域的頂級專家、學者和產(chǎn)業(yè)界優(yōu)秀人才,直擊當前AI業(yè)界熱點話題、核心技術(shù)以及大家共同關(guān)注的科學問題,并針對該領域相關(guān)技術(shù)研究、產(chǎn)業(yè)化創(chuàng)新應用、人才培養(yǎng)與成長等設立專題論壇。納百家之言,融萬端思辨,旨在打造中國人工智能領域產(chǎn)、學、研緊密結(jié)合的高端前沿交流平臺。
大會開幕在即,CSDN獨家采訪到南加州大學副教授、Zohrab A. Kaprielian工程院士Fei Sha博士。而Fei Sha博士作為本屆CCAI的嘉賓,將于大會上為大家?guī)碇黝}為“大數(shù)據(jù)如何幫助「小數(shù)據(jù)」”的分享,意在從其他任務和相關(guān)(大)數(shù)據(jù)集中尋求幫助,以研究有關(guān)小數(shù)據(jù)的方法和模型。報告將探討相關(guān)方法的制定,以及如何將它們運用到實際問題中。
以下為采訪正文
機器學習在醫(yī)療領域的逐步滲透CSDN:是否方便透露您以及您的團隊在現(xiàn)階段的研究側(cè)重點或下一步研究計劃?
Fei Sha:目前,我的研究著重于統(tǒng)計機器學習的基礎性與應用性研究。過去幾年中,我們團隊的工作涉及到了人工智能領域的各個子類,包括計算機視覺、自然語言處理和機器人技術(shù)領域。同時,對于實驗室正在進行的一項新舉措——嘗試將機器學習和人工智能轉(zhuǎn)化到醫(yī)學的運用上,我們也感到非常興奮。為此,我已經(jīng)開始建立一個針對健康方面的數(shù)據(jù)、算法與系統(tǒng)的研究中心。
CSDN:是什么契機讓您選擇了統(tǒng)計機器學習這一研究分支,大數(shù)據(jù)的機器學習在人工智能的發(fā)展中扮演著怎樣的角色?在與團隊一同探索的過程中,曾陷入怎樣的瓶頸時期?又是如何尋求突破的?
Fei Sha:在就讀博士時,我就為統(tǒng)計機器學習的魅力心馳神往。彼時,我頭一個博導Fernando Pereira、同為我博導的Lawrence K. Saul,還有Daniel D. Lee等杰出研究員都已經(jīng)離開了AT&T的實驗室,紛紛加入了賓夕法尼亞大學,投入學術(shù)界的懷抱。而我對于機器學習的理解,在很大程度上受到了他們的影響,還有我的博士后導師Michael Jordan這樣的牛人也給了我很大影響。作為一個研究方向,機器學習在對智慧的運用上很能讓人滿足,我發(fā)現(xiàn)自己不斷學習新的東西,欣賞到各式新奇的想法,并且實實在在地為解決真實世界的問題做出了貢獻。
毫無疑問,近來人工智能那些驚人的進展,在很大程度上要歸功于大數(shù)據(jù)、智能學習模型和算法,還有人們借助商用硬件所執(zhí)行的大規(guī)模并行運算。
CSDN:在將機器學習以及其他人工智能技術(shù)應用到生命與醫(yī)療科學這條路上,您和您的團隊做了哪些工作及部署?人工智能在醫(yī)學戰(zhàn)場上面臨哪些挑戰(zhàn)?談談機器學習在個性化醫(yī)療等醫(yī)療手段當中的應用?
Fei Sha:具有開拓精神的腫瘤專家,同時也是精準醫(yī)學領袖David Agus博士帶領著一支來自Lawrence J. Ellison轉(zhuǎn)化醫(yī)學研究院的團隊。通過與他們合作,我在美國南加州大學的實驗室在21世紀數(shù)字病理學的重新定義領域發(fā)揮著領導作用。目前有一些機器學習方面的研究項目正在進行,非常令人興奮,其中包括有:直接從H&E染色圖像中預測癌癥標志物;根據(jù)組織學圖像將癌細胞和非癌細胞成分進行分類;建立起精準與自適應療法的新型數(shù)學與計算模式。我們相信,通過對機器學習技術(shù)和人工智能的不斷優(yōu)化,在我們的努力下,全世界的病理學家將會取得前所未有的進展,得以更好更快地做出疾病診斷。目前,我們聯(lián)合了全世界頂尖的技術(shù)公司和行業(yè)領袖,共同合作將研究從大學實驗室搬到現(xiàn)實社會,以便形成最大的影響力。
將人工智能應用于疾病的治療或協(xié)助治療方面,當然很激動人心。但是我們應當知道——疾病的治療是一個復雜的決策過程,涉及到了多個方面。通常來說,雖然還在不斷成長,但人工智能系統(tǒng)在其中只占據(jù)很小一部分。在我看來,其中最大的挑戰(zhàn)就是開發(fā)出能轉(zhuǎn)化成有重大臨床影響的人工智能技術(shù)。
CSDN:據(jù)悉,您曾為DARPA 2010計算機科學研究小組成員,這個過程中是否有方便與大家分享的經(jīng)歷?
Fei Sha:為了訓練空降能力,我曾試過12.8米高的跳臺。
深度學習與機器學習間的辯證關(guān)系CSDN:對于“深度學習是機器學習的最終發(fā)展方向”這一個觀點,您怎么看?您曾經(jīng)談過有關(guān)深度學習“知識表示”的問題,能否具體展開?現(xiàn)階段該問題仍存在嗎?
Fei Sha:深度學習在基礎研究、應用研究和開發(fā)、應用和實踐等方面確實徹底改變了機器學習的格局。然而在我看來,不加限制條件就宣布深度學習是“最終的方向或目的”,是一種科學上不成熟、也不負責任的做法。關(guān)于深度學習的模式和實踐,我們還有很多不了解的地方,還有很多對機器學習至關(guān)重要的問題尚在研究之中,而這些問題與深度學習模型呈正交關(guān)系。
使用深度學習的架構(gòu)來表達某些人工智能領域的知識表述問題,是非常有趣而且很可能頗有前景的工作。但是類似這些方面,我們離獲得定論還相距甚遠。
CSDN:您在研究過程中也收獲了大量的理論研究成果,那么在您看來,理論下的AI和實踐中的AI之間,有著怎樣的差距。您認為現(xiàn)階段的AI發(fā)展存在哪些阻滯因素?
Fei Sha:目前,無論學術(shù)研究界還是行業(yè)社區(qū)中,關(guān)于人工智能系統(tǒng)的設計和實現(xiàn),大家都在進行大量的理論知識與實踐準則積累,以適應具體明確且垂直化的應用場景,比如識別口語、識別人臉等等。盡管如此,在這些方面所取得的成功只能算起步,我們欠缺優(yōu)秀的理論來描述這些系統(tǒng)的魯棒性和可靠性。對于特別復雜的系統(tǒng),我們?nèi)鄙僭u判其預測是否正確的工具,而且太過依賴于獲取海量數(shù)據(jù)。此外,正如我在上文中提到的,人工智能系統(tǒng)通常只是某個復雜系統(tǒng)或進程中的一個小部分。那么,如何確保人工智能系統(tǒng)與其他組件順利協(xié)作,是將人工智能推向?qū)嵺`和產(chǎn)品環(huán)節(jié)的關(guān)鍵步驟。
CCAI議題直擊
CSDN:您將在本次CCAI上分享什么樣的主題?側(cè)重點將放在哪些問題上,旨在解開哪些疑惑,希望觀眾從中收獲什么啟示?
Fei Sha:我的演講主題主要是:如何借助少量數(shù)據(jù),甚至在沒有數(shù)據(jù)的前提下構(gòu)建機器學習模型。在許多應用的場景中,會假設我們已經(jīng)擁有海量精準數(shù)據(jù),而這并不現(xiàn)實。不過,我們還是可能有機會訪問大量與所要解決的問題有關(guān)聯(lián)的數(shù)據(jù)。在過去幾年中,我們一直在研究如何在這類情況下,利用這些相關(guān)的數(shù)據(jù)。





