學(xué)術(shù)出版商 Springer Nature 出版了第一本由機器學(xué)習(xí)生成的書籍——《鋰離子電池:機器生成的當(dāng)前研究摘要》,它概述了鋰離子電池領(lǐng)域的最新研究成果,大約250頁。
如何創(chuàng)作出來?
Springer Nature和法拉克福歌德大學(xué)共同開發(fā)了一種先進算法:Beta Writer。它使用基于相似性的聚類分析,將海量的源文檔排列成連貫的章節(jié),然后創(chuàng)建文章的簡潔摘要,同時,將文章內(nèi)部加入超鏈接,方便讀者進一步閱讀原始的文章。
AI這種創(chuàng)新化的結(jié)構(gòu)化摘錄成書,有利于研究人員更高效地管理海量信息,以及人們從海量內(nèi)容里快速選擇、使用和處理相關(guān)領(lǐng)域的文檔。
難點?AI必須很好地理解論文,它知道“它”是什么,并且在重構(gòu)句子時,將“it”替換為該項,并且知道它可以取消“因此”和最后的旁注。
這必須完成數(shù)千次模擬,并且許多邊緣情況會彈出模型不能正確處理或產(chǎn)生一些公認的笨拙的用語。例如:“這種研究的主要目的是獲得具有優(yōu)異性能的材料,如高容量、快速的鋰離子擴散速率,易于操作和穩(wěn)定的結(jié)構(gòu)。”
意義?最終,這本書具有可讀性和可以想象的有用性,已經(jīng)將大約一萬頁的研究歸結(jié)為大約250頁。這本書里面包含了2016-2018年發(fā)表過的150多篇權(quán)威研究論文。僅在過去3年,關(guān)于鋰電子電池的研究論文就發(fā)表了超出53000篇,這對試圖學(xué)習(xí)這一領(lǐng)域的科學(xué)家是一個巨大的挑戰(zhàn),但AI的自動掃描和總結(jié)輸出,能讓科學(xué)家們把更多時間用在重要的研究上。
這里的目標(biāo)似乎并不遙遠,就是能夠告訴一項服務(wù)“給我一份50頁的生物工程最后4年的總結(jié)。
文本的靈活性意味著您也可以用西班牙語或韓語請求它。參數(shù)化意味著您可以輕松調(diào)整輸出,強調(diào)區(qū)域和作者或排除關(guān)鍵字或無關(guān)緊要的主題。
可以預(yù)見,未來的學(xué)術(shù)出版以及各類書籍,將不再只是人為創(chuàng)造,而是有更多形式出現(xiàn),包括了混合人機文本生成的書籍或完全由機器學(xué)習(xí)生成的文本。





