掃描二維碼
隨時(shí)隨地手機(jī)看文章
編譯 | 禾木木出品 | AI科技大本營(ID:rgznai100)看到下面這個(gè)老黃是不是覺得很Q~
11月9日,GTC 大會再次來了,英偉達(dá)創(chuàng)始人兼CEO黃仁勛再次從自己虛擬廚房走出來。本次 GTC 大會都有哪些亮點(diǎn)呢?
英偉達(dá)展示過如何使用 Omniverse 來模擬倉庫、工廠、物理與生物系統(tǒng)、5G 通信、機(jī)器人、自動(dòng)駕駛汽車,現(xiàn)在最新的技術(shù)可以直接生成全功能的虛擬形象了。這個(gè) Q 版老黃叫 Toy-Me,可以和人進(jìn)行自然語言交流。它使用了目前規(guī)模最大的預(yù)訓(xùn)練自然語言處理模型 Megatron 530B,通過自己的聲音、形象和講話姿勢,整個(gè)人也帶光追特效。one more thing !這一切都是實(shí)時(shí)生成的。黃仁勛表示,“你會看到這個(gè)虛擬形象是基于目前訓(xùn)練的最大語言模型的語言處理打造,包括聲音也是用我自己的語音進(jìn)行合成,還可以看到實(shí)時(shí)基于光線追蹤的精美圖像?!?/span>黃仁勛演示3個(gè)人分別讓虛擬形象回答關(guān)于氣候變化、天文學(xué)以及生物蛋白質(zhì)等問題,都可以對答如流。可謂是上知天文,下知地理!
Omniverse Avatar 是一款基于語言、計(jì)算機(jī)視覺、自然語言理解、推薦引擎和模擬技術(shù)生成的交互式 AI 化身。它具有光線追蹤 3D 圖形的交互式角色,可以看到、說話、就廣泛的主題進(jìn)行交談,并理解對話的意圖。
Omniverse Avatar 為創(chuàng)建人工智能助手打開了大門,這些助手幾乎可以為任何行業(yè)輕松定制。這些可以幫助處理數(shù)十億的日??蛻舴?wù)互動(dòng),像是餐廳訂單、銀行交易、個(gè)人約會和預(yù)訂等等,從而帶來更多商機(jī)并提高客戶滿意度。
這個(gè)小機(jī)器人可以通過語音識別、眼神追蹤來推斷顧客的意圖,并能在2秒左右作出反應(yīng),回答顧客提出的問題或要求。“智能虛擬助手的曙光已經(jīng)到來,”英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示?!癘mniverse Avatar 結(jié)合了英偉達(dá)的基礎(chǔ)圖形、模擬和 AI 技術(shù),創(chuàng)造了一些有史以來最復(fù)雜的實(shí)時(shí)應(yīng)用程序。協(xié)作機(jī)器人和虛擬助手的用例令人難以置信且影響深遠(yuǎn)。”
Avatar 的自然語言理解是基于 Megatron 530B 大型語言模型,能夠識別、理解和生成人類語言。Megatron 530B 是一個(gè)預(yù)訓(xùn)練模型,它可以在很少或根本沒有訓(xùn)練的情況下完成句子,例如:回答大量主題領(lǐng)域的問題,完形填空、閱讀理解、常識推理,自然語言推理、翻譯成其他語言等,除了這些訓(xùn)練完,還可以處理許多未經(jīng)專門訓(xùn)練的領(lǐng)域。Avatar 的推薦引擎由 NVIDIA Merlin 提供,該框架允許企業(yè)構(gòu)建能夠處理大量數(shù)據(jù)的深度學(xué)習(xí)推薦系統(tǒng),以提出更明智建議。 Avatar 的感知能力由NVIDIA Metropolis啟用,這是一種用于視頻分析的計(jì)算機(jī)視覺框架。頭像動(dòng)畫由 NVIDIA Video2Face 和Audio2Face、2D 和 3D 人工智能驅(qū)動(dòng)的面部動(dòng)畫和渲染技術(shù)提供支持。Omniverse Avatar 將這些技術(shù)被組合成一個(gè)應(yīng)用程序,并使用 NVIDIA 統(tǒng)一計(jì)算框架進(jìn)行實(shí)時(shí)處理。在 Keynote 中,英偉達(dá)還展示了 Omniverse 的一系列新功能,包括 Showroom,負(fù)責(zé)展示圖形、物理、材質(zhì)和 AI。Farm一個(gè)系統(tǒng)層,用于協(xié)調(diào)跨多系統(tǒng),工作站、服務(wù)器、裸機(jī)或虛擬化的批處理作業(yè)。Omniverse AR 可以將圖形串流到手機(jī)和 AR 眼鏡上。Omniverse VR 是首款全幀率交互式光線追蹤 VR。