日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 智能硬件 > 智能硬件
[導(dǎo)讀]人工智能已經(jīng)在、和等領(lǐng)域達(dá)到或超越了人類專家的水平,但今天看來,智能化的機(jī)器還離我們很遠(yuǎn)。要想實現(xiàn)通用智能,AI 智能體必須學(xué)習(xí)如何在共享環(huán)境中與「他人」進(jìn)行互動:這就是多智能體強(qiáng)化學(xué)習(xí)面臨的挑戰(zhàn)。

人工智能已經(jīng)在、和等領(lǐng)域達(dá)到或超越了人類專家的水平,但今天看來,智能化的機(jī)器還離我們很遠(yuǎn)。要想實現(xiàn)通用智能,AI 智能體必須學(xué)習(xí)如何在共享環(huán)境中與「他人」進(jìn)行互動:這就是多智能體強(qiáng)化學(xué)習(xí)面臨的挑戰(zhàn)。

本文將通過地圖尋寶問題為例,向你簡要介紹多智能體系統(tǒng)實施時的困難程度及其原因。

「研究人工智能三十五年來的主要經(jīng)驗是:困難的問題是易解的,簡單的問題是難解的?!筆inker (1994),《The Language Instinct》

我之前覺得編寫一個軟件智能體來收集圖上的寶藏是件簡單的小事。但是我完全錯了。編寫出不愚蠢行動的智能體實際上非常困難。

明確定義的多智能體設(shè)置

「智能體是指任何通過傳感器感知環(huán)境、通過效應(yīng)器作用于環(huán)境的事物?!筍tuart Russell&Peter Norvig,《Artificial Intelligence: A Modern Approach》

使用 GraphStream 庫模擬多智能體系統(tǒng)收集寶藏。

這是一個簡單的多智能體問題。讓 n 個智能體在完全連接的圖上移動并收集寶藏。智能體的行動、感知和溝通受到限制,它們只能觀察并移動到與它們直接相連的節(jié)點(diǎn),只能與足夠接近的智能體進(jìn)行通信。

有三種智能體:探險者、收集者和無限背包(Infinite-backpack)智能體。探險者注定要探索地圖,因為它們不允許收集寶藏。收集者才可以收集,但它們不能攜帶太多,并且必須將它們收集的寶藏分發(fā)給無限背包智能體。

智能體的感知有限,但可以記住過去的觀察結(jié)果。每個智能體都有自己的世界表征形式、自己的圖(真實圖的子圖)。智能體的子圖是它們訪問過的所有節(jié)點(diǎn)的記憶,以及它們曾經(jīng)見過或走過的邊。它們必須將此圖傳達(dá)給其他智能體,以便它們都可以共享來自所有子圖的修復(fù)。

JADE(Java Agent DEvelopement Framework)將用于實現(xiàn)所謂的「行為」(教程地址:http://jade.tilab.com/doc/tutorials/JADEProgramming-Tutorial-for-beginners.pdf、https://gitlab.com/herpsonc/startJade)。在這個多智能體系統(tǒng)框架中,行為是智能體將要執(zhí)行的一組指令。在每一輪中,每個智能體都按順序執(zhí)行每個行為。

你的目標(biāo):實現(xiàn)智能體的行為,使之在一定時間內(nèi)收集盡可能多的寶藏。

看起來很簡單,是吧?

(注意:該項目是《多智能體系統(tǒng)簡介》(ANDROIDE 的一門課程)的一部分。靈感來自于生存恐怖游戲 Hunt The Wumpus,在該項目的完整版本中,智能體需要處理四處游蕩的、可怕的 Wumpus)。

重要的行為

想象兩個智能體在長廊中朝相反方向移動。圖的每個節(jié)點(diǎn)上只能有一個智能體,所以它們必須協(xié)調(diào)行為以避免阻礙別人。考慮到這種情況,我們必須實施一個特定的協(xié)議。

模擬中智能體的沖突:MyExplorerAgent2 擋住了其他兩個智能體。

協(xié)調(diào)

智能體的感知有限,并且有不同的能力。因此,合作是必不可少的。發(fā)生沖突時,必須應(yīng)用解除該情況的協(xié)議。它們必須分享自己的子圖,看看誰更接近高度連接的節(jié)點(diǎn),并就誰來移動達(dá)成一致。

探險者智能體必須同意誰來探索未知圖形的哪個部分,以優(yōu)化它們的移動并防止沖突。

信息交換

在多智能體設(shè)置中交換信息以便讓每個智能體都能獲取全局知識的過程被稱為 gossip problem。

例如,假設(shè)集合 {1,2, … ,n} 中的每個智能體都知道一部分信息,稱為一個秘密。然后,一個非常簡單的協(xié)議是讓智能體 1 呼叫 2、3、......、n,并了解它們的秘密。當(dāng) 1 知道所有的秘密時,它會呼叫給 2、......、n,告訴它們這些秘密,這樣每個智能體都知道所有的秘密了??偣灿?n-1+n-1=2n-2 次呼叫。實際上,最佳解決方案需要 2n-4 次呼叫,這與我們的簡單算法非常接近。

然而,在我們的問題中,直到所有節(jié)點(diǎn)都被探索時才能知曉完整信息,這使得算法稍微復(fù)雜一些,因為總的知識是動態(tài)的(智能體探索的圖越多,它們的知識總量越多)。

這時就出現(xiàn)了優(yōu)化妥協(xié)(optimization compromise)。為了讓全部智能體知道所有秘密,這 n 個智能體之間必須交換消息的最佳數(shù)量是多少?更多信息意味著更好的全局知識和更好的協(xié)調(diào)。然而,由于有數(shù)千個智能體和數(shù)百萬個節(jié)點(diǎn),每毫秒發(fā)送數(shù)千條消息的成本遠(yuǎn)遠(yuǎn)無法忽略,成為一個計算負(fù)擔(dān)。

異步通信

智能體之間的通信是異步的。由于智能體的執(zhí)行是分布式的,所以沒有全局時鐘來同步智能體的動作。此外,在交換信息時,每個智能體都有一個郵箱,其中包含來自其他智能體的郵件,所以通信可能會延遲。在延遲期間,一個智能體可能會移動很遠(yuǎn),并且永遠(yuǎn)不會回復(fù)原始信息。

聯(lián)盟形成

 

某些目標(biāo)不能單獨(dú)實現(xiàn)(比如抬起重物)。因此,智能體可能會同意組成一組智能體,稱為聯(lián)盟(coalition),來實現(xiàn)共同目標(biāo)。

有了具備三種不同必要技能(探索、收集和積累)的智能體,一個至少包括三個智能體的聯(lián)盟才會形成。因此,必須實施創(chuàng)建和更新聯(lián)盟的協(xié)議??梢允褂?Shapley 值(由智能體聯(lián)盟創(chuàng)造的剩余額)來確定哪些聯(lián)盟是最有價值的。

即使是在簡單的問題設(shè)置中,有幾個障礙出現(xiàn)得非常快,算法的復(fù)雜性似乎是無法克服的。當(dāng)嘗試構(gòu)建行為類似人類的 AI 算法時,這是一個反復(fù)出現(xiàn)的現(xiàn)象。

讓 AI 執(zhí)行簡單的行為是困難的

「要讓計算機(jī)如成人般地做智力測試或下棋是相對容易的,但是要讓它們有如一歲小孩般的感知和行動能力卻是相當(dāng)困難甚至是不可能的?!筂oravec(1988),《Mind Children》

如果我們用人類替代智能體,我相信他們很快就會明白如何在這個游戲中取勝,他們會傳達(dá)他們在圖中所看到的信息,并形成聯(lián)盟來收集最多的寶藏。然而,對智能體實施嚴(yán)格的行為準(zhǔn)則卻是非常困難的。

莫拉維克悖論:

對人類來說容易的事對機(jī)器來說卻難以置信地困難。

說到下象棋,AI 表現(xiàn)出了超人類的水平。但是對于基本的人類行為,例如行走或協(xié)調(diào)行動來探索地圖,人工智能算法卻出奇地困難。

國際象棋大師加里·卡斯帕羅夫曾在《Deep Thinking》中寫道:任何足夠先進(jìn)的算法都不難在同時進(jìn)行的比賽中擊敗 20 名頂級棋手。但是沒有 AI(機(jī)器人)可以在擁擠的酒吧中四處走動和自行移動棋子。

機(jī)器學(xué)習(xí)在非常特定的情況下工作

但是你可能會問為什么我們不使用最新的機(jī)器學(xué)習(xí)(ML)算法來解決我們的問題呢?......ML-only 算法只能被用于特定的任務(wù)。

是的,強(qiáng)化學(xué)習(xí)(RL)算法非常流行,可以解決超難的問題,例如在 Atari 游戲或圍棋中展現(xiàn)出超人類的水平。但是這些游戲都是具備小數(shù)據(jù)輸入的全可視性游戲,這與我們的尋寶問題并不相同,因為地圖在開始時并不完全可見。

但是,OpenAI 不是在多智能體系統(tǒng)上,用機(jī)器學(xué)習(xí)算法在 Dota 2 的 5 vs 5 中戰(zhàn)勝了人類嗎?你可能會問。

是的,當(dāng)在 Dota 2 1 vs 1 中戰(zhàn)勝世界冠軍時,OpenAI 展現(xiàn)了令人印象深刻的結(jié)果。但是這主要是因為它們強(qiáng)大的計算能力,并不是人工智能的突破。

它們的目標(biāo)是利用一個包含 580 萬場比賽的數(shù)據(jù)集在 5 vs 5 比賽中獲勝。所以,它們似乎正在使用完全機(jī)器學(xué)習(xí)方法(從人類游戲中學(xué)習(xí))研究多智能體問題,并且似乎缺少多智能體系統(tǒng)的自上而下方法。

智能體不會推斷和概括。純機(jī)器學(xué)習(xí)可用于單個智能體或完全可觀察的系統(tǒng),但是多智能體系統(tǒng)不是一個完全已知的世界,必須采用一個更普遍的方法。

我們不知道如何實現(xiàn)可擴(kuò)展行為

在只有兩個智能體在走廊上朝相反方向走的時候,我們遇到了一個問題。實施協(xié)議來處理這一特定問題是可能的。

但是如果是 100 個智能體在具備 400 個節(jié)點(diǎn)的地圖上呢?

少數(shù)智能體的硬編碼功能與多智能體系統(tǒng)的可擴(kuò)展和可泛化實現(xiàn)之間存在差距。

需要做什么

經(jīng)過研究,必須開發(fā)特定的多智能體協(xié)議來解決這類問題。沒有先驗知識的學(xué)習(xí)不會教授智能體如何溝通,因為搜索空間太大。純數(shù)據(jù)驅(qū)動的方法不會帶來任何結(jié)果。

結(jié)論

實現(xiàn)一個解決尋寶問題的算法比看起來要困難得多。構(gòu)思能夠解決簡單問題的多智能體系統(tǒng)絕非易事。機(jī)器學(xué)習(xí)算法在過去十年中取得了巨大成果,但僅憑機(jī)器學(xué)習(xí)無法解決所有的人工智能問題。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

在科技飛速發(fā)展的當(dāng)下,人工智能與邊緣計算的融合正以前所未有的速度重塑著我們的生活。RK3576芯片擁有4核Cortex-A72以及4核Cortex-A53提供基礎(chǔ)算力,6TOPS算力NPU來模型推導(dǎo)運(yùn)算。使用YOLOv8...

關(guān)鍵字: 人工智能 邊緣計算 YOLOv8模型

廣州2025年9月9日 /美通社/ -- 在2025年柏林國際消費(fèi)電子展(IFA  2025)上,來自中國的清潔能源科技企業(yè),廣州疆海科技有限公司(征拓)以其前沿的...

關(guān)鍵字: 新能源 消費(fèi)電子展 人工智能 清潔能源

上海2025年9月9日 /美通社/ -- 為全面落實黨中央、國務(wù)院和上海市委、市政府關(guān)于加快發(fā)展人力資源服務(wù)業(yè)的決策部署,更好發(fā)揮人力資源服務(wù)業(yè)賦能百業(yè)作用,8月29日,以"AI智領(lǐng) HR智鏈 靜候你來&quo...

關(guān)鍵字: 智能體 AI BSP 人工智能

深圳2025年9月9日 /美通社/ -- 2025年9月3日,國際獨(dú)立第三方檢測、檢驗和認(rèn)證機(jī)構(gòu)德國萊茵TÜV大中華區(qū)(以下簡稱"TÜV萊茵&q...

關(guān)鍵字: 研討會 汽車行業(yè) ISO 人工智能

9月9日消息,今日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布《中國AI云市場,1H25》報告。

關(guān)鍵字: AI 人工智能

面對市場對更智能產(chǎn)品、更短設(shè)計周期以及更高效靈活生產(chǎn)流程的需求日益增長,設(shè)計與制造企業(yè)紛紛借助人工智能,推動業(yè)務(wù)流程邁向新高度。憑借處理復(fù)雜數(shù)據(jù)的卓越能力與傳遞智能洞見的便捷性,人工智能已準(zhǔn)備好在工業(yè)價值鏈的各個環(huán)節(jié)承擔(dān)...

關(guān)鍵字: 人工智能 工業(yè)物聯(lián)網(wǎng) 傳感器

重慶2025年9月6日 /美通社/ -- iChongqing新聞報道:2025世界智能產(chǎn)業(yè)博覽會于9月5日在重慶開幕,550余家企業(yè)參展,展示了從自動駕駛和人工智能(AI)座艙到擴(kuò)展現(xiàn)實(XR)影視和機(jī)器人咖啡廳的30...

關(guān)鍵字: 人工智能 新能源汽車 AI 機(jī)器人

北京2025年9月5日 /美通社/ -- 9月4日,在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上,北京經(jīng)開區(qū)對外發(fā)布,北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)(簡稱"北京經(jīng)開區(qū)&q...

關(guān)鍵字: 人工智能 模型 開源 AI

二十余項改革全國全市推廣,700余事項100%全程網(wǎng)辦 北京2025年9月5日 /美通社/ -- 9月4日,在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上,北京經(jīng)開區(qū)對...

關(guān)鍵字: DIY 人工智能 加速器 機(jī)器人

"十四五"期間GDP年均增長9.6%,每年安排產(chǎn)業(yè)發(fā)展資金超百億元 北京2025年9月5日 /美通社/ -- 9月4日,在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系...

關(guān)鍵字: 人工智能 自動駕駛 集成電路 4S店
關(guān)閉