日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 芯聞號 > 極客網
[導讀]自誕生以來,人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”,指的是大語言模型會將虛構信息當作真實事實輸出。

自誕生以來,人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”,指的是大語言模型會將虛構信息當作真實事實輸出。實際上,“幻覺”這一表述相當委婉,它實則暴露出AI的核心缺陷——當前的大語言模型尚未達到真正意義上的智能水平。

就在上個月,編程工具Cursor引發(fā)一場風波。用戶收到消息稱,其使用政策將進行調整,未來僅支持在單臺電腦上使用。然而,這條消息很快被證實為假。Cursor首席執(zhí)行官兼聯合創(chuàng)始人Michael Truell迅速出面澄清:“我們并未制定類似政策,用戶完全可以在多臺設備上使用Cursor。這一錯誤信息源于一線AI機器人的錯誤回復?!?

此次事件不僅讓用戶虛驚一場,更直觀展現了人工智能系統(tǒng)的不穩(wěn)定。

幻覺成為AI進化的攔路虎

經過數年發(fā)展,盡管AI技術在諸多領域取得突破,但在判斷信息真假時仍不盡如人意。即使是OpenAI、谷歌、DeepSeek等行業(yè)頭部機構研發(fā)的模型也存在許多錯誤輸出。

值得警惕的是,這些錯誤并未隨著時間推移而減少,反而呈現增多趨勢。誠然,AI在數學運算、編程領域有所提升,但在處理復雜事實性信息時依然存在明顯短板,難以滿足用戶需求。

今天的AI實際上是根據“復雜數學系統(tǒng)”構建的,它們通過不斷分析海量數字數據,持續(xù)優(yōu)化自身性能。然而,算法系統(tǒng)始終存在一個根本性缺陷——無法有效區(qū)分信息真假。在一項測試中,相較于舊版AI系統(tǒng),新版AI系統(tǒng)的“幻覺率”竟然更高,這說明AI面臨嚴峻挑戰(zhàn)。

Vectara專注于企業(yè)級AI工具開發(fā),其首席執(zhí)行官Amr Awadallah直言:“盡管我們傾盡全力,可‘幻覺’問題還是存在,它并沒有消失?!爆F狀表明,即便在專業(yè)團隊的持續(xù)攻堅下,AI“幻覺”依然是難以攻克的技術頑疾。

Okahu致力于解決AI“幻覺”問題,其首席執(zhí)行官Pratik Verma也指出:“判斷AI回應是事實還是虛假需要耗費大量時間。如果不能妥善處理這些錯誤,就無法保證人工智能系統(tǒng)發(fā)揮應有價值,畢竟這些系統(tǒng)的設計初衷是幫助用戶自動完成各項任務。”

AI企業(yè)并非不清楚“幻覺”問題的存在,它們付出了巨大努力,但始終無法有效解決這一難題。OpenAI的內部測試顯示,相比老系統(tǒng),它所開發(fā)的新系統(tǒng)“幻覺率”反而更高。

在PersonQA標準測試中,o3模型在33%的回答中產生幻覺,幾乎是o1模型(16%)的兩倍,而最新的o4-mini模型表現更差,“幻覺率”高達48%。若采用SimpleQA標準測試,情況同樣不容樂觀。o3和o4-mini的“幻覺率”分別達到51%和79%,o1模型的“幻覺率”也有44%。

OpenAI指出,AI系統(tǒng)從海量數據中學習,數據量之巨遠超人類專家的理解能力,因此很難確定問題根源究竟在哪里。

人類恐怕不能解決AI幻覺

華盛頓大學及艾倫人工智能研究所研究人員Hannaneh Hajishirzi表示,他們找到一種新方法,能夠追溯AI特定行為在訓練數據中的源頭。但由于系統(tǒng)學習的數據量過于龐大,新工具無法解釋所有情況。Hannaneh Hajishirzi坦言:“我們仍然搞不清這些模型到底是如何運行的?!?

Vectara近年來持續(xù)對AI系統(tǒng)展開測試,通過讓系統(tǒng)總結新聞內容的方式,觀察“幻覺率”的變化情況。然而,測試結果令人沮喪——“幻覺率”不僅未降低,反而呈上升趨勢。

長期以來,OpenAI認定一個理念:向AI投喂的數據越多,AI就會越聰明。但如今,AI在訓練時幾乎耗盡所有互聯網英文信息,它的幻覺卻愈發(fā)嚴重。這一現實表明,若想突破“幻覺”困境必須探尋新的技術路徑。

當前,工程師們開始倚重“強化學習”技術。在數學、編程等領域,強化學習確實能通過試錯機制實現學習與進步,但在部分領域,該技術仍未帶來明顯改善。

此外,推理模型在解答復雜問題時會先進行“思考”,采用分步解決的策略。然而,每個思考步驟都潛藏著產生“幻覺”的風險,思考步驟越多,累積的錯誤也就越多,這無疑給提升AI信息準確性帶來更大挑戰(zhàn)。

如今的AI能夠展示思考過程,使用戶可以看到錯誤產生的環(huán)節(jié),這無疑是技術層面的一大進步。然而研究人員發(fā)現,AI所展示的思考步驟可能與最終答案毫無關聯。Anthropic研究人員Aryo Pradipta Gema直言:“AI系統(tǒng)聲稱自己正在思考,但它的思考有時并無必要?!?

一些研究人員甚至認為,杜絕AI“幻覺”不可能實現,只能通過多種方法降低“幻覺率”。比如讓AI直面自身知識盲區(qū),主動向用戶承認“我不知道”;引入“檢索增強生成”技術,促使AI通過檢索相關文檔輔助作答,而非單純依賴記憶數據直接輸出答案。

美國東北大學體驗式人工智能研究所研究人員Usama Fayyad提出,“幻覺”這一表述存在概念偏差,它過度擬人化。Usama Fayyad強調,AI生成錯誤信息與人類產生幻覺存在本質差異——AI既無意圖,也無意識,應避免用帶有情感色彩的詞匯模糊技術本質。(小刀)

聲明:該篇文章為本站原創(chuàng),未經授權不予轉載,侵權必究。
換一批
延伸閱讀

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字: 工業(yè)電機 驅動電源

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅動電源 照明系統(tǒng) 散熱

根據LED驅動電源的公式,電感內電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅動電源

在現代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅動電源 功率因數校正

在LED照明技術日益普及的今天,LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現在的LED驅動電源

關鍵字: LED 驅動電源 開關電源

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器,通常情況下:LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅動電源
關閉