如何將5G網(wǎng)絡引入到機器學習中去
移動網(wǎng)絡正變得越來越復雜,在過去的十年里,互聯(lián)網(wǎng)設備數(shù)量高達數(shù)十億,已經(jīng)超過了地球上的人口數(shù)量,這些設備的出現(xiàn)和它們產(chǎn)生的大量數(shù)據(jù)對我們的日常生活有著重要的影響,而移動數(shù)據(jù)流量的暴漲給網(wǎng)絡帶來嚴峻的挑戰(zhàn)。因此,5G網(wǎng)絡應運而生,5G網(wǎng)絡有望實現(xiàn)超高速數(shù)據(jù)傳輸,連接的設備數(shù)量將是現(xiàn)有手機數(shù)量的10~100倍,超低延遲(約1ms)將是LTE網(wǎng)絡延遲時間的五分之一,5G網(wǎng)絡和服務將在數(shù)據(jù)流量、存儲和處理方面呈指數(shù)級增長。
5G為智能城市、智能電網(wǎng)、智能交通、智能制造等多種應用領域的大規(guī)模分布式應用和移動服務開發(fā)了全新的平臺,從而利用“智能”對象生成的海量數(shù)據(jù)更好地服務用戶。而增加網(wǎng)絡管理自動化、降低成本壓力是提高未來5G網(wǎng)絡活力的關鍵因素。此外,動態(tài)和復雜的5G網(wǎng)絡需要能夠自動適應環(huán)境和上下文變化的自動化,這就需要使用機器學習來分析處理海量數(shù)據(jù)。
機器學習是網(wǎng)絡自動化運維的最佳方案機器學習是一種自動建立分析模型的數(shù)據(jù)分析方法,是人工智能的一個分支,具有感知(例如異常檢測)、挖掘(例如服務分類)、預測(例如預測用戶或交通趨勢)和推理(例如配置系統(tǒng)參數(shù)以適應)的能力,其能夠在很短的時間內分析大量的數(shù)據(jù),學會適應時變環(huán)境,對未來事件做出相當準確的預測,并提出前瞻性的解決方案。
機器學習被認為是網(wǎng)絡運行和管理各種功能自動化的最佳解決方案,如資源管理、按需和自適應網(wǎng)絡配置、服務創(chuàng)建和編排、故障檢測、安全性、移動性管理、用戶體驗增強、策略動態(tài)調整等。
同時,機器學習系統(tǒng)可以從數(shù)據(jù)中學習、識別模式并以最少的人為干預做出決策,其核心是確定從網(wǎng)絡活動中識別的模式作為數(shù)據(jù)源,以確定網(wǎng)絡作為系統(tǒng)和用戶的行為。作為一個組件,在網(wǎng)絡和用戶設備之間進行信息交換時,會獲得大量的數(shù)據(jù)。這個場景為用戶提供了各種信息的來源,用戶可以結合這些信息得出結論。值得一提的是,在分析的系統(tǒng)中,必須考慮多個變量,企業(yè)可以從執(zhí)行用戶注冊、調用、移交、IP分配、數(shù)據(jù)流和其他過程的日志中測量和注冊這些變量。由于在每一次分析中處理的多個變量存在很多相關性,如果不使用計算輔助工具,是無法完成的。
從數(shù)據(jù)庫學習的過程是機器學習新的挑戰(zhàn),因為在這個過程中,企業(yè)尋找什么關系是未知的,只能沿著時間線的分析揭示系統(tǒng)的變化,并根據(jù)每個變量的值給出網(wǎng)上開發(fā)的活動圖像。在這種情況下,企業(yè)往往需要機器學習算法的支持來檢測和識別網(wǎng)絡上要分析的模式。
現(xiàn)有的機器學習主要有4類學習方式:一是監(jiān)督學習,其工作機制是利用已有標簽的數(shù)據(jù)對模型算法進行訓練和學習,使算法能夠對新數(shù)據(jù)進行正確的預測,主要包括分類與回歸問題;二是無監(jiān)督學習,這類學習的數(shù)據(jù)中沒有標簽,而訓練的目的是尋找數(shù)據(jù)中的內在關聯(lián)或結構,學習的過程中并不知道結果是否正確,主要包括聚類和降維問題;三是半監(jiān)督學習,半監(jiān)督學習指將大量的無標簽數(shù)據(jù)和少量有標簽數(shù)據(jù)放到一起進行訓練,以提高算法的學習性能,主要包括半監(jiān)督分類、半監(jiān)督回歸、半監(jiān)督聚類和半監(jiān)督降維等;四是強化學習,強化學習是讓算法通過不斷試錯,并調整策略以獲得優(yōu)策略,即在什么狀態(tài)下選擇什么行為可以獲得最好的結果,AlphaGo就是強化學習的典型案例。
如何在5G中使用機器學習?5G是將采用新的頻率來提供不同種類的服務,并基于服務所需的速度來選擇路由的通信,以獲得與所使用服務類型相兼容的最大性能的帶寬,實現(xiàn)覆蓋、傳播和滲透。該業(yè)務將以4G分析獲得的知識為基礎,采用頻率分配、載波聚合或Massive MIMO等不同技術相結合。為了設計新的模型,分段定義的模型是非常重要的,運營商可以基于服務區(qū)域和服務需求,測試得到預測函數(shù)。網(wǎng)絡管理服務的需求類型一旦改變,運營商將引入新的頻率和服務,以在映射區(qū)域中尋找增強的服務。
基于機器學習的新模型為運營商提供了引入兩種新的學習算法類型的機會,例如強化學習,這將引入反饋,以糾正和學習優(yōu)化所選變量的方法,并使用同調理論對算法進行多任務學習,系統(tǒng)學習過去基于相似條件獲得的其他解,然后通過貝葉斯網(wǎng)絡來預測網(wǎng)絡的最可能行為。使用此工具的網(wǎng)絡部署將允許使用測量系統(tǒng)的預測值,而獲得的值將用于向系統(tǒng)提供反饋,為驗證模型和增強基于機器學習的系統(tǒng)的學習能力提供了新的入口。
在學習系統(tǒng)中,定義工作的場景非常重要,首先定義系統(tǒng)的構成,通過變量行為預測函數(shù)來識別工作中的關聯(lián)變量、標準變量或邏輯變量,并使用基于變量及其統(tǒng)計的蒙特卡羅模型、馬爾可夫鏈或其他統(tǒng)計方法進行建模。該系統(tǒng)將提供“成長、重組、調整”3個學習階段:從環(huán)境中學習;從糾正中學習,并從這一行動中獲得新知識;根據(jù)從現(xiàn)實世界的經(jīng)驗感知中獲得的值進行調整。
5G將需要大量不同頻率和服務的節(jié)點,這種情況將造成一種復雜多變量的情況。機器學習為我們提供了在多變量場景中定義不同模式的工具,甚至顯示了那些我們不知道的模式。這種測試調整和網(wǎng)絡部署,需要在功率、天線高度之間尋找更好的平衡。從網(wǎng)絡部署中獲得的信息被存儲在一個空間數(shù)據(jù)基礎設施中,其可以通過技術參數(shù)顯示每個服務的覆蓋面和可用性。
一旦這個系統(tǒng)完成,運營商將有一個工具來評估場景的頻率、功率和地理信息,為進一步的模擬和模型驗證提供基礎。關于這一設想,作為規(guī)劃頻譜使用和占用的工具的應用,正處于早期階段,運營商需要收集和組織開發(fā)數(shù)據(jù)庫所需的數(shù)據(jù)集。利用地域接口使機器學習有機會刻畫從傳播演算中獲得的不同模式,并通過手持設備和軟件應用程序提供的協(xié)作感知進行對比。
數(shù)據(jù)的可用性將擴大人工智能發(fā)展在所有與人工智能和機器學習技術相關的過程中,一個重要的問題是原始數(shù)據(jù)所有權。數(shù)據(jù)源之間的區(qū)別在于數(shù)據(jù)所有權,因為其思想是促進數(shù)據(jù)共享以支持算法開發(fā)。數(shù)據(jù)是這個新生態(tài)系統(tǒng)的燃料,必須確保數(shù)據(jù)的可用性,以在最短的時間內提供尋找新模式和結論的結果。數(shù)據(jù)的可用性將擴大人工智能的發(fā)展。系統(tǒng)日志是非常重要的一部分,可以從不同通信系統(tǒng)收集的變量的定義,每個注冊變量與任何設備定位相結合,將為我們提供了解多個變量之間不同相關性的機會。因此,促進數(shù)據(jù)提供和信息共享的方式,是獲取有效數(shù)據(jù)的重要途徑。
當然,在5G網(wǎng)絡中引入機器學習時,需要根據(jù)應用場景選擇合適的算法,而且,具體應用場景下的機器學習算法還需要在實踐中進行驗證和演進。因此,真正實現(xiàn)5G網(wǎng)絡的智能化,仍然存在很多障礙,例如如何尋求公認的合適的機器學習算法,如何促進行業(yè)間協(xié)作、用戶數(shù)據(jù)收集及隱私保護,即數(shù)據(jù)所有權問題。因此,業(yè)界不僅要在機器學習算法研究方面實現(xiàn)突破,還需要促進相應的政策法規(guī)出臺,以保護用戶隱私信息和促進行業(yè)生態(tài)的健康發(fā)展。





