日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 統(tǒng)計學(xué)習(xí)理論是機器學(xué)習(xí)的重要基礎(chǔ),為許多機器學(xué)習(xí)算法提供理論支持,通過一些統(tǒng)計學(xué)的角度我們試圖找出從經(jīng)驗數(shù)據(jù)中得出有效結(jié)論這一過程的數(shù)學(xué)解釋。 簡單來說,機器學(xué)習(xí)主要是將來自輸入域的數(shù)據(jù)

統(tǒng)計學(xué)習(xí)理論是機器學(xué)習(xí)的重要基礎(chǔ),為許多機器學(xué)習(xí)算法提供理論支持,通過一些統(tǒng)計學(xué)的角度我們試圖找出從經(jīng)驗數(shù)據(jù)中得出有效結(jié)論這一過程的數(shù)學(xué)解釋。

簡單來說,機器學(xué)習(xí)主要是將來自輸入域的數(shù)據(jù)經(jīng)過未知的目標函數(shù)映射到輸出域的相應(yīng)數(shù)據(jù)上。 如果目標函數(shù)是已知的,那么我們根本不需要學(xué)習(xí),我們只需要按照函數(shù)直接計算就好了。 機器學(xué)習(xí)的基本前提就是使用一組數(shù)據(jù)來觀察和揭示數(shù)據(jù)中的潛在規(guī)律。 機器學(xué)習(xí)的目標就是從有限的樣本數(shù)據(jù)集中找到一個近似于目標函數(shù)的函數(shù)。

以機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)為例,監(jiān)督學(xué)習(xí)是從一組帶有標記的數(shù)據(jù)中學(xué)習(xí)。 訓(xùn)練集中的每個點都是輸入 - 輸出對的形式,將輸入映射到已知輸出。 學(xué)習(xí)目標即為能夠找到未知控制規(guī)則的最佳算法,這些規(guī)則通過對樣本數(shù)據(jù)分布的規(guī)律探索,構(gòu)建一個近似于目標函數(shù)的假設(shè)函數(shù),來根據(jù)輸入預(yù)測未知的輸出。 學(xué)習(xí)模型的性能或泛化性能是根據(jù)其對獨立測試數(shù)據(jù)的預(yù)測精度來衡量的。

目前機器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí),其中監(jiān)督學(xué)習(xí)又分為分類問題和回歸問題,無監(jiān)督學(xué)習(xí)則為降維和聚類。每一個分支都包括多種算法,不同算法的思想以及適用范圍為我們構(gòu)建高性能模型提供多種選擇。

為了選擇最佳模型然后評估其泛化性能,對用于訓(xùn)練算法的樣本數(shù)據(jù)集通常隨機分為2組:即訓(xùn)練集、測試集。其中訓(xùn)練集用于算法訓(xùn)練,讓算法學(xué)習(xí)數(shù)據(jù)中的潛在數(shù)據(jù)規(guī)律,并且通過調(diào)整算法的超參數(shù),獲得更加準確的算法模型。測試集用于評估不同模型的學(xué)習(xí)效果,反映模型的性能。

預(yù)測誤差或泛化誤差用來優(yōu)化模型,在機器學(xué)習(xí)中,對于任何問題我們建立模型的最終目標都是最小化誤差,其中誤差主要可以從三個方面來解釋:偏差、方差和噪聲。噪聲也稱為“不可避免的誤差”,對于噪聲我們無能為,因為它僅取決于我們用于訓(xùn)練的數(shù)據(jù),我們只能從偏差和方差來改進我們的模型,即尋求偏差-方差的平衡。

如果訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)是由一個固有的隨機過程,一個錯誤的問題,或者特征集是錯誤的或不完整的,那么任何算法都不會有好的準確率,所以用機器學(xué)習(xí)算法來解決問題的一個條件就是這個問題是能夠解決的,不能是一個未解之謎。這就是為什么數(shù)據(jù)科學(xué)家花費大約19%的時間來尋找好的數(shù)據(jù),另外60%的時間用于清理他們收集的數(shù)據(jù):數(shù)據(jù)的質(zhì)量直接決定機器學(xué)習(xí)模型準確性,

假設(shè)我們正在嘗試根據(jù)年齡等多個特征的訓(xùn)練數(shù)據(jù)集來預(yù)測人體重量。 年齡可能是預(yù)測體重時要考慮的特征之一,但還有許多其他因素表征體重,包括身高,性別,地理位置等。如果僅考慮年齡,那么很可能最終得到一個弱預(yù)測器或者一個具有很大泛化誤差的學(xué)習(xí)器。因此,對于給定的一組特征,噪聲在真實分布中可能不是真正的噪聲。 我們可能根本沒有從數(shù)據(jù)集中選擇足夠的特征以便能夠?qū)φ鎸嵎植歼M行建模。

如果算法非常精確地映射給定訓(xùn)練分布的所有數(shù)據(jù)點,則肯定會對該特定訓(xùn)練數(shù)據(jù)產(chǎn)生非常小的誤差。 然而在對測試數(shù)據(jù)進行預(yù)測時則會有很差的效果,那么你的模型就過擬合了。換句話說,該模型學(xué)習(xí)能力太強,受到數(shù)據(jù)中噪聲的影響就越大,一般來說,方差可以表示算法對特定訓(xùn)練數(shù)據(jù)集的敏感性。 高方差表明該算法非常適合數(shù)據(jù),并且對于數(shù)據(jù)分布建立了過于復(fù)雜的模型,因此表示模型過度擬合。

另一方面,我們既不能選擇過于簡單且不夠表達的模型來反映事件的數(shù)據(jù)分布,這時就會出現(xiàn)欠擬合的問題。想象一下,使用線性回歸來映射具有非線性模式的訓(xùn)練數(shù)據(jù)集:線性回歸只是一條線而且對于非線性數(shù)據(jù)集來說太過單一。 通常我們使用偏差來表示機器學(xué)習(xí)算法無法擬合或不能足夠好地表示訓(xùn)練集中數(shù)據(jù)的分布。 換句話說,偏差給模型所做的簡化假設(shè)提供了一個維度,使目標函數(shù)更容易學(xué)習(xí),如果偏差值過大則說明模型欠擬合。因此我們用方差表示過度擬合,偏差表示欠擬合。

從統(tǒng)計學(xué)的角度來看,這是一個非常著名的偏差 - 方差平衡問題。能夠找到一個能夠很好地平衡偏差和方差的算法,我們才能通過最簡單的近似模型來獲得最佳的泛化性能。為了提高性能,我們可能需要選擇不同的算法來得到更大的假設(shè)空間和覆蓋更廣的區(qū)域,但是請記住,我們試圖接近的目標函數(shù)僅來自一組有限的樣本數(shù)據(jù)。 不是來自真實的、完整的。 雖然樣本數(shù)據(jù)是我們學(xué)習(xí)的全部內(nèi)容,但有限的數(shù)據(jù)集只能代表對描述整個現(xiàn)象的實際函數(shù)的估計。如果我們非常接近描述樣本分布的函數(shù),產(chǎn)生較低的偏差,則風(fēng)險是當(dāng)我們使用新建的函數(shù)模型預(yù)測新的數(shù)據(jù)就會出現(xiàn)較高的方差。正如我們剛才所說的那樣,我們模型的復(fù)雜性會影響其性能,我們需要找到一種以定量的方式定義復(fù)雜性的方法,其中,Vapnik-Chervonenkis維度是一種廣泛使用的方法,可以在偏差和方差兩者之間找到適當(dāng)?shù)钠胶恻c。

VC維與每個模型的參數(shù)數(shù)量相關(guān),而參數(shù)的數(shù)量又與模型可以處理的數(shù)據(jù)點的數(shù)量相關(guān)聯(lián)。其主要思想是模型想要近似的數(shù)據(jù)點數(shù)量越多,模型映射它們所需的參數(shù)數(shù)量就越多,這就增加了復(fù)雜性并使模型非常特定于該數(shù)據(jù)集。 在測量算法復(fù)雜度時,VC維度可以幫助我們估計預(yù)測誤差,為我們提供關(guān)于算法是否可以在給定樣本數(shù)據(jù)集的情況下學(xué)習(xí)和推廣的概率評估:與可用訓(xùn)練數(shù)據(jù)的數(shù)量相比較低的VC維度將建議測試錯誤不會遠離訓(xùn)練錯誤。

總體來說,機器學(xué)習(xí)就是通過處理得到好的數(shù)據(jù),用數(shù)據(jù)來訓(xùn)練一個能達到我們預(yù)期目標的模型,且模型越簡單越好。具體算法的選擇則可根據(jù)我們的日常喜好,能決定模型效果的還是數(shù)據(jù)的質(zhì)量,因此鍛煉一個很強的數(shù)據(jù)分析能力是很重要的。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應(yīng)用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉