今天,面對AI如此重要的江湖地位,深度學習作為重要的一個研究分支,幾乎出現(xiàn)在當下所有熱門的AI應用領域,其中包含語義理解、圖像識別、語音識別,自然語言處理等等,更有人認為當前的人工智能等同于深度學習領域。
如果在這個人工智能的時代,作為一個有理想抱負的程序員,或者學生、愛好者,不懂深度學習這個超熱的話題,似乎已經(jīng)跟時代脫節(jié)了。
但是,深度學習對數(shù)學的要求,包括微積分、線性代數(shù)和概率論與數(shù)理統(tǒng)計等要求,讓大部分的有理想抱負青年踟躕前行。那么問題來了,理解深度學習,到底需不需要這些知識?關子就不賣了,標題已經(jīng)說明。
前段時間,編輯閑逛各大社區(qū)論壇,發(fā)現(xiàn)一篇非常適合初學者學習的深度學習的回復帖子,用風趣的白話和例子深入淺出的分析了深度學習的過程,非常通俗易懂。通過與在西門子從事人工智能領域的楊安國老師溝通,獲得內容編輯授權,把內容重新整理修正,內容更加通俗易懂,希望人人都能夠理解深度學習。
關于深度學習,網(wǎng)上的資料很多,不過貌似大部分都不太適合初學者。楊老師總結了幾個原因:
1、深度學習確實需要一定的數(shù)學基礎。如果不用深入淺出地方法講,有些讀者就會有畏難的情緒,因而容易過早地放棄。
2、中國人或美國人寫的書籍或文章,普遍比較難一些。
深度學習所需要的數(shù)學基礎并沒有想象中的那么難,只需要知道導數(shù)和相關的函數(shù)概念即可。高等數(shù)學也沒學過?很好,這篇文章其實是想讓文科生也能看懂,只需要學過初中數(shù)學就完全可以。
其實不必有畏難的情緒,比較推崇李書福的精神,在一次電視采訪中,李書福說:誰說中國人不能造汽車?造汽車有啥難的,不就是四個輪子加兩排沙發(fā)嘛。當然,他這個結論有失偏頗,不過精神可嘉。
導數(shù)是什么?無非就是變化率。
比如:王小二今年賣了100頭豬,去年賣了90頭,前年賣了80頭。。。變化率或者增長率是什么?每年增長10頭豬,多簡單。這里需要注意有個時間變量---年。王小二賣豬的增長率是10頭/年,也就是說,導數(shù)是10。
函數(shù)y=f(x)=10x+30,這里我們假設王小二第一年賣了30頭,以后每年增長10頭,x代表時間(年),y代表豬的頭數(shù)。
當然,這是增長率固定的情形,而現(xiàn)實生活中,很多時候,變化量也不是固定的,也就是說增長率不是恒定的。比如,函數(shù)可能是這樣: y=f(x)=5x2;+30,這里x和y依然代表的是時間和頭數(shù),不過增長率變了,怎么算這個增長率,我們回頭再講?;蛘吣愀纱嘤涀讉€求導的公式也可以。
深度學習還有一個重要的數(shù)學概念:偏導數(shù),偏導數(shù)的偏怎么理解?偏頭疼的偏,還是我不讓你導,你偏要導?都不是,我們還以王小二賣豬為例,剛才我們講到,x變量是時間(年),可是賣出去的豬,不光跟時間有關啊,隨著業(yè)務的增長,王小二不僅擴大了養(yǎng)豬場,還雇了很多員工一起養(yǎng)豬。所以方程式又變了:y=f(x)=5x2;+8x + 35x +30
這里x代表面積,x代表員工數(shù),當然x還是時間。
上面我們講了,導數(shù)其實就是變化率,那么偏導數(shù)是什么?偏導數(shù)無非就是多個變量的時候,針對某個變量的變化率。在上面的公式里,如果針對x求偏導數(shù),也就是說,員工對于豬的增長率貢獻有多大,或者說,隨著(每個)員工的增長,豬增加了多少,這里等于35---每增加一個員工,就多賣出去35頭豬。 計算偏導數(shù)的時候,其他變量都可以看成常量,這點很重要,常量的變化率為0,所以導數(shù)為0,所以就剩對35x求導數(shù),等于35. 對于x求偏導,也是類似的。
求偏導我們用一個符號表示:比如 y/ x就表示y對x求偏導。
廢話半天,這些跟深度學習到底有啥關系?當然有關系,深度學習是采用神經(jīng)網(wǎng)絡,用于解決線性不可分的問題。關于這一點,我們回頭再討論,大家也可以網(wǎng)上搜一下相關的文章。這里主要講講數(shù)學與深度學習的關系。先給大家看幾張圖:
圖1. 所謂深度學習,就是具有很多個隱層的神經(jīng)網(wǎng)絡。
圖2.單輸出的時候,怎么求偏導數(shù)
圖3.多輸出的時候,怎么求偏導數(shù)。





