日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當前位置:首頁 > 智能硬件 > 人工智能AI
[導讀] 在過去的幾年間,數(shù)據(jù)社區(qū)已經(jīng)在關注收集和整理數(shù)據(jù),為此目的構(gòu)建基礎設施,并使用數(shù)據(jù)來改善決策制定?,F(xiàn)在我們看到,在很多垂直領域,對于高級分析和機器學習的興趣高漲。 在本博文里,我會分享和

在過去的幾年間,數(shù)據(jù)社區(qū)已經(jīng)在關注收集和整理數(shù)據(jù),為此目的構(gòu)建基礎設施,并使用數(shù)據(jù)來改善決策制定?,F(xiàn)在我們看到,在很多垂直領域,對于高級分析和機器學習的興趣高漲。

在本博文里,我會分享和解釋我在今年9月的Strata數(shù)據(jù)紐約大會上的演講,以此來為那些希望增加機器學習能力的企業(yè)提供一些建議。這些信息來自于和業(yè)界從業(yè)人員、研究人員和企業(yè)家的對話,他已經(jīng)把機器學習應用在非常多的不同領域的問題里。

和其他的技術與方法類似,一個成功的機器學習項目是從找到一個正確的應用場景開始的。機器學習有非常多可能的應用,例如推薦系統(tǒng)和降低客戶流失等。一個有用的機器學習應用的分類如下:

能增強決策制定的應用

能帶來業(yè)務運營改進的應用

能產(chǎn)生收入的應用

能預測或者防止欺詐或風險的應用

為了能成為“機器學習型企業(yè)”,讓你自己了解開始部署模型時將會面臨的困難是非常有益處的。如果你去咨詢那些機器學習的先行者,通常會得到如下三個東西:

數(shù)據(jù):目前大部分應用個都依賴于監(jiān)督學習。因此一切都要從擁有高質(zhì)量的標注(訓練)數(shù)據(jù)集開始。

工程化:你怎么能把一個原型變成生產(chǎn)系統(tǒng)?你如何在模型部署上線之后監(jiān)控它的表現(xiàn)?

模型:現(xiàn)在的機器學習庫已經(jīng)能把模型和數(shù)據(jù)適配變得很容易,那還有什么挑戰(zhàn)?

在文章下面的內(nèi)容里,我會逐個講述這些挑戰(zhàn)。

在構(gòu)建標注數(shù)據(jù)集來訓練你的機器學習模型時,重要的一點就是使用你已經(jīng)能找到的數(shù)據(jù)。新的數(shù)據(jù)源在持續(xù)地出現(xiàn),數(shù)據(jù)集成是大部分公司都在做的工作。你目前在數(shù)據(jù)基礎設施上的投入可能已經(jīng)給你足夠的數(shù)據(jù)來開始了。你也可以使用公共(開源)的數(shù)據(jù)來增強你現(xiàn)有的數(shù)據(jù)集,或是去從第三方購買數(shù)據(jù)來增強。

好消息是機器學習社區(qū)已經(jīng)意識到訓練數(shù)據(jù)是一個主要的瓶頸。研究人員已經(jīng)在研究一些能用比較少的訓練數(shù)據(jù)開始的技術(弱監(jiān)督),以及可以讓你把一個問題里獲得的知識用于另外的場景(遷移學習)。

隨著數(shù)據(jù)重要性的增加,已有一些創(chuàng)業(yè)公司和企業(yè)在探索數(shù)據(jù)交易。數(shù)據(jù)交易讓企業(yè)間相互分享一些數(shù)據(jù)成為可能,同時還能保證私密性和隱秘性。目前已經(jīng)有一些研究成果來開發(fā)安全機器學習算法。對一些應用,如消費金融業(yè)里的欺詐檢查,能在保證隱私和安全的情況下,分享私密數(shù)據(jù)可能被證明是有價值的。

今年早些時候,我們注意到企業(yè)已經(jīng)開始定位一個新的角色,它專門把機器學習的模型進行生產(chǎn)化部署,并監(jiān)控部署后的表現(xiàn)。但是這個機器學習工程師的角色就真的必要嗎?

對越來越多的公司來講,答案是肯定,這樣的專業(yè)技能是必須的。如果要列出一個能生產(chǎn)化并監(jiān)督模型必須了解的事情的清單,最后你會看到一堆工具和技術的列表。更具體的細節(jié),建議你看看我之前的一篇博文《應用數(shù)據(jù)科學的現(xiàn)狀》。

機器學習研究的發(fā)展速度是很快的??梢怨降卣f,大部分企業(yè)是無法跟上研究出新技術和工具的速度。思考一下這個思維試驗:想象一下未來五年,所有的研究進展都暫停(絕不可能,但是請允許我幽默一下)。我堅定地認為依然有足夠的工具能讓企業(yè)忙活一陣子來學習。

用深度學習這一已經(jīng)成功地應用于計算機視覺和語音的技術作例子。絕大部分的企業(yè)依然處于應用深度學習的早期階段,不管是把它用于企業(yè)已經(jīng)熟悉的數(shù)據(jù)(文本、時間序列數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù))或是使用它來代替現(xiàn)有的模型(包括他們現(xiàn)有的推薦系統(tǒng))。我認為在未來的幾年里會看到很多使用深度神經(jīng)網(wǎng)絡(DNN)的有趣案例。

深度學習帶來了所有令人激動的東西,但也因此我們時常會忘記還有很多有趣的新數(shù)據(jù)應用并不依賴于神經(jīng)網(wǎng)絡。請選擇適合你的技術和業(yè)務需求的那些技術。

隨著模型被推入邊緣設備,我對近期在聯(lián)合與協(xié)作學習方面的研究進展非常感興趣。展望AI,可獲得的在線和持續(xù)學習的工具將會變得非常重要。

數(shù)據(jù)社區(qū)正在開始明白對于模型而言,遠遠不僅僅只是優(yōu)化一個定量或是業(yè)務指標那么簡單。模型足夠魯棒從而能應對對抗攻擊嗎?對特定的應用模型來說,可解釋與可理解是必須的嗎?

公平:你是否理解你的訓練數(shù)據(jù)的分布?如果不是的話,請意識到過去的歧視將很有可能導致未來的歧視。

透明:隨著機器學習變得無處不在,用戶正越來越想知道企業(yè)在對什么指標進行優(yōu)化,并想對此發(fā)表意見。

盡管機器學習領域在近幾年已經(jīng)取得了很多進步,但是依然有很多研究人員和理論家不知道的東西。我們尚處在“試錯”的階段。深度學習可能是降低了特征工程的必要,但是在構(gòu)建深度神經(jīng)網(wǎng)絡時依然有很多需要決定的東西(包括網(wǎng)絡架構(gòu)和非常多的超參數(shù))。

可以把模型的構(gòu)建看成是對機器學習算法空間的探索。企業(yè)需要能以有原則和高效的形式來進行探索。這意味著企業(yè)要維護可再生的管道、保存試驗里的元數(shù)據(jù)、擁有協(xié)作的工具和利用最新的研究成果。

那么,企業(yè)正在構(gòu)建的什么東西可以讓這一探索成為可能?大部分機器學習都要求有標注(訓練)數(shù)據(jù),因此任何數(shù)據(jù)平臺開始都要有魯棒的數(shù)據(jù)管道,能夠把數(shù)據(jù)導入存儲系統(tǒng),讓數(shù)據(jù)科學家和機器學習工程師可以使用。數(shù)據(jù)集成不是一件無足輕重的事情,是所有的企業(yè)都要做并會持續(xù)做的工作。

企業(yè)也正在賦能數(shù)據(jù)科學家來分享特征和能產(chǎn)生這些特征的數(shù)據(jù)管道。為了給你一個關于特征的重要性的概念,看看這個事實:大部分企業(yè)都能很容易地告訴你它們用了什么算法;但是他們卻很難描述哪些特征對模型最有用。

領先的企業(yè)讓他們的數(shù)據(jù)科學家使用多種機器學習庫。強迫你的數(shù)據(jù)科學家只使用一到兩個“保佑”過的庫時很瘋狂的。因為數(shù)據(jù)科學家們要能做實驗,這可能就意味著讓他們能使用多種庫。

已經(jīng)出現(xiàn)了一些公司,他們能提供生產(chǎn)化部署機器學習模型的工具,并可以在部署后監(jiān)控模型。一些企業(yè)也在利用開源技術來開發(fā)自己的部署和監(jiān)控工具。如果你在尋找一個開源的工具來部署和監(jiān)控模型,可以看看加州大學伯克利分校RISE實驗室的新項目——Clipper。它可以讓你很容易地部署用多種流行的機器學習庫編寫的模型。更為重要的是,Clipper團隊最近加入了模型的監(jiān)控部分。(一些企業(yè)將會在2018年3月的Strata數(shù)據(jù)圣何塞大會上介紹他們部署和監(jiān)控模型的方法。)

想成為“機器學習型企業(yè)”, 你需要工具和流程來克服數(shù)據(jù)、工程和模型方面的挑戰(zhàn)。很多企業(yè)僅僅是剛開始在他們的產(chǎn)品里使用和部署機器學習。工具正在被持續(xù)地改進,最佳實踐也開始出現(xiàn)。

This arTIcle originally appeared in English: “How companies can navigate the age of machine learning”。

Ben Lorica是O‘Reilly Media公司的首席數(shù)據(jù)科學家和數(shù)據(jù)內(nèi)容策略總監(jiān),他還是Strata數(shù)據(jù)大會和O’Reilly人工智能大會的項目主管。他將商務智能、數(shù)據(jù)挖掘、機器學習和統(tǒng)計分析應用到了各種領域,包括直接營銷、消費者和市場研究、精確廣告投放、文本挖掘以及金融工程。他曾在投資管理公司、互聯(lián)網(wǎng)創(chuàng)業(yè)公司以及金融服務業(yè)任職。

本站聲明: 本文章由作者或相關機構(gòu)授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設備,其驅(qū)動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設計中至關重要的兩個環(huán)節(jié),集成化方案的設計成為提升電機驅(qū)動性能的關鍵。

關鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設計、生...

關鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字: LED 設計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關鍵元件,其性能直接影響到電動汽車的動力性能和...

關鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設中,街道及停車場照明作為基礎設施的重要組成部分,其質(zhì)量和效率直接關系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關鍵字: LED照明技術 電磁干擾 驅(qū)動電源

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關鍵字: LED 驅(qū)動電源 開關電源

LED驅(qū)動電源是把電源供應轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字: LED 隧道燈 驅(qū)動電源
關閉