實際上,工業(yè)數據有三個特點。第一個特點是多模態(tài)。過去很簡單粗暴地將數據分成結構化數據、半結構化數據、非結構化數據,但工業(yè)企業(yè)不是這樣。今天看到的很多好像格式不一樣的、非結構化的工程數據,真正把它打開的時候是不一樣的。非結構化數據的使用效率取決于結構化的程度,只有結構化才可以被高效利用;第二個特點是高通量,很多設備是不停機的,所有的數據是7*24小時連續(xù)產生的,量非常大;第三個特點是強關聯(lián),在工業(yè)的不同行業(yè),數據關聯(lián)遵循不同的規(guī)律而非簡單的聚合。
所以工業(yè)大數據本身的特點帶來了非常多的挑戰(zhàn)。除了數據獲取的挑戰(zhàn),隨之而來的就是數據分析、應用的挑戰(zhàn)。這里邊最大的限制是因果關系,即數據驅動的方法只能告訴我們關聯(lián)性,而無法不能告訴我們因果性。比如淘寶推薦商品,只知道推薦相關商品,卻不關心這個事情的因果——為什么用戶是這樣的人。但這在工業(yè)上是行不通的,尤其是控制方面,因此模型需要長時間的分析和驗證。
工業(yè)領域存在白盒模型和灰盒模型,白盒模型即工業(yè)機理,企業(yè)會根據工業(yè)機理設計工序、產品結構和工藝,這是第一步。當它們被設計完之后,運行中又會出現大量的不確定性,這些不確定性的消除靠的就是專家、工匠的經驗,讓整個流程生產變得更加穩(wěn)定和高效,這是灰盒態(tài)。不再對機理和知識本身進行分析和理解的數據模型,是一種黑盒模型。
工業(yè)大數據和工業(yè)智能的本質就是,將這些經驗和知識量化學習出來,挖掘心中有口中無的隱性知識,或者嘗試通過數據方法把統(tǒng)計關系找到,再交還給工匠分析。工業(yè)就是工業(yè),它存在的時間比信息化時間長,積淀比信息化多,而大數據和人工智能技術只是給工業(yè)上帶來小的變化,嘗試幫它去消除不確定性。





