本文對人工智慧技術的原理、技術分類及其技術特徵進行簡單的介紹;列舉一些人工智慧技術在工業典型場景中的應用並對於如何搭建這樣一套工具或者平台提出自己的一些建議。
2016年 AlphaGo 橫空出世,人工智慧、機器學習技術名噪一時。
隨著時間的發展,人工智慧在工程應用上愈發成熟,車牌自動識別、智能客服機器人、廣告推薦等一系列的應用在工程和商業上均取得成功。
而在工業領域,人工智慧也沒有停下發展的步伐,預測性維護、質量控制、智能化排產等領域也一直在探索工程落地和商業可行的進程中取得長足的進展。大量的科技巨頭和專家預測人工智慧將帶來第四次革命,繼農業革命,工業革命,信息革命后從底層改變我們的工作和生活。
作為當前最熱門的風口領域之一,人工智慧在工業場景中的應用深度和廣度與消費領域相比仍有較大差距。
因為場景通用性差、投資建設成本高等原因,導致商用化上仍局限於部分高端製造的場景,無法做到像OA、ERP、CRM等系統同水平的普及。
對於AI+工業互聯網融合的產品探索者而言,下一步最關鍵的問題還是具體場景落地和商用化的問題。
本文是我從科普的角度,將所學習的人工智慧技術以及關於在工業場景中的應用的思考進行一些總結和整理,如有不對的地方還請各路大神磚家指正。
一、認識人工智慧
1. 以機器學習為例
大到經濟的運行,小到蘋果落在「倒霉」的牛頓頭上,世界上所有事物的發展都是由客觀規律驅動的。它大概是這樣一個模型:
就蘋果砸腦袋這件事兒而言,萬有引力和牛頓力學是驅動事物發展的客觀規律,我們可以通過它精準的判斷蘋果落下來需要多少秒、砸在腦袋上有多大的動量等具體結果。
對於經濟問題來說,這個模型就會複雜的多了。
比如現在受疫情影響下,我們要討論成都的房價漲跌的問題。雖然能夠馬上判斷房價會受到了包括了供需平衡等經濟學模型等客觀規律的支配;但是很明顯的,即便是我們知道了疫情進展、政府投資計劃、主城5區新增戶籍人口等所有的詳細數據,我們還是無法準確的判斷未來半年和一年房價究竟會上浮多少,或是下跌多少。
這裡就反映出一個問題:系統運營的規律越是複雜,就越難以通過歸納和推導的手段總結出客觀存在的規律。
機器學習技術使得計算機可以從海量的案例中通過訓練歸納總結出其內在規律。
在創新工場CEO李開復著的《人工智慧》一書中,對機器學習有一個定義:
機器學習……是一種用數學模型對真實世界中的特定問題進行建模,以解決該領域內相似問題的過程。這樣的技術特徵使得其在解決很多我們在生活、生產中,用傳統的方法難以解決或解決成本很高問題。
2. 人工智慧的分類
進入九十年代,以概率統計建模、學習和計算為主的演算法潮流開始佔據主流。與此同時,人工智慧的研究也開始逐漸分化為幾個主要的學科:
- 計算機視覺:讓計算機看懂世界;
- 自然語言理解和交流(包括語音識別,合成,包括對話):讓計算機聽懂世界並和世界交流;
- 機器學習 (各種統計的建模,分析工具和計算的方法),像時下流行的深度學習和AlphaGo涉及的增強學習(Re-enforcement Learning)就都是這個方向的分支;
- 認知和推理 (包含各種物理和社會常識),讓計算機學會思考;
- 機器人學:包括機械,控制,設計,運動規劃,任務規劃等等;
- 博弈與倫理 (主要研究多代理人的交互,對抗與合作,機器人與社會融合等議題)。
3. 人工智慧的要素
人工智慧要解決一個具體的項目,需要至少三個關鍵要素:
- 海量的數據:計算機無法理解和識別客觀世界的規律,它需要海量的數據作為樣本進行訓練:人臉識別需要計算機大量在觀看了大量的人臉照片,機器故障的識別和預測也需要讀取海量的監控數據。
- 充足的算力:近年來人工智慧再次迎來熱潮,很大程度上得益於計算機晶元技術的發展,按照Nvidia CEO黃仁勛的說法,每10年GPU性能增長1000倍,遠超摩爾定律。即便是這樣,人工智慧計算的效率仍是遠低於人腦的,需要大量的晶元提供計算支撐。
- 合適的模型:機器學習有監督學習、無監督學習等多達幾十種演算法模型,每一個模型均有大量的參數需要配置。機器判斷的準確性高度依賴於選擇正確的演算法和參數的配置。
上述條件是人工智慧執行一個成功任務的基本要求。亞馬遜的Principal Scientist夏威將此比喻為:
如果把一個成功的人工智慧演算法比作一隻善戰的部隊的話,數據就是糧草,計算力就是兵力,而模型則是戰略和戰術指揮的策略;戰略和戰術的重要性自不必說,但沒有了糧草和兵力,再好的戰略也只是空中樓閣。計算力可以理解為兵力,有了強大的兵力,才有了實現戰略的機動性和可能性。
4. 在工業應用中人工智慧有哪些優勢和劣勢
優勢
- 首先是對所解決問題的兼容。機修鉗工分析設備故障,熱處理工控制工藝參數,在技能經驗上是互不相關的;而採用機器學習的方法分別解決上述兩個問題,其開發資源和技術實現路徑都是幾乎一樣的。
- 其次是AI是忠於客觀的。人的總結判斷往往有局限,容易忽視一些次要因素。而人工智慧並不會從物理意義或者社會意義角度來解釋規律,它只對樣本和結果負責,這樣它就可以客觀反映人類通過正向分析遺漏或誤判的內容。
劣勢
- 首先是對數據的數量和質量高度依賴。而人類只需要簡單的幾張圖片就能夠辨識不同品種的貓,而一個機器學習系統要識別需要讀取上萬張圖片才能做到。
- 此外,我們在工程上獲取的數據通常是異構的,這意味要形成機器學習可讀的數據源,需要我們投入大量的工程資源進行數據的治理,這將大幅增加成本。
- 其次是人工智慧任務完成的質量是和從業人員的技能水平高度相關。上文提到的三大要素中,除了算力外,數據、模型都是需要具體從業人員配置。然而供需不平衡導致市場上充斥著大量的演算法工程師都還停留在調庫和調參的層次和水平上,誇張一點講,「參數基本靠蒙,結果基本靠試,效果基本靠吹」的情況也是存在的。
- 最後就是成本了。在人工智慧熱門的當下,無論是組建數據中心的成本,還是招募演算法工程師的成本都居高不下,這導致收益平衡點后移,減少商用的可能。
二、人工智慧在工業應用中的場景
1. 工業場景及痛點
工業是由眾多的場景組成的,可以從行業維度(機加工、電子產品、化工等)、產品的生命周期維度(設計、製造、銷售、運維)等逐層分解。
即便是每一個細分場景,例如針對機床的維修保養服務,也是多人參與的複雜工作,存在這個場景特有的痛點:
- 難以找到進行設備保養的合適時間;
- 難以判斷設備故障的原因;
- 設備故障維修的知識都在各位老鉗工的腦子裡,面對無法維修的設備時,只能通過人脈和經驗去尋找維修資源等等;
- 同樣的,在生產計劃制訂的場景,存在計劃排程的問題;
- 對於安全管理的場景,存在隱患識別和排查的問題。
企業是逐利的,所有的問題(包括使用體驗的問題,效率的問題,準確性的問題)最終只要影響到企業收益,都是成立的真實痛點。
現在上述場景基本都是人去處理的,維護保養周期靠工人統計台時判斷,安全隱患識別也需要大量的人員到現場巡查,或者在監控室目不轉睛地看著;否則就容易漏掉安全隱患。
如果排程不合理會導致資源空閑,排程耗費的時間過長,投入資源過多;安全如果出事了,小則整改,大則關停追責。
2. 場景分類
在工業場景中,既有重複性的、常識性的腦力勞動,也有優化等複雜的腦力勞動。
按照需要解決的問題的目標不同,我們可以將工業場景AI應用分為以下幾個類別,:
- 系統最優的問題:生產計劃排程、結構優化、工藝參數優化等;
- 分類或識別的問題:安全隱患的識別、故障類型的判斷、質量問題識別等;
- 推薦和預測的問題:機器維護的預測、態勢預測、輔助決策等;
- 知識管理的問題:知識識別和維護、客服機器人的應用等。
3. 典型場景的分析
因技術實現途徑類似,從每個類別中,各取一個簡要分析,其他就不展開了。
1)工藝參數優化
從需求有效性方面來說
工藝參數優化對於很多企業都是優先順序極高的迫切需求,特別是流程化工領域更甚。
舉個栗子,硝化棉等化工產品的生產工藝過程就類似於「燒菜」,加「料」(原材料)的多少,「火候」(溫度、壓力、攪拌等)的控制,對結果(均勻度、成分含量等)都可能產生影響,但工程上很難準確判斷各因素對結果會產生何種量化的影響,它本質是一個「黑盒」系統。
傳統的做法就是不斷地試,做新產品要試,換批次要試,一直做到一個批次質量損失可以接受就按這個方法投產了。
因此,工藝參數優化的問題是亟需人工智慧技術來解決的。
從技術可實現性來說
通常是大量對過去生產的批次進行分析,其中將投料、工藝參數數據作為自變數,質量數據作為因變數;進行訓練,建立模型,從而找到其內在的量化關係。
從商業價值角度來說
即便是同一個產品、同一種工藝,在不同的環境下,例如海南的化工企業和甘肅的化工企業所處環境溫濕度有很大差異。部分工藝都可能因為外界環境的變化而導致演算法準確度降低或失效,模型需要針對每個具體的場景定製,很難復用。
同時,工藝參數優化會明顯受到生產規模和批次的制約——生產規模越大,單批次產量越高,產品單位價值越高或者質量損失風險越高,使用AI進行工藝優化就越可行。
網上可以找到眾多的相關成功案例。
以下案例來源於中國工程院院士鄔賀銓的演講。
「台灣中鋼公司,他們引進了IBM的Power AI解決方案,用於分析軋鋼過程中的缺陷。為了將27噸的鋼坯,軋到0.5毫米的成品,預測和分析過程中的缺陷,他們收集了過去一年7000多批次的產品數據。經過數據清洗,篩選出了可能影響產品質量的特徵數據,並且轉換成了可供機器學習使用的數據。
這些數據中,80%拿來做學習,20%拿來做檢驗。然後他們設計了4種數學模型,來看哪種模型更符合實際情況。最後他們根據模型分析一條產品線產生的2000多個數據,發現爐內壓力對缺陷影響最大。最後中鋼公司在人力資源和鋼坯質量方面,都得到了很好的改進,成本大幅降低。」
2)安全隱患識別
從需求的角度來說
工廠很多危險行為(如違規操作設備、爭鬥打架等)是通過現場檢查和視頻監控才能發現的,如果能通過視頻圖像識別的話,就能夠實時發現隱患並處理。
從技術可實現性來說
其實現大致流程就是做算例→配演算法→訓練→嵌入框架程序用於應用。嵌入框架程序有兩種,一種是嵌入硬體的嵌入式程序,一種是服務端的web程序。此外,車牌識別,人臉識別,安全隱患識別是高度依賴於場景的。
同樣的行為,角度不同、背景不同,都可能產生誤判,以為著需要針對場景定製。
從商業價值角度來說
受限於危險行為場景異常複雜,無法復用且需要定製,短期內很難做到類似車牌識別系統的產品化,導致其可用場景其實非常有限的。
3)設備維護預測
從需求的角度來說
企業的設備類似於車輛,需要定期保養,更換零部件。一般汽車廠家為了免責而規定要求五千或者一萬公里保養一次,而一般老司機是不按這個來的,他們會根據行駛工況選擇合適的保養時機。
用於生產的機械設備通常是按工時來保養的,有的企業甚至連工時都無法統計(上下游標準不一或缺乏手段),導致錯過保養時間使得設備故障頻發。如果能夠根據實際工況給出維護保養建議,便能有效解決這個問題。
從技術可實現性來說
其技術實現路徑大致和工藝參數優化一樣,不同的是自變數變成了設備的檢測到工況參數,因變數變成了故障統計數據集。
從商業價值角度來說
其面臨的問題和工藝參數優化一樣,受到無法復用的限制,需要大量的同類型設備才能減少邊際成本。一旦成功應用,可以極大節省設備運營和維護成本。
以下案例來源於富士康:
由於銑刀在高轉速下進行不連續切削,刀具磨損迅速且難於監測,並且刀具磨損嚴重影響加工精度與產品質量。針對高速銑削刀具磨損難以在線預測,提出了一種基於深度學習的高速銑削刀具磨損預測的新方法。通過小波包變換提取銑削力信號,在不同頻段上的能量分佈,作為初始特徵向量。採用無監督學習對稀疏自編碼網路進行特徵學習,並將單層網路堆棧構成深度神經網路。最後,利用有監督學習對整個深度網路進行微調訓練,建立銑削刀具磨損預測模型。實驗結果表明,所提出的方法對刀具磨損狀態預測準確率達到93.038%。
4)知識識別維護
從需求的角度來說
傳統的知識管理軟體依賴於資料庫的設計,系統無法識別語義,我們只能按照預設的數據結構,在一個系統中實現增刪改查操作。而知識產生的時間往往和錄入的時間是不一樣的,我們往往得重複錄入一次。
例如某產品未通過測試需要進行設計更改,其通常會走一個變更申請,由項目負責人、總工程師等人層層審批。若能夠直接就審批材料進行語義分析,直接抽象測試未通過的要素、更改的方式方法等要素,就不需要再人為錄入了。下一次遇到類似於的問題,相關工程師就可以查詢解決方案。
從技術可實現性來說
可以利用自然語言識別技術,從業務系統中直接獲取大量的文本,解析出事件執行主體、執行對象、執行方法、執行結果主要要素,再各要素語義量化解析。
從商業價值角度來說
無論是企業的技術知識庫,還是服務機器人的應用,都可以減少對人員培訓和素質水平的依賴。結合PDM、GIT等軟體,能夠構成企業完整的知識管理體系。
三、我們要怎麼樣去構建工業的人工智慧應用
重視基礎條件建設,數據先行。
前面案例已經分析到了,樣本數據的數量和質量是保障人工智慧任務完成的先決條件。故障預測需要大量的工況數據,危險行為識別需要大量的圖像算例。
對於企業而言,需要具備自動化、數字化等基礎條件,
對於行業和政府而言,需要全行業或全地域企業具備基本的自動化、數字化基礎。消費領域之所以AI做得風生水起關鍵是各應用都大量埋點,獲得了大量行為數據。
明確各自定位,參與分工。工業場景之多,複雜度之深,行業壁壘之高,意味著這不是一個贏者通吃的壟斷的市場,需要構建生態並由多方參與。
人人都搞AI的時代並不是因為人類進化都變聰明了,而是tesorflow、opencv等AI工具的誕生。對演算法的高度封裝使得我們可以專註於解決業務問題,演算法從深奧的數學問題變成了」調庫和調參「+業務洞察的基本操作。
下圖是tensorflow的操作頁面——前端配置頁面已經高度成熟,演算法的配置可以通過對模塊的拖拉拽就能實現,甚至連調庫的操作都不需要。
未來工業AI領域將逐漸形成分工是大概率事件,參與者主要包括底層框架開發者和場景貢獻者。
框架開發者軟體、AI技術背景更強,他們搭建全行業通吃的應用框架,各行各業傳統的服務商基於框架構建場景。這樣企業就能以更低的成本獲取場景,市場也各司其職,實現價值最大化。
尊重業務,深入業務。
與AI、互聯網日新月異的技術和商業模式的發展相比,工業的發展顯得相對緩慢和笨重;然而,工業無論是設計、工藝還是製造過程管理的知識和經驗,都是由各個工業國家在經過數以百年的實踐總結而來的,消費領域對需求和業務的處理方式無法直接復用在工業場景中。
工業互聯網也好,工業AI也好,產品經理需要深入理解工業場景和業務。
四、小結
人工智慧技術在解決眾多工業問題場景中有獨特的優勢,但目前工業場景與人工智慧還缺乏深入融合,應用的範圍甚至還不到消費領域的1%。
對於工業互聯網從業者而言,以工程化和商用化為目標,還應深度關注業務和場景落地的問題,同時還需要探索降低場景制訂邊際成本方法。
如果你覺得這篇文章對你有幫助,請戳下面二維碼關注我的公眾號:烏鴉產品客