編輯導語:如今平台產品已不是新概念,隨著AI技術的成熟,AI平台產品也越來越多。那麼,為什麼要做AI平台?這些AI平台又有哪些類別呢?讓我們跟著作者,一起去探尋吧。
有一天,小李的領導說:「我們要做AI平台!」。
雖然平台產品也不是新概念了,隨著AI技術的成熟,AI平台產品也越來越多,但光憑做平台一句話,小李還是犯了難——大大小小的「平台」很多,究竟我們要做什麼樣的AI平台呢?磨刀不誤砍柴功,小李決定先研究下市面上已有的AI平台找找靈感。
一、AI平台產品分類
AI平台大致可以分為AI開發平台和AI支撐平台(名字是小李瞎起的)兩類。
1. AI開發平台
AI開發平檯面向的是模型開發者,圍繞AI模型/演算法的生命周期(數據收集、標註、模型結構設計、模型訓練、模型部署等階段)提供工具。開發平台產品需要對演算法開發流程、演算法種類豐富度都有較好的積累,因此大部分平台類產品是由內功比較深厚的大廠推出的。
(百度BML功能架構)
1)用戶
都叫開發平台啦,用戶想必應該是開發人員,使用AI開發平台的研發人員對人工智慧的了解程度不盡相同,他們可能是業務應用的開發人員(只需要調用某個模型API),也可能是AI工程師(需要對模型調參數,甚至重新設計網路結構),但歸根到底AI開發平台是面向開發人員的B端產品。
2)場景
在需要AI能力支撐的時候,用戶可以使用AI開發平台提供的不同層級的工具/功能(嵌入級、API級、數據訓練級、模型定製級、演算法開發級),實現所需的AI能力。
3)解決問題
AI賦能其他產品。AI平台作為一個產品,想解決的核心問題是如何便捷的讓其他應用或產品獲得智能化的能力。看到很多強調AI平台是為了讓AI演算法開發更簡單的說法,但歸根到底,如果不是其他產品需要AI模型或者AI能力,自然也不需要演算法開發,更就沒有必要有所謂AI開發平台存在了。
2. AI支撐平台
AI支撐平台大多是面向運營人員/業務人員,為某個AI應用提供能夠使之work的配置、管理等「支撐」功能。智能對話平台就是一種非常典型的AI支撐平台,因為智能對話應用並非只依賴某個模型就能實現,所以需要根據業務場景進行技能管理、對話設置等工作,智能對話平台就是這些配置功能的載體。
1)用戶
主要是業務人員或者運營人員,也就是需要對某個應用的具體規則、具體內容進行設置的工作人員。
2)場景
在使用某個智能應用時,用戶需要根據實際業務場景對應用中的某些功能進行配置,才能使應用按照需求運行起來。
3)解決問題
使智能應用按照用戶的期望運行起來。那為什麼這些應用需要配置呢?為什麼不能固化呢?因為應用的使用場景千差萬別,比如在銀行的智能客服和商場的智能客服,雖然底層的技術途徑一致,但具體客服面對的問題、使用的話術完全不一樣。
從產品角度看,為了使產品的通用性更強,我們往往會設計一個通用的應用框架,然後把高頻且重要的功能做成可配置項以適應更多用戶的需求。也不是說把功能固化下來不行,但那樣的話產品就變成了定製化的項目,成本非常高且無法復用。
(AI開發&支撐平台對比)
二、AI開發平台
1. 按AI模型生命周期拆解
知乎看到的一個比較好的平台產品定義:「平台產品提供共用性強的工具,連接多端多角色之間的活動或交易」。AI開發平台產品也一樣,是圍繞著圍繞AI模型/演算法的生命周期提供工具,連接不同層次開發者對AI模型設計、訓練、使用等活動。
AI模型的生命周期,大概是這樣的:
AI開發平台即然是服務於AI模型生命周期的工具,自然也離不開以上這些模塊。所謂平台,可以只針對某一個環節,比如數據收集+標註環節,或者模型部署環節,也可以針對整個生命周期,這就解釋了為什麼同是AI平台,有大有小。
如果我們從AI模型生命周期角度拆分,那麼就有:
1)數據標註平台
面向數據接入、清洗、標註等和訓練數據有關的工作。數據接入、清洗的工作其實和大數據的關聯性比較強,有些標註平台甚至是大數據系統的組件。
對於AI標註/數據平台來說,一個思路是類似百度的EasyData,針對模型訓練數據提供一部分預處理功能(如縮放、翻轉圖像提高模型魯棒性,或者對圖像進行濾波、降噪等增強操作)和智能標註功能(先利用已經訓練好的模型自動標註一把,然後再由人工校準或微調),正是這些功能支撐起了數據標註平台。
另外一個不錯的思路是更側重「標註」這個動作本身,類似basicFinder,做數據需求方和數據標註商的撮合生意並提供標註工具。
2)模型設計平台
這個一般不會作為單獨的產品,個人猜測原因主要是模型結構設計門檻高、需求小。從我自己的經驗來看,使用開源框架開發和使用平台提供的工具效率差別不大。
模型設計的功能大多是作為開發平台一個模塊,通過可視化拖拉拽、notebook等方式進行模型結構設計。
3)模型訓練平台
提供模型訓練的算力、環境,這個是AI平台中比較常見的產品,由於模型訓練對硬體資源的高消耗,通常會租用雲計算資源來完成模型訓練,所以很多模型訓練平台是與雲平台捆綁的,完成包括負載均衡、并行訓練等工作。
4)模型部署平台
提供把模型從訓練環境部署到推理環境(雲端、邊緣端等)的工具。這個功能相對簡單,較少單獨作為一個產品,一般是也是作為開發平台的一個功能模塊。
一個例外是邊緣/嵌入式環境部署平台(如百度EasyEdge),由於硬體適配比較繁瑣,所以目前看到百度是做成一個相對獨立的產品的。
5)模型推理平台
提供各式各樣的模型介面,供用戶直接調用,一般還提供包括模型調用管理、介面管理等功能,這種推理平台主要是以模型作為核心競爭力的。另一種推理平台則以算力作為競爭力,類似雲平台,用戶將模型部署在平台上可獲得彈性擴縮容等能力。
2. 按業務需求拆解
參考螞蟻AI平台的一篇分享,AI平台按照不同層級的業務需求可以分為5級:功能嵌入、API調用、數據訓練、模型定製、演算法開發。
- 功能嵌入:通過iframe等實現成本最低的手段,將某個功能模塊嵌入到自己的系統中。
- API調用:直接調用平台提供的成熟API,比如調用身份證、駕駛證之類的OCR識別API。
- 數據訓練:平台的模型符合需求,但需要提供自己的訓練數據來解決具體場景需求。
- 模型定製:平台的現成模型不太符合要求,所以要對演算法參數進行配置,然後訓練出符合自己需求的新模型。
- 演算法開發:最高級的情況,就是業務方懂演算法、要開發新演算法。平台則提供「演算法開發、數據管理、模型訓練、模型測試和發布」等一系列深層次的能力,來提升演算法研發的效率。
把5級業務需求和生命周期對比來看,業務的按需分層和模型生命周期的各個階段基本是呈對應關係的。需求越高級,追溯到的生命周期越靠前。
功能嵌入和API調用級需求只涉及模型推理,數據訓練級需求涉及數據標註、訓練、部署以及推理過程,模型定製和演算法開發級需求就涉及全流程的功能了。
3. 一些典型產品
上圖給出了一些AI開發平台產品的AI模型生命周期覆蓋情況,可以看到大部分產品其實都是提供全生命周期的功能的。當然不是說以上的分析沒有意義,按生命周期或者按需求層次拆解還是可以幫助我們捋清產品架構的。
個人覺得其中百度的功能架構是最舒服、邏輯性最好的。百度的AI開發平台包括BML和EasyDL兩個,BML是全流程的開發平台,覆蓋了AI模型全生命周期;EasyDL定位是零門檻開發,所以只支持到數據訓練級別的開發。
這樣的拆分其實就是依據前邊所說的業務需求等級進行的,拆分之後目標用戶要清晰很多。BML中相對獨立的數據相關功能和邊緣部署相關功能又都拆成組件/小平台,可以供用戶單獨調用,從而提高靈活性。
騰訊TI系列平台中,TI-ONE定位是「一站式機器學習服務平台」,但暫時沒有看到關於數據標註方面的功能,數據處理只提供相對簡單的數據接入和數據預處理功能。預置模型相對來說也比較少,大部分是機器學習方面的模型,深度學習模型較少。
TI系列的其他兩個平台TI-Matrix和Ti-EMS分別是「AI應用服務平台」和「無服務推理平台」,個人感覺都更偏向雲服務一些,主要是服務調度、擴縮容等能力。
華為ModelArts也提供從數據標註到模型推理全流程的開發工具,其中「自動學習」的功能模塊基本對標百度EasyDL,提供重訓練級別的模型生成,但暫時沒有按照需求層級進行產品拆分。
三、AI支撐平台
AI支撐平台比起AI開發平台,更類似業務平台,比如內容審核、智能對話等。圍繞的是一個核心演算法,通過配置提升這個演算法/能力的通用性。
下圖舉個內容審核平台作為栗子~橫向是發布圖片的業務流程,縱向是審核平台的功能,可見審核平台是和業務緊密結合的。
審核平台的核心其實就是分類問題(把輸入的圖片分為合規、不合規),外部輸入是圖片,輸出是圖片是否合規、違規類型、準確率等信息,而審核策略的制定、驗證則是為了支撐圖像分類演算法在內容審核這個場景下work,說到底「支撐」就是配置、設置。
四、一點思考
1. 為什麼需要AI平台?
從用戶的角度看:用戶需要的是以儘可能低的成本(時間及費用)獲取所需的AI能力。AI平台提供的開發工具、預置模型都可以減小用戶獲取AI能力的投入。
從AI平台公司的角度看:AI平台提供的是一套標準化的工具/流程,80%的需求可以由標準化的產品來滿足,而非每個需求都單獨定製解決方案。通過AI平台這樣的標準化產品來提升ROI,從而實現盈利。
不論是從用戶角度,還是從提供AI平台的公司角度,其實AI平台的存在都是為了提升投入產出比。
但個人感覺,目前AI平台公司對AI平台的需求是要大於用戶的,這就造成了產品多用戶少的囧境。用戶對AI平台的不認可,一方面可能是對AI能力帶來的收益的不確定;另一方面可能是對AI平台提高ROI的不確定(有可能使用了AI平台但還是無法節約人力投入)。所以如何讓用戶發現AI能力的價值,進而發現AI平台的價值還是個值得思考的問題。
2. 如何做到AI平台的差異化?
市面上那麼多AI平台,如何做到讓用戶選擇你的產品呢?差異化。
怎麼做到差異化呢?不同用戶對AI能力或應用的需求側重各不相同,但是無外乎數據、算力、模型三要素。
1)數據入手的差異化
當前很多行業還是存在缺乏數據積累的事實的,所以數據對於這部分公司來說就是最大的痛點。從數據角度入手的AI平台,最直接的是可以主打提供行業數據。如果數據不可獲取,可以退一步和大數據平台結合提供數據採集、清洗、標註(自動、人工)等功能,解決用戶數據方面的痛點。
前邊提到的basicFinder,就是由標註平台逐步發展出來的AI平台。
2)算力入手的差異化
不論是訓練階段還是推理階段,AI模型對算力都是強依賴的,因此從算力入手的AI平台也是發展最早的一種,一般都和雲平台緊密結合,最後的收益落腳點都是雲資源。
隨著AI晶元發展,以嵌入式設備為載體的邊端智能也越來越多,所以算力入手也可以指嵌入式算力。華為算是以算力為核心的代表公司。
3)模型入手的差異化
雖然大多AI演算法都有開源的版本,但開源模型往往是通用模型,沒有針對特定場景優化,沒有一般沒法直接應用。比如圖像識別在醫學領域和在自動駕駛領域可能用同樣的演算法,但需要喂不同的數據,進行不同的參數優化,最後得到適用於不同場景的模型。比如face++就對人臉識別相關的各類模型都做了優化。
一個熱門方向AI+行業,就是在數據和模型角度都針對本行業進行差異化的設計。比如針對醫藥領域的醫渡雲,針對稅務領域的慧算賬等等。
3. 如果要做AI平台,怎麼入手?
個人感覺現在做AI平台是件很難的事情了,本身這類產品就已經有點供大於求了,做差異化也需要結合已有的積累(無論是數據、算力還是模型),所以從頭做一個成功的AI平台真的非常困難,留給AI平台的機會可能只有+行業了。
大膽開麥:短期之內做AI支撐平台的難度遠小於AI開發平台,而成功率應該是要高於AI開發平台的。與其做一個大而全卻沒有明確目標用戶的AI開發平台,不如圍繞一個點做一個真正有人用的AI支撐平台。
#專欄作家#
LCC,微信公眾號:sillybaby的互聯網求生指南,人人都是產品經理專欄作家。2B+AI 產品經理,相信科技向善,致力於用AI解決實際問題。
本文原創發佈於人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基於 CC0 協議