一家雲計算公司為什麼要投入如此多的資金去收購數據可視化公司,僅僅是為了提升數據分析和展示的能力,從而為企業提供更多的服務么?另外,傳統的BI廠商和雲計算廠商結合后,是否會加速數據上雲的過程,提升PAAS平台的服務能力呢 ?未來,商業智能最核心的價值和競爭力是什麼
商業智能又被稱為BI,主要指商業領域的數據分析和可視化展示。提到BI,最近的一則新聞似乎在行業里引起轟動,那就是領先SAAS公司Salesforce花了150億美金收購了知名BI公司Tableau。
一家雲計算公司為什麼要投入如此多的資金去收購數據可視化公司,僅僅是為了提升數據分析和展示的能力,從而為企業提供更多的服務么?另外,傳統的BI廠商和雲計算廠商結合后,是否會加速數據上雲的過程,提升PAAS平台的服務能力呢 ?未來,商業智能最核心的價值和競爭力是什麼 ?
帶著以上這些問題,首先還是來看下傳統BI的價值,傳統的商業智能主要是為更好地制訂戰略和決策提供良好的環境,為特定的應用系統(如客戶關係管理CRM、供應鏈管理SCM、企業資源計劃ERP)提供數據環境和決策分析支持。
當面向特定應用的特定戰略和決策問題,商業智能從數據準備做起,建立或虛擬一個集成的數據環境。在集成的數據環境之上,利用科學的決策分析工具,通過數據分析、知識發現等過程,為戰略制訂和決策提供支持。整個過程中,集成的數據環境和決策分析工具是十分重要和不要缺少的。
那麼,雲計算時代的商業智能和傳統的BI相比有哪些不同或者說結合的方式呢?
一、基於雲計算模式的BI
1.1 雲計算與商業智能結合
BI其實就是一種可視化應用和數據處理的能力。BI上雲其實也就是利用雲計算提供的海量平台。BI與雲計算結合,或者說把BI轉移到雲計算平台上,將很大程度提高BI的運行速度、數據存儲能力、數據分析能力、決策判斷能力等。基礎架構對應的IaaS平台可以提供基礎設施,如虛擬化伺服器,而PaaS雲能夠提供海量的數據存儲空間,有助於企業存儲越來越多的信息和數據。
最上層的SaaS層面向終端提供服務,按照不同的部署方式,企業的商業智能可選擇公有雲、私有雲和混合雲幾種。
1.2 IaaS與虛擬伺服器、虛擬存儲、數據倉庫
IaaS是指將IT基礎設施能力(如伺服器、存儲、計算能力等)通過互聯網提供給用戶使用,並根據用戶對資源的實際使用量或佔用量進行計費的一種服務。IaaS所提供的資源是富有彈性的,也就是說,當用戶需要的時候能夠立即提供,而當用戶不需要時候能自動回收。
虛擬伺服器能夠再一台物理伺服器上運行多種虛擬伺服器。而BI的最核心能力其實是位於PaaS層的數據倉庫。當然,創建data warehouse直接在IaaS的虛擬伺服器上就能完成。
BI最後給管理者提供的決策建議,其準確度與數據倉庫的數據有很大的關係。高質量的數據越多,推薦的結果也更加精準。目前的線下伺服器存儲能力難以負荷巨大的數據信息量。將DW遷移到雲上,有助於更大信息量的存儲和分析。
1.3 SaaS與BI應用
SaaS是一種局域互聯網提供軟體服務的應用模式,它能夠以較低的成本為用戶提供軟體服務,無需軟體的安裝、管理和支持等複雜的流程,使用戶能夠獲得比本地更好的體驗。
從架構成熟度上,BI在SaaS的實現以SaaS服務架構的4級成熟度為前提。4級成熟度包括表現層、調度層、業務層與數據層。BI實質上就是應用而已,構建在雲上,顯示出極佳的效果。
表現層提供SaaS的展示方式,決定應用能夠實現的用戶體驗水平。BI的服務對象主要是信息技術人員,而不是管理者,BI的可視化效果將影響管理者對決策信息的接受程度。
所謂的可視化技術就是通過計算機圖形學和圖像處理技術,將數據轉換為圖形或圖像顯示等。展示層將BI分析得出的信息與結果用可視化形式表示出來,信息表達、解釋和評估的可視化有助於理解所獲得的信息並檢驗信息的實用性。
調度層將客戶端發出的請求調度到何時的業務處理伺服器上,提高SaaS的交付性能與資源利用率。業務層和數據層為BI應用提供支持。
與雲計算技術結合的BI自下而上可劃分為三個部分:最底層為基礎層,負責BI的數據倉庫、存儲處理計算等;中間層為平台等,提供編程介面、邏輯實現等功能;最表層為實現層,根據用戶的個性化定製,把數據分析的結果呈現給用戶。
1.4 私有雲、混合雲和BI的結合
所謂的私有雲,有點像雲計算的基礎設施,使用虛擬化技術,位於私有數據中心。私有雲之所以更受企業認可,是因為私有雲比公有雲更有私密的保護性。雖然因此其共享性受到影響,但是由於BI裡面分析的數據都是企業內部數據,採用私有雲可以對數據進行較好的保護。因此BI上到私有雲上,不僅可以使數據得到一定的保護,還可以享受雲計算帶來的便利。
所謂的混合雲,就是公有雲和私有雲的結合,是在雲中存在兩種或者兩種以上雲的類型。混合雲涵蓋了公有雲和私有雲的屬性,使得用戶的數據和應用能夠根據不同需要在不同的雲中遷移。它使企業既有自己的雲計算環境,同時也能夠使用外部公共雲計算的服務。兼顧了公有雲的成本優勢和私有雲的安全性,受到企業的歡迎。
1.5 基於雲計算的BI的優點
BI上雲主要有以下幾個優點:
- 提供更強大的數據存儲和管理能力:面對海量的數據,傳統的數據倉庫模式已經難以滿足當今的需求。基於雲計算模式的商業智能可以通過虛擬伺服器、虛擬存儲等服務,提供給企業更強大的數據存儲和管理能力。
- 提供BI的實時性:企業的現狀,包括業務信息、客戶信息等不斷變化,要做出更為準確有效的決策,這就對BI的實時性提出了更高的要求。基於雲計算模式的BI具有更快速、高效、穩健的運行性能,同時擴展性極強。
- 硬體冗餘自動故障切換:雲計算將BI所需的數據、應用進行分塊,建立在副本,保存在不同的伺服器中,避免了物理硬體的損壞。
- 負載均衡:雲計算BI能夠將工作均勻分配到不同伺服器上,避免個別伺服器工作負荷過大,讓BI性能發揮到極致。
- 個性化定製:將BI構建在雲上, SaaS將從展現層、業務層、數據層等方面,提供更人性化、更符合企業自身的可定製化配置和用戶可自定義功能。
- 成本低:基於雲計算模式的BI更符合企業追求低成本的理念,有助於擴大BI在中小企業中的發展力度,吸引更多的企業商家選擇BI。
1.6 應用前景
雲計算模式下的BI,企業可將大量數據存儲到雲中,減少企業硬體成本,獲得彈性的存儲量大小。
在SaaS上,BI可提供不同的擴展包,分為基礎包、專業包、企業包。企業可根據自身需要購買不同層次的擴展包,這三個包給企業提供了更多的選擇。
BI所依賴的雲,在現階段主要是以私有云為主。雖然公有雲的成本更低,但是安全性還有待時間的考證。然而,隨著雲安全性的不斷提升,可以預見,BI將逐步有私有雲遷移到公有雲,畢竟公有雲成本更低。
隨著雲計算技術的不斷完善,BI必將逐步遷移到該平台上,不同類型的企業都會逐步嘗試採用這種低成本、高效率、可擴展的模式,具有廣大的市場機會。
二、基於雲端的數據處理能力
相比於傳統的OLTP和OLAP,雲端的數據處理目前最核心的技術在於機器學習,這也是為什麼最近Apache Spark變得越來越流行,大有取代hadoop之勢。因為Apache Spark除了性能更好以外,更重要的是融入了先進的機器學習庫,可以建立聚類和預測模型,高效實現業務場景。
從業務層面,傳統的BI分析僅僅能夠展示現有的數據統計信息,沒有任何趨勢分析和決策建議,對管理層無法帶來實質性的價值。而藉助人工智慧技術,建立的數據模型具有前瞻性和參考價值,幫助管理者洞察業務關鍵信息。
標準BI和機器學習的結合模式如下圖所示:
從運營成本層面,本地建立機器學習模型成本非常的高,不僅需要昂貴的硬體設施,而且必須雇傭專業的數據科學家。而數據上雲以後,可以直接建設在第三方的IaaS和PaaS平台上,調用第三方供應商開發的機器學習模型也相對簡單高效。當然這個也帶來了接下來我們要討論的一個企業擔憂的問題 – 雲端安全。
三、雲端安全性探究
3.1 安全性隱患
雲計算的安全性一直是備受關注的問題。雲安全主要包括系統安全和數據安全。在雲計算環境下,用戶對雲計算數據中心的強依賴性,以及雲計算服務對網路條件的高要求,系統安全目前非常受重視。
虛擬存儲等服務,實際上是將企業的內部數據外包給服務商,使得數據的私密性成為了雲計算服務的一個困擾。但是建立正確的安全模型、選擇正確的安全方法,那麼在雲計算平台上可以實現對數據、系統安全性的保證。
3.2 安全解決方案
在基於雲計算的BI中,針對安全問題,可以封裝一個安全層。雲模式BI的安全模型構建主要包括三個層面的安全性保障措施:基礎設施層、底部架構層、數據信息層。
在基礎設施層上,根據安全防護需求,將雲計算劃分成幾個安全域。各安全域之間通過防火牆進行隔離。虛擬機接收到的包必須經過虛擬網卡。這個虛擬網卡是通過 Host OS創建的,可對經過它的包進行過濾選擇。倘若某個包是發往不允許接收的埠,則虛擬網卡會丟棄這個包,以免埠收到攻擊。通過防火牆的隔離,確保安全域之間的數據傳輸的安全性和穩定性。
由於雲計算需要建立在互聯網上,因而對基礎網路的安全性也有要求。雲計算BI的平台應進行統一IP地址規劃,對各部分再進行IP地址和數據鏈路地址綁定。此外還應建立異常流程監控體系,以防網路收到攻擊。
在底層架構層上,主要針對的是IaaS服務。解決方法之一,就是將一系列虛擬機進行劃分,在同一區域內的虛擬機擁有一致的安全水平,相互之間可以安全交換信息,並與非該區域的虛擬機隔離,通過特定的安全策略與可信虛擬域外的虛擬機進行通信。所有加入可信虛擬域內的虛擬機都需要事先通過安全認證。
在數據信息層里,可採取數據備份、身份認證、許可權管理、加密傳輸等技術,實現對數據信息安全性和安全性的保護。為防止數據不慎損壞,需要對數據信息進行備份與恢復。通過對用戶身份認證,確保以身份進行操作的操作者就是這個數字身份的合法擁有者,也就是保證操作者的物理身份與數字身份相對應。
結語
回到我們開始談到的那則新聞,不難理解Salesfroce為什麼要花大代價採購Tableau。主要還是因為Salesforce擁有大量的用戶數據和雲計算能力,而tableau擁有從數據倉庫到數據分析和報表完整的BI產品體系,兩者的結合可以增強彼此的產品和服務,將BI部署到雲上,產生更強的競爭壁壘。
BI與雲計算的集合是當下熱門的問題。基於雲計算模式的BI,其本質還是BI,雲計算只是一個平台,它結合了兩者的優勢。雲計算的海量存儲、數據挖掘能力,為BI提供了良好的基礎,同時其擁有的相比傳統模式更為低廉的收費,使企業減少成本,有助於吸引中小企業的加入。
BI的核心競爭力在於機器學習等AI技術的植入。將BI與雲計算結合,其強大的功能將為企業管理帶來前所未有的助力。