「安防+AI」,規模性落地中的關鍵三要素 | 人人都是產品經理

隨著AI技術的發展和成熟,AI+安防,必然會為視頻資源的信息化、情報化、智能化提供強有力的支撐。文章主要來跟大家分享一下,安防+AI規模性落地中的關鍵三要素。

隨著當前AI技術的不斷進步,作為天然AI落地場景的安防領域引起了監控大佬、IT巨頭、演算法新貴們的極大關注。各類安防+AI,或者AI+安防概念炒的火熱,但是真正經得起市場考驗的鳳毛麟角。

細究起來,不是技術問題,高精尖技術國內基本上可以與美國保持同步,國內團隊奪得國際比賽的成績單光明耀眼;不是人才問題,頂尖的國際人才流動比比皆是。更不是製造能力問題,中國的監控設備製造商製造了世界六成還多的設備,可能有的小夥伴會說是對行業的理解度問題。

不可否認,這是個重要因素,但對大規模落地「安防+AI」的關鍵要素認知可能是個更關鍵的問題。

一、當前視頻監控的應用現狀

從2004年以來的平安城市,天網工程,雪亮工程,經過十多年的建設,全國各省市乃至鄉村,都建起了大規模的視頻監控系統。

據不完全統計,目前全國已建各類監控近2億路,加上在建的和待建的,至少規模會翻翻。隨之而來的是天量級視頻文件,即使配備數百萬視頻巡視員來看視頻,每天能監控到的視頻大概也不到總視頻量的百分之一。

但是這些天量的視頻數據,在社會公共安全管理和案件偵破等工作中,起著越來越重要的作用。在公共安全信息化建設深入持續開展的背景下,現有視頻系統缺乏深度應用模式,視頻數據智能化程度不高的問題不斷凸顯。如何用AI升級現有的視頻系統,使之能更好地適應物聯網時代視頻智能化、信息化、情報化的應用需求已勢在必行。

當前小規模落地安防+AI,已經不是難題,智能攝像頭或者結構化伺服器就能解決這個問題。

以下要說的是大規模、城市級的安防+AI中的落地要素:

要素一:視頻結構化

要實現視頻信息智能化、信息化的問題,必須要先面對結構化的問題,結構化之後就可以把原來只能看無法調用的視頻變成可調用的信息。迎接視頻數據深度應用的挑戰,其核心及瓶頸是通過研究視頻結構化描述技術,解決通用視頻數據向視頻信息化、視頻情報化方向的轉化,實現社會公共安全視頻應用工作模式的創新。

視頻結構化描述是一種基於視頻內容信息提取的技術,它對視頻內容按照語義關係,採用時空分割、特徵提取、對象識別等處理手段,組織成可供計算機和人類理解的結構化信息的技術。

從數據處理的流程看,視頻結構化描述技術,能夠將非結構化的視頻數據轉化為人和機器可理解的結構化信息,並進一步轉化為公安民警實戰所用的情報數據,實現視頻數據向信息化、情報化、智能化的應用轉化,達到借用視頻監控掌控安全的目的。

視頻結構化描述的內容類型方面主要是:人員、車輛、物品、行為。

  1. 在視頻中把人作為一個可描述的個體展現出來,其中包括人員的臉部精準定位、臉部特徵提取、臉部特徵比對,還包括人員的性別、年齡範圍、大概身高、衣著特徵、髮飾特徵、配飾、攜帶物品、步履形態、交通工具等多種可結構化描述信息;
  2. 對於車輛的描述信息包括:車牌、品牌、車顏色、車型、子品牌、車貼、車飾物信息等多種車輛描述信息;
  3. 對於行為的描述信息包括:區域、越界、徘徊、遺留、聚集等多種行為描述信息。

經過視頻結構化解析處理,可以實現如下目標:

  • 一是視頻變成了可調用的信息庫,可以針對目標對象進行快速檢索,線索查找速度會得到極大的提升。視頻結構化之後,從百萬量級的目標圖庫中(大約一千小時內的高清視頻),查找視頻截圖中的一個嫌疑人對象,一秒內即可完成;千萬量級目標的圖庫中查找,數秒內即可完成。
  • 二是監控系統所佔用存儲容量極大的降低,結構化后的信息,存儲人的結構化檢索信息和目標數據信息不到原視頻數據容量的2%;對於車輛和行為,均不到1%。存儲容量極大地降低,可以解決視頻長期存儲和存儲成本高昂的問題。
  • 三是視頻結構化可以活化視頻數據,作為數據挖掘、應用的基礎。結構化的圖像及描述信息,存入相應的數據倉庫,對各類數據倉庫可以進行深度的數據挖掘、關聯、融合、應用,充分發揮大數據的作用,提升視頻監控的應用價值,提高對視頻場景的分析和預測能力。

要素二:視頻智能分析技術

視頻結構化描述是針對視頻內容的智能結構化分析,將非結構化的視頻數據經過智能分析,形成可供標記描述的結構化數據,因此視頻智能化分析是視頻結構化的核心技術。

智能視頻分析技術的高低,對視頻結構化描述的準確率至關重要。為了能更高質量地進行視頻結構化分析,必須在這三個方向進行創新:

首先、視頻預處理技術,主要包括視頻解碼、圖片篩選、圖片清洗等,也包括視頻防抖動和圖像增強。

  1. 視頻解碼把視頻還原成一張張的圖片,圖片篩選把圖片中的無用圖片進行廢棄處理,圖片清洗保留最有效圖片;
  2. 視頻抖動主要是道路監控中高架安裝方式帶來的較高頻率的小幅抖動,抖動的拍攝往往會拍出一團糊的視頻,視頻防抖動能有效抑制智能分析中的誤報和漏報,提高智能分析的準確率;
  3. 圖像增強是對視頻源進行質量改善處理,有效改善畫質,提高圖像的清晰度,使原本低質量的圖像達到清晰可辨。

其次,不斷提升分析準確率。

如人臉識別技術從最初的特徵臉方法過渡到卷積神經網路方法,由可見光人臉識別到多源光人臉識別。類同,車輛、物品和行為的智能分析也有了更高效的分析技術。要不斷關注前沿AI技術的發展,重點關注實戰場景下的訓練方法、模型構建,加上大數據量的實踐,不斷提升分析識別的準確率,最後達到可實用的程度。

再次,影像處理技術,主要包括圖像復原技術等。圖像復原就是綜合利用超解析度、去模糊濾波、變形矯正、色彩調整等對模糊視頻進行處理,使之清晰可辨。

要素三:結構化圖像信息資料庫

通過對視頻內容的智能化分析處理,生成一個高密度存儲,又能快速調用的結構化圖像信息大資料庫。只有實現了對圖像庫的快速落盤,才能使結構化信息不堵塞、不丟失;也只有實現了快速調用,才能做到千萬量級秒級檢索,也才能快速準確的發現有效線索,充分發揮視頻資源的實戰價值。

然而,在公安信息化建設深入開展的背景下,現有視頻資源缺乏深度應用的模式。其應用的瓶頸依然是視頻信息如何高效提取?如何保障識別的準確率?如何進行快速調用?如何同其他信息系統進行標準數據交換、融合、共享等。

視頻結構化技術難點

首先是視頻結構化核心演算法技術的突破。

視頻結構化描述依託於智能分析技術,但是當前視頻智能分析技術還未突破各種應用環境的制約。

比如:人臉識別的應用場景,當下的人臉識別多半是配合式、重複式應用場景,如:銀行、機場、海關卡口。在這種應用場景下,人臉的識別率基本能達到實用要求,而在無配合、多人臉、動態視頻的場景下就很難達到實用目標。特別是在一般視頻監控場景下,由於架設位置高、拍攝距離遠,基本上識別不到人臉,更別說進行人臉結構化了。

雖然當前的深度學習卷積神經網路學習模式,使得人臉檢測和識別的準確度大幅提長,但是隨之而來的負面效應也相當明顯,首當其衝的就是運算複雜度的提升,需要耗費大量的計算資源。

針對這一瓶頸,雖然業內公司試圖通過將計算前端推移(智能攝像頭)和後端集中化處理(GPU結構化伺服器)兩種方案來解決,但是智能攝像頭方案大規模部署成本高昂,且對已安裝的巨量監控無法結構化。

集中化處理方案也需要大量價格昂貴的結構化伺服器,而且帶來的帶寬壓力巨大,也不利於規模性實施。這就需要第三種更貼合當前實際的解決方案,報道稱由安軟慧視推出的這種方案已在部分省市公安廳公安局開始實施,作者已與市局進行了聯繫,等詳細了解后再詳細寫出。

其次是實戰場景大數據和深度學習場景訓練模型的構建。

演算法、算力和數據作為AI的基本三大支撐,少了哪一個都不行。不獲得足夠量的場景數據就訓練不出好的模型,而沒有好的模型又不被客戶認可,沒辦法從客戶那裡獲得巨量的場景數據。

最後是視頻結構化標記描述數據存儲,檢索和應用技術創新。

隨著結構化數據總量的海量累積,如何實現其圖像大數據的超大容量、高效存儲、高效檢索以及快速調用就需要不斷進行技術創新。如果不能做到規模性實時處理實時檢索,它最終只能是一個事後處置系統,仍然會讓公安辦案失去時機,對於提高破案率的效果不大。

雖然當前還面臨不少困難,但隨著AI技術的發展和成熟,AI+安防,必然會為視頻資源的信息化、情報化、智能化提供強有力的支撐,變視頻的被動防禦為主動識別,變事後處置為事前事中事後全程掌控,進而最終實現「AI+安防」的規模性落地。