當下中國,大數據是個熱詞。大數據是怎樣被提取出來,有怎樣被賦予價值的呢?
大數據給不出解釋
搞大數據研發,不就是坐在實驗室、電腦前,整天對著數字噼里啪啦地運算?可騰訊公司用戶與市場研究中心調研員韓娜,更多地是奔波在見調研對象的路上。韓娜講了一個對於她來說「家常」的故事。
一年冬天,她從南方的深圳趕到北方的瀋陽,約了一個孩子做用戶調研。本來知情的父母臨時有事不在,孩子的姑姑不讓韓娜進門。韓娜拿出身份證、工作證、介紹信,反覆解釋,但所有證明一概無用,對方就是不肯相信。最終,韓娜被「砰」的一聲拒之門外。類似的經歷,韓娜所在的團隊幾乎人人都遇到過。很多人不理解,一個互聯網公司怎麼還用上門調研這種「老土」的方式?
的確,擁有7.62億月活躍微信賬戶、8.77億月活躍QQ賬戶的騰訊,並不缺乏用戶社交的大數據,但光有數字就行了嗎?
「大數據給出了結論,但給不了解釋。」用戶與市場研究中心總監譚池舉了一個他自己的親身經歷。
多年前,他曾經參與過早期蘋果手機一代的調研。當時,老外們通過大數據驚訝地發現一個現象:蘋果的幾種輸入法中,中國人特別偏愛某一種。可是老外想不通,這是為什麼?
譚池說,「為什麼」往往是大數據的盲點,想要找到答案,目前,還只能依靠傳統的人對人詢問。
當時,經過傳統調研,譚池找到了原因:
中國抽煙人口比西方國家多,許多公共場合更是想抽就能抽,人們一隻手拿煙時,只好單手握著手機打字,因此中國的蘋果一代用戶,特別偏愛單手型、單指型的輸入法。
知道這個「為什麼」以後,相關產品的開發,開始更多考慮單手模式了。
人與人交流的傳統模式,不僅沒有被掩埋,反而在大數據時代,被一個個數據又激發出來。
大數據讀不出場景
「滴」「滴」———訪談室里充滿此起彼伏的電子音。研究員們有些震驚。
事情緣起於產品經理想做一個無障礙功能的設計。研究員朱丹招募了6位盲人進行訪談。起初,大家做好充分準備,以為盲人們可能不會使用智能手機,不會用APP,需要先教一下。
但沒想到,這群盲人使用互聯網產品相當熟練。
他們利用智能手機的讀屏功能,並且每個人都把聲音調到最快檔,只聽見手機發出「滴」「滴」這樣短促的電子音,常人的耳朵根本聽不懂是什麼,但6位盲人卻在怪誕的聲音中,熟練地使用互聯網,讓在場的「小夥伴都驚呆了」。
「原來網路對他們的幫助比我想象中大很多。」朱丹感慨。有位盲人告訴她,比如移動支付,對正常人來說只是多了一種支付手段,但對他們而言是一種顛覆式的設計,大大方便了盲人消費。
大數據提供了一個結果,但它並不知道用戶在使用產品時,身處什麼樣的場景,懷揣怎樣的心情,有著怎樣的需求。這一切,唯有人與人面對面,才能知曉。
還有一次,譚池找到了成都的一名用戶,興高采烈跑到對方家裡。目的是為了知道用戶使用產品時,真實的生活場景什麼樣。一番交流和觀察后,他忽然覺得不太對勁:
這戶人家冰箱里只有6罐可樂,沒有多餘的食物,房間里也找不到水壺或飲水機。譚池發簡訊給同行的同事:留意一下,這是不是他真的家。
等到雙方聊得很開心以後,對方果然露出了口風,原來他確實不住在這兒,這間屋子的主人是他父母,目前租給別人,這次為了接受調研,臨時借用了一下。
「這樣一來,我觀察他的生活場景,有一半信息就沒用了,比如小區、鄰里關係等。」譚池遺憾地說。
用戶真正的使用情景,他們的擔憂、開心、困惑與不爽,目前的大數據讀不出來。數據再大也是死的,只有人能激活它。
大數據不知道怎麼做
多年前,有一位調研員曾經接過一個項目,對方要求調研某產品在用戶心中是多少分,如果得分在80分以下,整個相關團隊就要被撤銷。
「其實,給79分還是80分,有很大區別嗎?」譚池反問,「不談評分機制,就算根據數據得分,判了一個團隊的生死又怎樣?問題還是在那兒,依然沒有得到解決。」
大數據本身,並不能給出一個既定做法。面對數據運算的結果,之後的步驟可能更加重要。
每一年,研究中心負責調研的項目數以百計,這些課題並非調研員自己「拍腦袋」想的,大部分來自產品策劃的需求方。
韓娜說,剛入這一行,自己與產品經理交流時,經常需要磨合。比如一位產品經理很糾結,關於「簽到」有兩種改進方案,究竟95後用戶更喜歡哪一種呢?他不知道。
他可能先去找數據師,去調相關的大數據。大數據顯示,95后更熱衷於每天上網「簽到」。但是他們「簽到」究竟是出於什麼心理,獲得了什麼滿足,數據並不懂。
於是,產品經理接著找韓娜,請她進行用戶研究。結果顯示,95后樂意「簽到」,更多是為了滿足自己的情感需求,尤其是「刷存在感」。可是知道了這一點后,產品經理依然無法抉擇,究竟哪個方案更好。
時間久了,韓娜漸漸明白,自己做完調研,不能僅僅解答「為什麼」,「用戶怎麼想」,還要給出「怎麼做」的建議。
當然,再細緻的調研,最終也不一定能找到產品經理想要的答案。有時候,答案是有了,但考慮到成本營收、缺乏供應商、缺乏可操作性等因素,改進方案依然不了了之。大數據和訪談就都白做了。
另一位調研員馬建說,自己工作最開心的那刻,就是調研的建議被採納,最終體現到產品中。
今天的企業、政府,乃至整個社會,很容易通過大數據對市場一目了然,但一目了然之後怎麼做?漠視它、改正它、還是適應它?
大數據未必懂得價值
羅英、何文是「數據挖掘師」。但這份工作想做得好,單純依靠算數據並不夠,其實還要動用「情商」。
比如,QQ音樂有一個功能叫「猜你喜歡」。根據用戶的數據,軟體會自動推薦一些陌生歌曲。這種推薦,顯然是基於大數據平台。一般我們以為,只要提供一些演算法,大數據平台照此運算就成,但事實沒那麼簡單。
首當其衝的是準確率。「猜你喜歡」究竟能猜對多少首歌?不同的數據師,可能會設計不同的演算法,有的人效果明顯比較好,他把「年齡」的數據用起來,而另外一個人沒用,就會導致兩者準確率差很大。
究竟需要考慮哪些數據維度,薦歌才會最符合心意呢?沒有標準答案,不同數據師有自己的判斷。同樣的大資料庫,一個運算下來比較準確,一個不準,其中唯一的變化就是人。
第二個問題是,為什麼有人能想到「年齡」,而有人卻想不到?憑藉的也是個人經驗。或者說,憑藉的是人對事物的理解,考驗的正是數據師的「情商」。
「在我們行內有一個不等式:業務知識>數據>演算法。」羅英解釋,「而業務知識就是你的理解能力。」用同行的話來說,就是「你的架構是否合理。」
最近,產品經理提出:能不能根據大數據,觀察每座城市的人口遷移,隨後做一份《城市年輕指數》報告?
數據師們給出了這樣一些數據:用戶的登錄地,再比對他們的年齡信息等。最後給出來的數據,大家一看都覺得有價值,《城市年輕指數》報告就這樣出爐了。
當然,更多時候,理想很完美,但運算出來的數據卻沒什麼變化,被判定「數據價值不大」,議題便會不了了之。
「大數據就好像是一杯水,我們需要去廚房煮菜,水只是材料之一。」羅英形容。
何文則說,他工作的成就感,不在於運算大數據,而在於最終「能給出有價值的數據」。
大數據還能做什麼
第一張與家人的合影、第一張旅行的照片、第一張寶寶的笑容……
最近,騰訊運用QQ空間的數據,為個人生成一份「社交回顧互動」H5,比如顯現出你第一次註冊空間的時間,跳出第一張上傳的家人合照。
「其實也捏了一把汗。」從事QQ空間運營的琪琪說,「試想,第一張與家人的合影,萬一大數據判斷錯誤,跳出來的照片是與男同事的合影,豈不是很尷尬?」怎麼抽取數據,讓數據判斷準確很重要。
小迪做調研時遇到一名初中男孩,對方很有傾訴欲。男孩告訴他,自己有5個QQ號,4個已經被媽媽「破解」了,可能是因為密碼太簡單,都是生日之類,媽媽太容易猜到。於是他想出了第5個QQ密碼,複雜到連自己也記不住。
他把密碼放在帶鎖的儲錢罐里,再把儲錢罐藏在床底下,每次用這個賬號登錄QQ時,他都要先從床底下把密碼翻出來才行。
這個故事,後來被小迪寫進了《95后迷之隱私觀大揭秘》報告中。該報告揭示,95后是一群非常注重隱私的群體,近4成95后認為,自己的隱私遭到過侵犯,他們為了保護隱私採取過各種小手段。他們渴望有自己的空間,活躍於QQ空間其中一個原因,就是可以不和父母在同一個社交圈。
隱私報告誕生后,也讓一些媒體和學者產生了危機感。長此以往,是不是一家互聯網公司就能自己完成科研報告了?大數據會不會讓一些科研機構被取代呢?
除了活動、推薦、科研,最讓人期待的是,大數據在某個領域正發揮著超乎想象的作用———城市公共空間的實時數據檢測。
類似功能,其實微信上已經有了。打開微信個人錢包,選擇城市服務,右下方有一條「城市熱力圖」。點擊進入,熱力圖能實時顯現你所在的位置附近,有多少人流,它意味著交通是否擁擠。
當然,擴大使用的話,它還能實時監測某塊區域,是否短時間內人流密度過高,及時提出預警。
也是基於相同的原理,近幾年騰訊發布了春運遷徙報告,實時監測每年春運的遷徙情況。
而未來,當每個人的身體信息都能被實時收集,形成個人的大數據時,人會怎樣?當整個社會被大數據連接起來,整座城市管理,都可以用大數據運算出一個「最佳方案」時,城市又會怎樣?
我們已經邁入一個大數據的時代。
有人說,終究有一天,數據的價值將超過土地的價值。
但是也有人說,世界就是一個「黑盒子」,永遠無法窺探內部的秘密。
遠古時代,宇宙對於人類就是一個巨大的黑盒子。如今,科學技術正在解開一個又一個黑盒子,可是大數據的終解會通往哪裡?目前依然沒人說得清楚。
「技術是有局限性的。」當我們一直在展望科技的無限可能時,反倒是這些一直與大數據打交道的人,不斷強調著這一點。
(文中的人名均為化名)
人始終無法被替代
上海觀察:企業對大數據的估值一直都很高,不會輕易公開。你們怎麼會想到免費對公眾發布一些大數據的社會報告?
李航(騰訊集團市場與公關部總經理):這幾年,社會上的大數據報告很多,每家互聯網公司各有偏重。
社交平台本身就是一個濃縮的小社會,社會的新變化、新趨勢,都會在這個平台有所反應。比如,大家越來越覺得,當代年輕人變得無法定義了,他們似乎喜歡追星、喜歡消費,他們究竟是怎樣一群人呢?能否做出一些描述?
那麼,在我們的社交數據平台上,是否可以觀察到年輕人的一些變化?意識到這是一個社會共同關注的話題,我們就基於大數據發布了相關的報告。
另一方面,大數據是個很大的盤。但是這個大盤上也可以有許多小的切面和故事。大數據未必一定要生成一個宏觀的大報告,從特別的角度切入,以小見大,也是一種嘗試。
這次我們推出95后的隱私觀,那麼下次可以繼續推出當代年輕人的審美觀、擇業觀等,持續聚焦一些可長期跟蹤的社會話題。
上海觀察:這份報告既有宏觀數據,又有微觀故事,看起來似乎「搶」了高校和媒體的活。
李航:我們是一個平台,也許從能力上,我們可以做到像高校那樣,或者像媒體那樣,但從自身的定位來說,我們盡量只做平台該做的,那就是客觀陳述。
有些洞見,不輕易進行價值判斷。這些大數據發布出去以後,如果高校、媒體引用,進一步就這個社會現象深入分析下去,我們也很高興。
上海觀察:是不是因為互聯網行業變化太快,所以你們對社會的細微變化很敏感,也因此對調研投入了很大精力?
李航:Pony(指馬化騰)曾經說:巨人倒下的時候,身體還是溫的。互聯網這個行業,分分秒秒都在變化,所以我們始終有一種危機意識。
今天,我們願意開放一部分資源和數據,也是希望能與全社會一起去解讀互聯網的動向,可以說是為了社會,同時也是為了我們自己的生存前景。
上海觀察:那麼您對大數據的未來怎麼看?有了人工智慧、深度學習,未來人還有用武之地嗎?
李航:目前看待和處理大數據有幾種方式。
- 一類是對年齡、性別、星座等基礎結構型數據進行呈現和總結。
- 第二類是視頻數據、語音數據、圖像數據。我們有像優圖這樣世界領先的技術團隊,他們在音頻、人臉、圖片識別等領域都有深入研究。現在我們正在研究,如何讓語音數據與圖像數據結合進行分析。
- 第三類就是人工智慧,它的想象空間非常大,或許通過深度學習,未來人工智慧自己會對數據產生洞察力,理解數據背後的意義、原因、提供建議,一切皆有可能。
我相信人無法被替代。人性很複雜,即使人與人的當面交流,所知也是有限的。人的情感、動機、心理,這些都是目前機器解讀不了的。
越是與大數據打交道,我越是對人性保有敬畏之心。
來源:騰訊科技
版權:人人都是產品經理遵循行業規範,任何轉載的稿件都會明確標註作者和來源,若標註有誤,請聯繫主編QQ:419297645