數據(ju)是(shi)有價值(zhi)的,但大數據(ju)最核(he)心的價值(zhi)到底是(shi)什么?能夠用大數據(ju)來作什么呢(ni)?
我總結了一(yi)下,大數據最核心的作用和價(jia)值有四個方面:
1) 查看數據規律,來探索事物的運行規律和特征
2) 發現(xian)數據(ju)變化(hua),來探索業務的變化(hua)和業務問題
3) 理清(qing)數(shu)據(ju)關系(xi),來尋(xun)找影響業務運(yun)行的關鍵(jian)因素
4) 擬合數(shu)據模(mo)型,來預判業務在未來的發展趨勢
下(xia)面我將為(wei)大家舉(ju)一些案例,看如何(he)利用(yong)大數據來(lai)實現(xian)這些價(jia)值。
3.1 探索規律
利(li)用大數據來(lai)探索業務運行的(de)規律和(he)特(te)征。
拿產品(pin)的(de)銷量(liang)分(fen)(fen)析來說,我們收集產品(pin)的(de)銷量(liang)數據,作趨勢分(fen)(fen)析,得到下圖所示的(de)按照時間維度(星期(qi))的(de)折線圖。
從(cong)數據的特征可以看(kan)出,產(chan)品(pin)的銷(xiao)量基本上(shang)是(shi)隨著時間在(zai)逐步(bu)上(shang)升的,周末(mo)的產(chan)品(pin)銷(xiao)量比較(jiao)高,即非(fei)工作(zuo)日比工作(zuo)日的產(chan)品(pin)銷(xiao)量要高,這(zhe)是(shi)絕(jue)大多數零售店的銷(xiao)售規律,即“周末(mo)是(shi)交易(yi)高峰時間”。
而銷量(liang)高,也就意味著在產(chan)品銷售上(shang)(shang)的(de)規律(lv),即客流量(liang)比較大,看來周末上(shang)(shang)街(jie)購物的(de)人數比較多。所以,從業務角(jiao)度看,也就發現(xian)了客流量(liang)在時間上(shang)(shang)的(de)分布規律(lv)。
基(ji)于客流量的(de)分布規律,就可以提出如下的(de)業務建議(yi)或策略:在人力安(an)排(pai)上,周(zhou)末(mo)需要更(geng)多(duo)的(de)銷售員(yuan)工上班;在庫(ku)存管理上,在周(zhou)四(si)或周(zhou)五就要安(an)排(pai)人員(yuan)檢查庫(ku)存,確保(bao)庫(ku)存中有足夠的(de)產品在周(zhou)末(mo)售賣;在營銷活動的(de)時(shi)間安(an)排(pai)上,要想達到更(geng)好的(de)品牌宣傳效(xiao)果(guo)或者銷售業績,就得(de)選擇(ze)在客流量多(duo)的(de)周(zhou)末(mo)時(shi)間進行(xing)宣傳和促銷,等等。
所以,大數據能夠(gou)幫助(zhu)我們(men)做決策,是怎(zen)樣做到的呢?
背后的(de)思維(wei)其(qi)實很簡單,就是,先利用數據來探索業務的(de)發(fa)展規(gui)律(lv)和(he)特(te)征,再利用業務規(gui)律(lv),按規(gui)律(lv)來決(jue)策,就能夠(gou)做(zuo)到事(shi)半(ban)功(gong)倍的(de)效果(guo)。
哲學告訴我們,任(ren)何事物都是(shi)發展(zhan)的(de),發展(zhan)必定(ding)是(shi)有(you)規(gui)律(lv)的(de),即萬物皆(jie)有(you)規(gui)律(lv)。
任何(he)客(ke)觀事(shi)物(wu),大到天體運(yun)行,中(zhong)到社會發展,小(xiao)到原子分(fen)子的(de)運(yun)行,都是(shi)有(you)規(gui)律的(de)。而大數據,則是(shi)探索事(shi)物(wu)規(gui)律的(de)有(you)效的(de)工具!
3.2 發現(xian)變(bian)化
利用大數據來(lai)發現業務運行的變化和問題(ti)。
谷歌公(gong)司的(de)流(liu)感趨勢(shi)預(yu)測產(chan)品(Google Flu Trends, GFT)是2008年(nian)推出的(de)一款預(yu)測流(liu)感的(de)產(chan)品,可以說是比較早的(de)一個大數據產(chan)品了(le)。
正(zheng)常(chang)情(qing)況(kuang)下(xia),傳統(tong)的(de)(de)疫(yi)情(qing)報告是由各(ge)地醫院、診(zhen)所和醫務人(ren)員向美國CDC(疾病控制(zhi)和預(yu)(yu)防中心(xin))上報的(de)(de),但這(zhe)(zhe)種(zhong)方法往(wang)(wang)往(wang)(wang)會有(you)10~14天的(de)(de)時(shi)間(jian)延(yan)遲,而在這(zhe)(zhe)兩周(zhou)內,疫(yi)情(qing)有(you)可(ke)能早已經迅速擴(kuo)散。而谷歌的(de)(de)這(zhe)(zhe)款產品,卻可(ke)以(yi)利用(yong)了(le)各(ge)個(ge)地區用(yong)戶搜索關鍵(jian)詞的(de)(de)數據量來判斷流感(gan)的(de)(de)傳播(bo)情(qing)況(kuang),來實(shi)時(shi)呈現或預(yu)(yu)測流感(gan)蔓延(yan)到哪(na)個(ge)地區了(le),這(zhe)(zhe)對于CDC及時(shi)控制(zhi)疫(yi)情(qing)具有(you)更大的(de)(de)指導意義(yi)。
谷歌工程師(shi)每(mei)天都會(hui)對搜(sou)(sou)(sou)索(suo)感(gan)冒相(xiang)(xiang)關詞的(de)(de)搜(sou)(sou)(sou)索(suo)量做(zuo)分(fen)析,在(zai)正常情(qing)況(kuang)下,某(mou)地區每(mei)日的(de)(de)搜(sou)(sou)(sou)索(suo)量都會(hui)在(zai)一個正常的(de)(de)范圍內波動。但如果有一天(比如12號開始(shi)(shi)),某(mou)地區的(de)(de)搜(sou)(sou)(sou)索(suo)量開始(shi)(shi)持續上升,這上升的(de)(de)背后(hou)(hou),其實體(ti)現的(de)(de)是患感(gan)冒人數的(de)(de)增加。這就是GFT產(chan)品背后(hou)(hou)的(de)(de)數據(ju)思(si)維,基(ji)于(yu)搜(sou)(sou)(sou)索(suo)詞的(de)(de)熱度來預(yu)測(ce)流感(gan)的(de)(de)爆發。這個產(chan)品,甚至可(ke)以在(zai)流感(gan)爆發前的(de)(de)7-14天就能夠做(zuo)出預(yu)判。因此,國(guo)家(jia)或企(qi)業都可(ke)以基(ji)于(yu)此預(yu)測(ce)進行相(xiang)(xiang)應的(de)(de)準(zhun)備活動。
所以,可以基于(yu)數據(ju)的(de)變化(hua)(hua),而探知業務的(de)變化(hua)(hua),從而可以進一(yi)步思考給出相應的(de)業務判斷和業務建議(yi)。即,數據(ju)的(de)變化(hua)(hua)就意味(wei)著業務的(de)變化(hua)(hua)。
這也是(shi)我們做(zuo)決策(ce)的另一個底層(ceng)邏輯,找到業務短(duan)板(ban)和變化,給出應對策(ce)略。最典型的就是(shi)運營分析,通過大量的KPI指標來呈現業務運營的各個環節(jie)的發展情況(kuang),以找到需要改(gai)進的環節(jie),并做(zuo)出優化建(jian)議。
世界是物質(zhi)(zhi)的(de)(de),而物質(zhi)(zhi)是運動的(de)(de),變(bian)化是事物的(de)(de)本(ben)質(zhi)(zhi)。
一切事物都在(zai)運動變(bian)化(hua)(hua),這些運動變(bian)化(hua)(hua)是可以被探知的。大數據(ju),則(ze)是及(ji)時發現事物變(bian)化(hua)(hua)的一個工具(ju)。
3.3 理(li)清關系
美國(guo)印第安(an)納大學的(de)(de)(de)(de)(de)教授(shou)(shou)約翰·博倫(lun)(Johan Bollen),曾發(fa)表了一(yi)(yi)篇文章《Twitter情(qing)(qing)緒(xu)(xu)預測股(gu)(gu)票(piao)(piao)市(shi)(shi)場》。這(zhe)些教授(shou)(shou)們(men)(men)一(yi)(yi)直想(xiang)弄清(qing)楚到底(di)是(shi)(shi)什么因素在影響(xiang)股(gu)(gu)票(piao)(piao)的(de)(de)(de)(de)(de)漲和跌(die),以及(ji)能否預測股(gu)(gu)市(shi)(shi)的(de)(de)(de)(de)(de)漲或(huo)跌(die)。于(yu)是(shi)(shi),他(ta)們(men)(men)收(shou)集了2008~2010年期間(jian)在Twitter上(shang)發(fa)表的(de)(de)(de)(de)(de)上(shang)億條(tiao)條(tiao)文,然(ran)后(hou)(hou)(hou)做了一(yi)(yi)個(ge)對用戶(hu)情(qing)(qing)緒(xu)(xu)的(de)(de)(de)(de)(de)量化模(mo)型,就(jiu)(jiu)是(shi)(shi)根據發(fa)表條(tiao)文的(de)(de)(de)(de)(de)字詞來估算用戶(hu)的(de)(de)(de)(de)(de)情(qing)(qing)緒(xu)(xu),并(bing)將其量化為(wei)一(yi)(yi)個(ge)情(qing)(qing)緒(xu)(xu)數(shu)值。一(yi)(yi)個(ge)用戶(hu)就(jiu)(jiu)有一(yi)(yi)個(ge)情(qing)(qing)緒(xu)(xu)指(zhi)(zhi)標(biao),然(ran)后(hou)(hou)(hou),他(ta)們(men)(men)把(ba)當天發(fa)表條(tiao)文的(de)(de)(de)(de)(de)所有用戶(hu)的(de)(de)(de)(de)(de)情(qing)(qing)緒(xu)(xu)指(zhi)(zhi)標(biao)綜合(he)起來,最(zui)后(hou)(hou)(hou)形成了一(yi)(yi)個(ge)客戶(hu)群的(de)(de)(de)(de)(de)綜合(he)情(qing)(qing)緒(xu)(xu)指(zhi)(zhi)數(shu)。最(zui)后(hou)(hou)(hou),他(ta)們(men)(men)把(ba)這(zhe)個(ge)客戶(hu)群的(de)(de)(de)(de)(de)綜合(he)情(qing)(qing)緒(xu)(xu)指(zhi)(zhi)數(shu)按照(zhao)時(shi)間(jian)的(de)(de)(de)(de)(de)維度連接起來就(jiu)(jiu)形成了一(yi)(yi)條(tiao)情(qing)(qing)緒(xu)(xu)曲(qu)(qu)線,然(ran)后(hou)(hou)(hou),再把(ba)這(zhe)條(tiao)情(qing)(qing)緒(xu)(xu)曲(qu)(qu)線和道(dao)瓊斯指(zhi)(zhi)數(shu)曲(qu)(qu)線進行比對。經過不斷(duan)的(de)(de)(de)(de)(de)優化他(ta)們(men)(men)量化情(qing)(qing)緒(xu)(xu)的(de)(de)(de)(de)(de)模(mo)型,他(ta)們(men)(men)很驚奇地發(fa)現(xian),這(zhe)條(tiao)情(qing)(qing)緒(xu)(xu)曲(qu)(qu)線的(de)(de)(de)(de)(de)波(bo)動居(ju)然(ran)和股(gu)(gu)票(piao)(piao)曲(qu)(qu)線的(de)(de)(de)(de)(de)漲跌(die)有著(zhu)驚人(ren)一(yi)(yi)致(如下圖所求(qiu))。
仔細觀察一下,下圖的(de)(de)(de)情緒(xu)曲(qu)(qu)線與股(gu)(gu)票(piao)曲(qu)(qu)線并(bing)不是(shi)完全重疊的(de)(de)(de),而是(shi),情緒(xu)曲(qu)(qu)線在(zai)股(gu)(gu)票(piao)曲(qu)(qu)線波(bo)動的(de)(de)(de)之前。也就(jiu)是(shi)說(shuo),當(dang)情緒(xu)曲(qu)(qu)線往后(hou)挪3~4天以后(hou),情緒(xu)的(de)(de)(de)波(bo)動和股(gu)(gu)票(piao)的(de)(de)(de)漲(zhang)跌就(jiu)基本上吻合了,這也就(jiu)說(shuo)明,可以利用情緒(xu)來初(chu)步判斷股(gu)(gu)票(piao)的(de)(de)(de)漲(zhang)跌,這開啟了大數據炒股(gu)(gu)的(de)(de)(de)新時代。
用大(da)數據的技術(shu)語言來(lai)說,就是,情(qing)緒指數與股票指數的具有相(xiang)關性。
相(xiang)關性分(fen)析,是(shi)大數據時(shi)代用(yong)得最多的(de)(de)一(yi)類分(fen)析方(fang)法之一(yi),可用(yong)來探索事(shi)物之間的(de)(de)相(xiang)互影響(xiang)和(he)相(xiang)互制約的(de)(de)關系。
比如,企業的采(cai)購、生廠、設(she)計、市場、售后等等,都是相互(hu)影響和相系制約(yue)的。
唯物(wu)辯證法認為,世界上的一切事(shi)物(wu)都處在普遍(bian)聯(lian)系(xi)(xi)中,沒有任何(he)一個(ge)事(shi)物(wu)是孤立地存在的。聯(lian)系(xi)(xi)是指事(shi)物(wu)之間以及事(shi)物(wu)內部(bu)諸要素之間相(xiang)互連(lian)結、相(xiang)互依賴(lai)、相(xiang)互影響、相(xiang)互作用、相(xiang)互轉化(hua)等相(xiang)互關系(xi)(xi)。
一句話,萬物(wu)(wu)皆有聯(lian)系!而(er)大數據,成為(wei)探(tan)索事物(wu)(wu)間相互聯(lian)系的一種有效的手(shou)段(duan)。
3.4 預測未來
大數據的(de)核心是(shi)預(yu)測(ce)。
在2008年,當大多數企業在經濟危(wei)(wei)(wei)機中掙扎時(shi),阿里(li)巴(ba)(ba)巴(ba)(ba)卻相對輕松(song)地地度過(guo)了此次危(wei)(wei)(wei)機,因(yin)為(wei)阿里(li)巴(ba)(ba)巴(ba)(ba)提(ti)前就預測(ce)到經濟危(wei)(wei)(wei)機要來了。
他們是如何預測(ce)到經濟危機要來的呢(ni)?其實馬云在很多(duo)次場(chang)合都說過,他說阿里巴巴有兩大(da)類重要的數(shu)據(ju),一類是交易數(shu)據(ju),另一類是詢盤(pan)數(shu)據(ju)。詢盤(pan)數(shu)據(ju),指(zhi)的就是在網站的瀏覽數(shu)據(ju)、搜索數(shu)據(ju)、點出數(shu)據(ju)等等。
很顯然,詢(xun)(xun)(xun)盤數(shu)(shu)據(ju)和交(jiao)易(yi)(yi)數(shu)(shu)據(ju)是(shi)有(you)關(guan)系(xi)的(de)(de)。首先,詢(xun)(xun)(xun)盤量和交(jiao)易(yi)(yi)量存在(zai)正相(xiang)關(guan)的(de)(de)關(guan)系(xi);其次(ci),詢(xun)(xun)(xun)盤數(shu)(shu)據(ju)肯定(ding)發(fa)生在(zai)交(jiao)易(yi)(yi)數(shu)(shu)據(ju)的(de)(de)前(qian)面。阿(a)里巴(ba)(ba)巴(ba)(ba)每個月都會對這兩(liang)大類數(shu)(shu)據(ju)進行統(tong)計和分析,找到他(ta)們的(de)(de)關(guan)系(xi)和規律。在(zai)2008年的(de)(de)年初(chu),他(ta)們發(fa)現詢(xun)(xun)(xun)盤數(shu)(shu)據(ju)已(yi)經持(chi)續幾(ji)個月都在(zai)下降了(le),盡管此時(shi)交(jiao)易(yi)(yi)數(shu)(shu)據(ju)并(bing)沒有(you)明顯的(de)(de)下降趨勢,但基于(yu)上(shang)面的(de)(de)關(guan)系(xi),可預見,在(zai)未來的(de)(de)交(jiao)易(yi)(yi)數(shu)(shu)據(ju)也肯定(ding)會下降。因(yin)此,阿(a)里巴(ba)(ba)巴(ba)(ba)才(cai)作(zuo)出了(le)“經濟危(wei)機(ji)”的(de)(de)初(chu)步判(pan)(pan)斷,然后(hou),再(zai)收集更多的(de)(de)數(shu)(shu)據(ju)來驗(yan)證這個判(pan)(pan)斷的(de)(de)正確(que)性,并(bing)進而(er)作(zuo)了(le)大量的(de)(de)準(zhun)備,從(cong)而(er)安然度過這次(ci)經濟危(wei)機(ji)。
大家都知道(dao),大數(shu)據(ju)分析的(de)是已經發(fa)生過(guo)的(de)數(shu)據(ju),那么(me)過(guo)去的(de)數(shu)據(ju)已經發(fa)生了還有什么(me)用呢?其實,大數(shu)據(ju)只是借分析過(guo)去的(de)數(shu)據(ju),來探索事物的(de)規(gui)律和特(te)征,其目的(de)是為(wei)了預判(pan)事物在(zai)未來的(de)發(fa)展變(bian)化或(huo)發(fa)展趨勢,
因(yin)此,大數(shu)據的(de)目的(de)是預測,基于對事物的(de)預測結(jie)果,用(yong)來作出相應(ying)(ying)的(de)策略調整(zheng)。如(ru)果預測的(de)結(jie)果不是我們想要的(de),則需要調整(zheng)相應(ying)(ying)的(de)策略,施加影響因(yin)素,使得事物朝(chao)著我們想要的(de)方向去發展(zhan)。
所以,大數據描述的(de)是過(guo)去,表達的(de)卻是未來!只有(you)預見未來,才能把握未來!
可見,大(da)數(shu)據(ju)之所以能夠用(yong)來進(jin)行業(ye)(ye)(ye)務決(jue)策(ce),不(bu)外乎就(jiu)是通過對數(shu)據(ju)的分析(xi),來實現對業(ye)(ye)(ye)務特征、業(ye)(ye)(ye)務規(gui)律、業(ye)(ye)(ye)務變(bian)化(hua)的把握,以及影響業(ye)(ye)(ye)務變(bian)化(hua)的關鍵(jian)因(yin)素進(jin)行分析(xi),來達(da)到了(le)解業(ye)(ye)(ye)務,預測(ce)業(ye)(ye)(ye)務未來發展的目的。
所(suo)以,大數據分析的(de)核心價值,就是去發(fa)現數據的(de)特征(zheng)、變(bian)化和關系。
因為數(shu)據(ju)的特征就是業(ye)務的特征,數(shu)據(ju)的變(bian)化(hua)就是業(ye)務的變(bian)化(hua),數(shu)據(ju)間的關(guan)系就是業(ye)務因素(su)間的關(guan)系。
轉載://bamboo-vinegar.cn/zixun_detail/111710.html