如今,社交網(wǎng)站的流行,網(wǎng)購的普及以及各種傳感器的廣泛應(yīng)用伴以數(shù)據(jù)儲(chǔ)存成本的降低和分析處理的思想與算法發(fā)展,讓我們產(chǎn)生了巨大的數(shù)據(jù)的同時(shí)更容易存儲(chǔ)、分析和利用它們。這就是所謂的大數(shù)據(jù)時(shí)代。一款優(yōu)秀的產(chǎn)品,必定是迎合時(shí)代潮流的。那么在“大數(shù)據(jù)時(shí)代“下,我們應(yīng)該如何去創(chuàng)造一個(gè)”大數(shù)據(jù)“產(chǎn)品?如何采集并利用數(shù)據(jù)?以下五點(diǎn)是我在“大數(shù)據(jù)時(shí)代”下的產(chǎn)品思考。
確定產(chǎn)品定位
數(shù)據(jù)收集
數(shù)據(jù)收集即自己去收集數(shù)據(jù),成為數(shù)據(jù)擁有者,通過數(shù)據(jù)授權(quán)等方式利用數(shù)據(jù)。
數(shù)據(jù)分析
擁有出色的數(shù)據(jù)分析技術(shù),從別人提供的數(shù)據(jù)那挖掘數(shù)據(jù)的價(jià)值。
數(shù)據(jù)創(chuàng)新
沒有數(shù)據(jù),也沒有出色的技術(shù)。但是看到了數(shù)據(jù)之間的聯(lián)系,預(yù)見到了數(shù)據(jù)存在的價(jià)值,成為這方面的先行者。
轉(zhuǎn)變產(chǎn)品思維
很多時(shí)候,我們能獲取約等于全局的數(shù)據(jù)量,但是我們很多時(shí)候還是用原先的數(shù)據(jù)處理方式。
原先我們只能獲取一部分?jǐn)?shù)據(jù),然后以這部分?jǐn)?shù)據(jù)去估算。所以我們的數(shù)學(xué)模型對(duì)數(shù)據(jù)的精確性和隨機(jī)性要求非常高,因?yàn)閿?shù)據(jù)是這么的少,改變一點(diǎn)點(diǎn)就能帶來結(jié)果上的巨大偏差?,F(xiàn)在我們擁有了更多的數(shù)據(jù),使用相對(duì)簡單的算法,只需帶入更多的數(shù)據(jù)就會(huì)擁有更精確的結(jié)果。
數(shù)據(jù)不再是單一的,結(jié)構(gòu)化的,而是混雜的。
“小數(shù)據(jù)”時(shí),我們會(huì)去給數(shù)據(jù)分類分級(jí),去盡可能的結(jié)構(gòu)化他們,我們能應(yīng)付過來,但是如今,數(shù)據(jù)多種多樣,很多時(shí)候你根本沒有辦法把他們分類分級(jí)。但我們可以利用這種混亂,比如給照片設(shè)定標(biāo)簽,開辟一個(gè)新的數(shù)據(jù)種類。
大數(shù)據(jù)時(shí)代推崇的是相關(guān)關(guān)系而不是因果關(guān)系。
這也是大數(shù)據(jù)的核心:利用相關(guān)關(guān)系作出預(yù)測(cè),而不去分析它的原因。我們只知道“是什么”,而不知道“為什么”。但是前者很明顯更簡單直接的解決了問題。但是這并不意味著“因果關(guān)系”不再重要,我們要拋棄它。比如沃爾瑪通過數(shù)據(jù)分析發(fā)現(xiàn),颶風(fēng)來臨的時(shí)候蛋撻銷量特別好,那么我們就可以在颶風(fēng)來臨時(shí),多做蛋撻并擺在顯眼的位置以增加銷量。但是我們并不知道為什么它們會(huì)相關(guān)。
獲取數(shù)據(jù)
數(shù)字化同時(shí)數(shù)據(jù)化。
數(shù)字化是數(shù)據(jù)化的基礎(chǔ),比如僅僅掃描一本書,讓它能夠在電子設(shè)備上閱讀,這叫數(shù)字化。但是你還不能處理上面的文字,做一些分析,我們需要通過圖片文字識(shí)別技術(shù),來將掃描的書轉(zhuǎn)化成可以提取分析的文本數(shù)據(jù)。只有數(shù)據(jù)化的數(shù)據(jù)才對(duì)我們的產(chǎn)品有價(jià)值。
從看似不可能的地方提取數(shù)據(jù)。
因?yàn)閿?shù)據(jù)存儲(chǔ)成本的變低和數(shù)據(jù)價(jià)值的巨大,我們可以收集更多的數(shù)據(jù)存儲(chǔ)起來以期日后能挖掘出價(jià)值。我們要開拓思維,從許多看似不可能的地方收集數(shù)據(jù)。比如,一家日本汽車服務(wù)商,創(chuàng)新的把傳感器放到了汽車座椅上,經(jīng)過記錄與分析,我們可以判斷司機(jī)的體型,習(xí)慣坐姿,受力等等數(shù)據(jù),如果一個(gè)小偷坐上了汽車,傳感器感受到了變化,就會(huì)讓其輸入啟動(dòng)密碼以確認(rèn)身份。
提前設(shè)計(jì)擴(kuò)展數(shù)據(jù)。
數(shù)據(jù)在不斷的再利用中才能發(fā)揮出其最大的價(jià)值,一開始就設(shè)計(jì)好數(shù)據(jù)的可擴(kuò)展性能讓這種再利用更容易,雖然這并不總是可能。谷歌街景車在收集信息之初,考慮到了自己未來的自動(dòng)汽車計(jì)劃。所以在采集的時(shí)候,記錄下的街景和GPS定位信息將來不僅可以優(yōu)化地圖也能用于自動(dòng)汽車的研發(fā)。
利用數(shù)據(jù)廢氣。
我們看看谷歌是怎么利用登錄的驗(yàn)證碼的:它將驗(yàn)證碼變成一些常見的錯(cuò)誤拼寫單詞,每次用戶登錄輸入這些驗(yàn)證碼的時(shí)候就要求其輸入成正確的單詞。這一舉措讓谷歌的拼寫檢查器得到了巨大的提高,而且還是免費(fèi)的。
數(shù)據(jù)利用
直接利用:通過直接的方式利用。比如分區(qū)域統(tǒng)計(jì)你用戶的身高,做成一張各省份平均身高表。
數(shù)據(jù)再利用:利用之前的數(shù)據(jù),往往能獲取更多的信息。比如谷歌根據(jù)搜索記錄分析,預(yù)測(cè)了各地流感發(fā)病情況,達(dá)到了相當(dāng)高的準(zhǔn)確率。
數(shù)據(jù)重組:將不同領(lǐng)域的數(shù)據(jù)結(jié)合起來分析。比如將手機(jī)的使用情況和癌癥發(fā)病率聯(lián)系起來,丹麥的科學(xué)家發(fā)現(xiàn)兩者之間并沒有什么關(guān)系。
開放數(shù)據(jù):你的數(shù)據(jù)處理能力不強(qiáng),那么可以選擇公開或者授權(quán)數(shù)據(jù),讓別人用你的數(shù)據(jù)發(fā)掘出價(jià)值,并從中獲益。
法律與道德
產(chǎn)品對(duì)于用戶數(shù)據(jù)的分析,難免會(huì)涉及到用戶的隱私,數(shù)據(jù)利用的創(chuàng)新也會(huì)讓數(shù)據(jù)涉及到用戶未授權(quán)的用途,你沒法去再征求所有用戶同意。在法律不明確的情況下,我們利用這些數(shù)據(jù)去做些什么,會(huì)產(chǎn)生生什么樣的后果,產(chǎn)品設(shè)計(jì)者必須要思考清楚,并負(fù)承擔(dān)起相應(yīng)的責(zé)任。