“FINTECH - Reshaping the Future of Finance Services”

214 215 數據都是採自白人,所以,這個數據算法可以對白人應用有效,卻不能 拿到中國來直接應用。關鍵在於數據的「質」而非「量」。 相關性與因果性不容混淆 另一個同樣值得注意的大數據問題,是關乎「相關性」與「因果」問題。 很多大數據的分析結果其實都是相關性,而非因果關係。 舉一個例子,母乳餵哺可增加嬰兒的智商。醫學研究發現,母乳含有很 多有益成份,但母乳餵乳是否增加嬰兒的智商,透過採集數據得出來的 研究樣本發現,母乳餵哺可增加嬰兒的智商,這個研究結果只能說具有 相關性,指出母乳餵哺與嬰兒的智商相關,而非因果關係,亦即母乳餵 哺嬰兒,結果導致嬰兒智商增加。扼要言之,相關性是非必然,而因果 性則具有必然性後果。我們利用大數據協助決策,所希望的,是可以得 到因果關係的肯定性答案,可惜大數據簡單分析得出的答案結果,只能 是相關性。 再舉例來說,我們在媒體上看到一些醫療研究報告,有研究分析結果 說,每天吃雞蛋好,但又有研究結果說,每天吃雞蛋不是那麼好。為什 麼有這些區別?大部分醫療研究報告都是通過觀察到的數據得出的,而 不是實驗。所以只能說明相關性,而非因果。如果平日吃雞蛋的人和不 吃雞蛋的人有其他不同,比如其他飲食習慣,運動習慣,那麼得出的結 果就不完全是吃雞蛋導致的。 事實上,大部分的數據只能夠告訴我們結果的相關性,而不能告訴我們 答案的因果性。當然,有某些情況,我們取得答案的相關性便足夠了。 譬如,在行銷市場,利用大數據分析,結果發現,買A貨品的人,很多 會同時購買B貨品,於是營銷公司便可以在銷售A貨品的網頁上,同時 插入B貨品的銷售廣告,甚至決策考慮把A貨品和B貨品打包銷售。利 用這個大數據分析結果相關性所作的決策,基本沒有問題。 然而,譬如,當A貨品的銷量下跌,應不應該及時把A貨品的價格下 調?很顯然,大數據分析的結果答案,要求具有因果性-指出銷量下 跌,便需下調價格的結論。由於大數據只能告訴我們答案的相關性,若 急不及待降價,決策便可能大錯。這一點,是我們應用大數據分析時, 要明白到其分析的局限性。 個人隱私易受侵犯 最後,值得一提,相較幾年前,如今大數據產生,以及數據的採集,在 我們日常生活中幾乎無孔而不入,使個入隱私很容易受到潛在侵犯。從 商業角度說,若商家濫用取得的個人資料,可能引起顧客的反感。譬如, 聽說有些APP裝置了「竊聽」的程式碼,當取得下載者貨品喜好的信息, 便會馬上送上相關貨品推廣優惠的信息,做法令人吃驚和反感。 究竟數據採集者蒐集了我個人多少私生活數據?這些數據拿來作什麼用 途?個人幾乎一無所知。譬如,我們下載一個應用程式,應用程式的研 發或經營者會以合約形式,來說明所採集數據的用途,該公司和下載者 的權利和義務,但有多少人會巨細無遺閱讀以至明白合約的內容?可以 說,在今日「大數據時代」,個人的隱私保障是一個很嚴肅而且很重要 的問題。 大數據的應用與不足

RkJQdWJsaXNoZXIy MzUzMDg=