如果想要清晰大(dà)數(shù)據的技(jì)能,我們就需要明(míng)白分析什麽數(shù)據,也就是要了解大(dà)數(shù)據要分析的數(shù)據類型,總的來(lái)講主要有(yǒu)四大(dà)類:
交易數(shù)據(TRANSACTION DATA)
大(dà)數(shù)據平台能夠獲取時(shí)間(jiān)跨度更大(dà)、更海量的結構化交易數(shù)據,這樣就可(kě)以對更廣泛的交易數(shù)據類型進行(xíng)分析,不僅僅包括POS或電(diàn)子商務購物數(shù)據,還(hái)包括行(xíng)為(wèi)交易數(shù)據,例如Web服務器(qì)記錄的互聯網點擊流數(shù)據日志(zhì)。
人(rén)為(wèi)數(shù)據(HUMAN-GENERATED DATA)
非結構數(shù)據廣泛存在于電(diàn)子郵件、文檔、圖片、音(yīn)頻、視(shì)頻,以及通(tōng)過博客、維基,尤其是社交媒體(tǐ)産生(shēng)的數(shù)據流,這些(xiē)數(shù)據為(wèi)使用文本分析功能進行(xíng)分析提供了豐富的數(shù)據源泉。
移動數(shù)據(MOBILE DATA)
能夠上(shàng)網的智能手機和(hé)平闆越來(lái)越普遍。這些(xiē)移動設備上(shàng)的App都能夠追蹤和(hé)溝通(tōng)無數(shù)事件,從App內(nèi)的交易數(shù)據(如搜索産品的記錄事件)到個(gè)人(rén)信息資料或狀态報告事件(如地點變更即報告一個(gè)新的地理(lǐ)編碼)。
機器(qì)和(hé)傳感器(qì)數(shù)據(MACHINE AND SENSOR DATA)
這包括功能設備創建或生(shēng)成的數(shù)據,例如智能電(diàn)表、智能溫度控制(zhì)器(qì)、工廠機器(qì)和(hé)連接互聯網的家(jiā)用電(diàn)器(qì)。這些(xiē)設備可(kě)以配置為(wèi)與互聯網絡中的其他節點通(tōng)信,還(hái)可(kě)以自動向中央服務器(qì)傳輸數(shù)據,這樣就可(kě)以對數(shù)據進行(xíng)分析。機器(qì)和(hé)傳感器(qì)數(shù)據是來(lái)自新興的物聯網(IoT)所産生(shēng)的主要例子。來(lái)自物聯網的數(shù)據可(kě)以用于構建分析模型,連續監測預測性行(xíng)為(wèi)(如當傳感器(qì)值表示有(yǒu)問題時(shí)進行(xíng)識别),提供規定的指令(如警示技(jì)術(shù)人(rén)員在真正出問題之前檢查設備)。