大數據是指所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。一段好長的話,去掉修飾后:“大數據是資訊”,然而,資訊一般定義為短時間內給人帶來價值的信息,這么看來這個定義不太合理。以我的理解:大數據是在數據體量大時,能快速帶來價值的一套解決方案。
1.大數據的來源
互聯網初期,主要是對交易數據的處理,例如銀行的交易、電信運營商的繳費扣費,這些數據的特征是精度高、價值高,那時候一般用IOE(IBM、ORACLE、EMC)這樣的解決方案。隨著互聯網基礎設施的發展,以及網上購物習慣的形成,用戶在網絡上生產了大量的行為數據,例如瀏覽數據、點擊數據、地理位置數據、消費數據、機器傳感器數據、監控數據等等。這些數據體量大,數據精度低,價值密度也低。但是,隨著客戶營銷、個性化的廣告推薦、個人信征這些業務的應用,這些數據被發現蘊含著大量的價值。然而之前的解決方案成本太高了,也處理不來這么大體量的數據,隨即,開源的大數據解決方案孕育而生。
2.大數據的應用
電商
例如你看到的淘寶商品櫥窗,會結合個人特征和商品特征給你推薦。系統收集了用戶的各種行為數據,以及與商品的各種數據,可能還會結合時間、氣候等等因素,才展現在你面前。
廣告
例如你在京東上收藏了個商品,不一會,今日頭條上就能看到相關商品的廣告,如果你點擊了這個廣告,廣告商就可能從廣告主那里收取一定的費用。計算廣告就是收集了大量的用戶行為數據,利用其中有價值的信息來變現。
交通
地鐵調度運營,交通運營,檢查冒牌車輛,監測違規駕駛等。
氣象
預測臺風,預測天氣變化。
醫療
通過對醫療數據的分析,人類能夠預測流行疾病的爆發趨勢、避免感染、降低醫療成本、疾病預診等,還能讓患者享受到更加便利的服務。
物流
供給匹配預測,庫存預測等,運輸車輛調配。
大數據已經滲透在各行各業,甚至有些新興行業的崛起就是靠著大數據,例如外賣、打車。