大數據更需要強調數據挖掘利用,而針對目前存在的技術應用、人才、安全與隱私等問題,最關鍵的是要有國家大數據戰略,使其成為轉變經濟增長方式的有效抓手。

 
  不要被大數據(Big Data)的“Big”誤導,大數據更強調的不是數據之多,而是數據挖掘。數據大與價值大未必成正比,例如將一個人每分鐘的身體數據記錄下來,對了解該人的身體狀況是有用的,但如果將他每毫秒的身體數據都記錄下來,數據量將較前者高6萬倍,與按每分鐘記錄的數據相比,其價值并不能增加。大數據的價值在于樣本數的普遍性。統計一個人每分鐘的身體狀況數據與統計60個人每小時的身體狀況數據相比,可能后者在統計上更有意義。大數據往往是低價值密度。大數據中的多數數據可能是重復的,忽略其中一些數據并不影響對其挖掘的效果。因此可以說大數據的價值好似沙里淘金和海底撈針。
 
  大數據的量越大處理難度就越大,就需要更多的服務器或更高速的服務器。實時性是大數據挖掘面臨的挑戰,而非結構化是大數據挖掘的主要挑戰。目前國際上大數據處理技術主要集中在結構性數據,但是大數據中80%以上都是非結構性數據。目前國內外都有很多大數據應用成功的例子,但基本上還是結構性數據,對結構性數據的挖掘是大數據應用的切入點。

責任編輯:admin