【寫在前面】有人這樣定義“大數據技術”:從各種類型的數據中,采用新處理模式快速獲得有價值的信息,從而實現深度理解、敏銳發現與精準決策。它讓看似無序的世界變得有規律可尋,它打破傳統行業的瓶頸,用現代信息技術讓生產升級、生活變得更好。

  2017年,是大數據行業里程碑式的一年,“數字經濟”首次寫進《政府工作報告》,這被業內認為是一個信號——數字時代奔騰而來,將對中國經濟未來發展方向產生深遠影響。

  在南京,大數據產業發展方興未艾,近年來保持15%的快速增長。在全國31個重點城市的大數據發展指數得分排名中,南京位列第三。

  但是對于普通人來說,“大數據”始終是一個漫步在“云端”的時髦詞,它從哪里來、到哪里去?怎么改變生活和工作?會不會泄露你我的隱私?無數問題縈繞心頭。記者深入產業一線,嘗試解開這些數據“密碼”。

位于軟件谷的南京大數據產業基地。 崔曉 攝

  我們身邊大數據無處不在

  【網購】 “大數據告訴我什么是潮流”

  除了買房、租房,網購也用上了大數據。

  南京新與力文化傳播有限公司11年前從一本潮流雜志《YOHO!》起家,衍生出專賣潮牌的電商平臺“有貨”。作為全市大數據重點應用示范項目,該電商平臺自上線以來,已實現日訪問量2600萬人次。

  YOHO的受眾群是18—26歲的年輕人,潮流是啥,可能很多人說不清楚。該企業創始人梁超表示,他也不懂,但大數據可以告訴他。公司目前的銷售額90%來自線上App,對用戶在線上瀏覽商品到最后購買的行為軌跡進行處理,針對每個人的不同喜愛,進行首頁瀏覽設置、做出不同的推薦、提供不同優惠券,他們為客戶提供的是“千人千面”的服務。同時,大數據還可以告訴他們用戶所關注的商品價格、款式等信息,他們進行數據分析后,可以輔導電商進行商品推介,明確庫存備貨量等。

  “這些年來,通過精準的大數據分析,我們幫消費者篩選出了1400多個國內外潮流品牌,其中不少是限量商品,與其他電商平臺實現錯位,例如我們與天貓有65%的品牌不相同、80%的貨品不重復?!绷撼f,因此在傳統媒體日漸衰落的大背景下,這家靠做雜志起家的企業,不光電商生意在近3年實現每年翻一番,去年銷售實現20個億,并且雜志發行量達到每期40多萬份,廣告費一直在上漲。

  下個月,有貨的第一家線下實體店將在新街口開業?!皩嶓w店將完全與線上平臺打通,例如客戶在線上瀏覽過哪些產品,在實體店里試穿了哪些衣服,最終購買了什么品牌,對衣服的評價如何,所有數據信息都將與線上電商平臺互聯互通?!?/p>

  【買房】 語音搜房甚至可以聽懂南京話

  很多南京市民對“365房產網”耳熟能詳,事實上,如今的“365”早已不僅僅是一個房產信息交流平臺,而是一家非常典型的大數據企業。

  “我們所有的大數據,都來自于有意向通過“365”買房或租房的客戶,與其他領域的大數據不太一樣,買房租房的數據,活躍期特別短,最長不超過3個月?!苯K三六五網絡產品技術高級總監陸洋介紹,這些大數據信息可以幫助判斷南京樓市的走向和趨勢,進行用戶管理等。

  經過多年積累,“365”早期搭建的大數據平臺“用戶CRM管理系統”已非常成熟完善,目前累計數據達到5000萬,累計達成新房成交超過萬套。去年開始,“365”網與南京大學合作開發了“推薦系統”,根據用戶的瀏覽軌跡,精準進行新房和二手房的房源推薦。

  陸洋說,最近,“365”網又開發了一項大數據新技術——“語音語義識別系統”?!袄?,在我們的‘愛租哪’平臺上,一般手動輸入租房查詢信息,最快操作一次也需要20秒鐘,有了語音識別,對著手機說句話,10秒不到就能搜出想要的信息?!彼榻B,“這是我們與科大訊飛合作推出的國內第一款專業房地產領域語音搜索——語音語義分析系統,加入了我們獨特的數據分析,不僅能夠迅速準確地識別南京所有樓盤的名字,甚至還能聽得懂南京話?!?/p>

  【健康】 大數據“把脈”基因密碼

  南京江北新區揚子科創中心,“藏著”去年落戶在此的首個國家健康醫療大數據中心,目前該中心已引進數十臺全球最先進的基因測序儀器。日前,記者前往探訪,十多臺洗衣機大小、四四方方的白色儀器正在緊張運行。負責該中心運營的南京諾禾致源生物科技有限公司負責人徐源介紹,這些儀器每年可服務30萬—40萬人次。未來,中國東部地區約4億—6億人的臨床醫療、公共衛生等健康大數據將集中儲存在此。未來,這里將是中國最大的人類全基因組測序中心。

  揚子科創相關負責人向記者解釋,每個人每天的作息、飲食、運動數據、家族病史、個人用藥史,以及全基因組序列信息等等健康醫療大數據與我們的生活息息相關。健康醫療大數據中心的使命就解開這些數據背后的基因密碼,將生命科學、醫療技術和信息技術結合,進行健康醫療大數據的管理、分析和服務。通過對健康醫療大數據的收集、整理、挖掘和跨庫搜索,為個人精準健康和精準醫療、群體疾病研究和公共突發事件的決策提供支持。

  據悉,去年10月,南京成為國家健康醫療大數據應用及產業園建設的首批試點城市,試點工程落戶在揚子科創中心。目前,該平臺已吸引了十余家國際、國內知名生物科技企業,包括諾禾致源、云健康、世和基因等9家知名企業。今后,所有這些大數據信息可以用來進行健康人的遺傳病攜帶篩查、腫瘤風險預測、新生兒基因篩查等都將變得更精準和簡單?!半S著設備和試劑的不斷更新完善,最快到今年底明年初,普通人進行一次全基因組測序的成本將從目前的1000美元降至幾百美元?!毙煸凑f。

  【運輸】 海量數據搭建高效物流平臺

  南京“福佑卡車”是一個專注城際整車運輸的互聯網交易平臺,主營業務是為貨主企業提供整車運輸服務,融合大數據、移動互聯網、人工智能技術,為貨主企業提供智能運力、保險、金融等綜合產品和服務。

  截至目前,福佑卡車平臺積累了197萬次詢價數據,平均每月新增10萬次詢價數據,這些數據能夠反映價格波動規律和市場供需波動情況;擁有55萬單交易數據,這些數據能夠反映經紀人路線偏好數據和經紀人報價數據;沉淀了26萬名司機信息,能夠全面反映司機登錄數據、經紀人與司機關系記錄等。

  “我們所有的數據都是基于平臺真實的交易、服務和結算場景生成的數據。從交易到服務,從行為到信用,這些數據都是在平臺上真實發生的,都能做到有據可查、有跡可循?!逼髽I相關負責人介紹,目前福佑卡車已實現全國化網絡布局,服務覆蓋30個省份,93個大中城市??爝f領域的京東物流、韻達、優速、百世、順豐等;零擔快運領域的德邦、遠成、新邦、安能等;合同物流領域的招商物流、中外運、嘉里大通、榮慶、大田、宅急送等均與福佑卡車開展了業務合作。目前,福佑卡車平臺日均詢價量5500單,日均成單1500單,平臺單月交易額突破4億元。

  快馬爭先南京搶占產業制高點

  為什么要做大數據?

  軟件谷管委會副主任黃敖齊說:“這是順勢而為。軟件產業每年的熱點都不一樣,但不管是現在風頭正勁的互聯網還是人工智能,說到底,它們的基礎都是大數據?!?/p>

  而在大數據公司江蘇新視云科技股份有限公司總經理張長昊眼中,這是產業發展到一定階段“水到渠成”的事:“很多大數據企業是做業務出身,當你在某個領域把業務做到一定規模,必然形成數據沉淀,自然而然就進入了大數據領域。就像阿里巴巴,淘寶做大了,‘賣東西的’轉型為數據公司了?!?/p>

  回顧南京大數據產業的發展“軌跡”圖,南京市經信委副主任翟勝強說,作為工信部認定的首個“中國軟件名城”,這些年南京軟件業保持競爭力的秘訣就是不斷尋找“新增長點”,快步從“人口紅利”時代向更高附加值產品時代邁進。早在2013年,南京就在全國較早制定出臺了《關于加快大數據產業發展的意見》。同年,南京首家以大數據創新應用為主題的產業園區——南京大數據產業基地在中國(南京)軟件谷起步。

  起得早,走得快。依托南京的產業基礎和科教人才資源優勢,目前南京市大數據產業發展狀況在全國領先。2016年全市大數據產業規模同比增長18%,成為引領和拉動全市軟件產業持續增長的新引擎。

  2016年,中國大數據產業生態聯盟發布“區域大數據發展水平評價體系”報告,南京市被評為2016年首批四個大數據發展五星級城市之一。2017年,國家大數據戰略重點實驗室發布的《大數據藍皮書:中國大數據發展報告No.1》顯示,南京在全國31個重點城市的大數據發展指數得分排名中位列第三,大數據發展水平居全國前列。

  近日,由江蘇省經濟和信息化委員會組織的“2017年江蘇大數據應用示范項目”評選結果揭曉,評出經濟發展與產業升級、民生服務、社會治理三大領域60個大數據應用示范項目,其中優秀大數據應用示范項目20項。南京地區共有29項大數據應用項目入選,其中優秀大數據應用示范項目14項,占比過半。

  數據為王產業盛宴中隱憂浮現

  【盛宴】 價值釋放,產業規模正急劇擴張

  全球所掌握的數據,每18個月就會翻倍。到2020年,全球的數據量將達到40ZB,其中我國所掌握的數據將占20%。大數據,能夠總結經驗、發現規律、預測趨勢、輔助決策,充分釋放和利用海量數據資源中蘊含的巨大價值,下一個時代,“數據為王”已經成為業內共識。

  阿里巴巴是最早提出DT數據時代的企業。馬云說:“在大數據時代,特別是萬物互聯的時代,人類獲得數據的能力以及處理的速度也遠遠超過想象,不管是AI也好,MI也好,我們對世界的認識將會提升到一個新的高度。數據也將成為主要的能源,大數據讓計劃和預判成為了可能。如果離開了數據,任何組織的創新都基本上是空殼?!?/p>

  業內數據顯示,2015年全球大數據產業規模達到了1403億美元。到2020年,這一規模將達到10270億美元。其中,2020年中國大數據產業規?;蜻_13626億元。

  【隱憂】 掘金大數據,當下難有“隱私界限”

  大數據崛起的背后,也有不小隱憂:大數據時代,你無法拒絕個人信息被收集。它就像一雙無所不在的眼睛,靜悄悄窺視你的一舉一動。

  今年5月,記者聯系南京一家金融大數據企業采訪時,企業老總思忖再三,婉言拒絕了。讓他“被迫低調”的,是大數據行業當月發生的一起“地震”——大數據行業“第一股”、市值曾高達21億元的——“數據堂”高管和業務人員被警方帶走調查,多條數據線業務處于停擺狀態,原因是涉及泄露客戶隱私。

  他說:“其實我們的數據主要靠平臺數據商提供,以及在網絡公開資料中用‘爬蟲’等技術調,并沒有去‘偷’。但大數據技術的厲害之處是,可以把老百姓點點滴滴不經意的行為串聯起來,‘碎片’拼成人,甚至比你自己還了解自己。眼下,這種大數據‘畫像’技術引發了關于隱私權的爭議。我們公司今年剛剛涉足這部分業務,因為很多P2P公司有需求。很多老百姓驚訝,P2P公司放貸怎么那么快,并不是他們審核松,而是他們有大數據做支撐,知道你是不是講信用、有財力。企業需要這種技術,但是技術提供商又不知道隱私的‘紅線’在哪里,并沒有人來告訴我們可以做到什么‘度’?!?/p>

  這家金融大數據公司負責人還和記者坦言,自從進了大數據這一行業,他再也沒用過機場的公共WiFi。蹭一次免費網絡,掃一次二維碼,可能從此你什么信息都是透明的。不可避免的,他自己的生活也在大數據影響下?!拔疫€沒結婚,從來沒買過嬰兒用品、結婚用品,經常會收到相親活動短消息,估計我的‘單身’信息就是被大數據分析出來的?!?/p>

  不僅在中國,其實在全世界,企業掘金大數據都沒有明確的隱私界限。去年7月,谷歌首家省級AdWords體驗中心落戶南京,該中心將利用谷歌的大數據資源幫助企業在全球精準營銷,這樣的中心在中國已有數十家。記者看到,作為知名搜索引擎,谷歌每天有50多億的點擊量,業務涉及190個國家。谷歌的后臺可以追蹤到用戶瀏覽網頁時的每一個細節,點擊什么頁面、停頓時間,你的行為習慣、興趣愛好將無一例外進入后臺系統,形成大數據分析報告。

  為了對大數據技術進行約束,今年6月1日《中華人民共和國網絡安全法》實施,最大亮點是對個人信息進行保護。

  8月16日舉辦的第三屆中國互聯網安全領袖峰會安全法治治理分論壇上,北京大學法學院教授、互聯網法律中心主任張平的觀點代表大多數百姓的訴求:個人信息的收集應以人身權或敏感信息不受傷害為基本原則。但她也直言,保護個人隱私面臨一個巨大挑戰是技術層面的。大數據的區塊鏈技術是去中心化的,這就意味著沒有人能夠控制它,很多時候,用戶都找不到真正的責任人。

  從當前的現狀來看,保護大數據時代下的個人隱私,不僅需要詳細的立法,還需要更強大的技術支撐。

責任編輯:lihui