在德國隊7:1大勝巴西之前,德國足球俱樂部在日常訓練中引入大數據的例子是涂子沛在演講時常講的內容。在德國隊捧得大力神杯之后,這個例子還會在涂子沛的講座中更多地出現。

  涂子沛,是數據工作者,也是暢銷書《大數據》的作者。今年5月,他的新書《數據之巔》上市?!按髷祿恢皇强萍紗栴},已經涉及社會管理等各個方面,這本新書的初衷是想把大數據這個現象放在歷史的縱軸上、通過國際對比,把它分析透?!蓖孔优鎸χ袊萍季W說,他希望能夠通過歷史的比對,找出中國的優勢在哪里、差距在哪里,以及下一步該怎么做。

  美國的數據文化是如何形成的

  美國的數據文化對歷史發展潛移默化的影響作用是《數據之巔》的一條主線。從美國建國之初,人口普查就在美國的制度建設上起到了重要作用;在南北戰爭時期,人口普查的結果也直接影響了戰爭的發展;《紙牌屋》之前,1930年代好萊塢就在用統計結果來決定劇本及主角人選……

  “人口普查一直都是驅動美國社會大數據發展的一條主線,世界上第一臺商業計算機也是為美國人口普查服務的。但這些歷史從來沒有很系統地分析和介紹到中國來?!蓖孔优嬲f。為了完成寫作,涂子沛把美國的人口統計史、農業統計史、工業統計史全看了一遍。有人評價說,涂子沛是從用數據重寫了美國歷史。

  利用網絡、書籍和檔案3個渠道,涂子沛在美國找所需的材料并不困難?!肮矆D書館是免費開放,需要的小眾圖書在亞馬遜上也能夠買到,它有二手書的交易平臺?!痹谒鸭牧系倪^程中也這位大數據專家感受到了中美在數據文化方面的差距,“我們的歷史資料數字化和美國相比存在差距,而大數據需要的是電子化的數據?!?/p>

  日本可以,中國為什么不可以

  《數據之巔》雖是以美國為主體,但全書中最讓涂子沛感動的卻是書中日本如何在二戰后快速崛起的部分——日本企業在戰后在美國“質量管理之父”愛德華茲·戴明的幫助下應用統計方法改善全面提升了產品質量,并在短時間內創造了經濟奇跡。

  豆瓣上有讀者評論說,看到這章時“眼淚嘩嘩的”,而這個部分涂子沛是也留著眼淚寫完的。為了把這章寫完,涂子沛查閱了幾乎所有關于戴明的傳記,他聯系了每個傳記作者,甚至電話聯系了戴明的女兒,向她查證一些歷史舊事。

  “我寫這個故事的時候,我想了很多,我想我們應該想一想,問一問,日本行,中國為什么不行?!蓖孔优嬲J為,日本15年崛起,有兩個答案,一是用好數據,二是他們的學習的精神,這也是最關鍵的?!耙姓J自己不行,正心誠意的想西方學。中國近代史的幾百年,一直拒絕西方文明,普世價值具有普世性,不能拒絕?!?/p>

  書中第五章開頭,涂子沛引用了陳獨秀的話,“吾敢斷言曰:倫理的覺悟,為吾民最后覺悟之最后覺悟?!标惖囊馑际? 中國不僅要學科技、還要學制度、最后要學倫理?!?/p>

  希望影響政策決策者和企業管理者

  第一本書《大數據》,涂子沛兼職寫了8個月,而《數據之巔》,辭去工作的涂子沛用了整整8個月的時間?!按髷祿苄?、很熱、很重要,我感覺有義務、有一種使命感要把這個話題在中國社會說清楚?!稊祿畮p》在戰略和頂層設計的層面上為大數據的建設提供了思路、指出了我們的差距?!蓖孔优嫦M@本書能夠影響政策的決策者和企業管理者。

  涂子沛為“之巔”設計了三層含義。第一層含義是政策維度,大數據是人為的現象,因此建設好需要頂層設計。第二個含義是技術維度,使用數據的巔峰的形式是什么?是讓機器自動的處理數據使用數據,邁向智能社會。第三層是文化維度,是站在數據的巔峰,看數據是如何興起的。

  “科技符號轉化為文化符號是這本書的使命,科技符號是精英的符號,是小眾的符號,文化符號是大眾的符號,要讓數據這個小眾的符號變成大眾的符號,要讓數據的文化的意識,要根植到大眾的意識中,讓大家都來使用數據,用數據說話,用數據決策、用數據管理?!蓖孔优嬲f。

  問答精選

  問:搜集數據和分析數據哪一更困難?

  答:兩個都難,只是難點在不同的地方,搜集數據需要的是廣度、分析數據需要的是深度、精度。搜集數據更花時間。好比寫作,要用一桶水,就要有10桶水,很多時候,海量的材料中,真正有用的只有一句話。

  問:下一本書寫什么?

  答:下一本書要承接《數據之巔》的話題,大數據未來會推動我們的社會邁向智能社會,我會寫中國和美國在邁進智能社會中的種種挑戰,以及如何應對,將從政策、經濟、文化這3個維度上來分析這個問題。

  問:國內的大數據還有哪些比較欠缺的地方?

  答:使用數據的意識、分析數據的工具、開放數據的理念,這些都是比較欠缺的。我們還沒有用數據說話的習慣,我的第一本書,說我們是“差不多民族”,我們的民族講究含蓄,不求精確,我們的邏輯性、精確性、理性思考的水平都偏低,這都是缺乏數據文化的表現。數據文化首先是尊重事實,其次是追求精確。數據是事實中最尖銳、最精確的事實,你用文字描寫的事實,就是沒有用數據描寫的精確,再次是推崇邏輯和理性。

  問:影響中國大數據應該的問題有哪些,如何化解

  答:企業基于數據的投資有幾個特點,首先,這種投資有不確定性,回報的不確定性。我們經常講啤酒和尿布的例子,但我們在投資的時候不確定能獲得這樣的結論,想大海尋寶一樣,讓管理者猶豫要不要投資。第二,就是基于數據的回報是分散的,分散在企業的各個環節,很難計算他的回報。分散性和不確定性導致了企業在投資時猶豫。此外,數據化的管理是基于精細化管理,我們缺乏數據文化,一個原因是我們的社會還比較粗放,還沒到精細化競爭的階段,但我們在逐漸邁入這個階段,西方已經進入了這個階段。

  問:對于大數據的發展有沒有擔憂

  答:會有擔心,第一個是隱私。第二,常常越精確的東西就越脆弱,我們的數據都存儲在云中,一旦計算機停止運行了,那我們的城市也會停止運行。人犯錯是個錯誤,計算機犯錯那就是個災難。人對機器的依賴越來越嚴重、人機共生的關系越來越明顯、人對手機的使用到底是提高了效率,還是降低里效率?這些問題,會引導我們去向哪里,我們還說不清楚,需要更多的研究。

  問:對美聯社利用機器自動寫稿怎么看

  答:這是人工智能在新聞媒體的應用,也是我下一本書探討的問題,因為人工智能的應該越來越多的崗位要被機器取代。但以后還是一定需要記者的,人工智能完成的是一個最基本的工作,到時候會更需要優秀的記者。它替代的是最平庸的,最簡單的,重復性最多的工作,這意味著記者的總群體將會收縮。

責任編輯:admin