2017年7月26日下午,“2017政務數據治理與創新高端研討會”在北京梅地亞中心多功能廳隆重召開。本次研討會由中國信息通信研究院、中國社科院信息化研究中心、國脈數據研究院聯合主辦。中國信息通信研究院高級工程師、大數據發展促進委員會辦公室主任韓涵出席會議并發表了《政務大數據--技術發展與標準化》的主題演講,闡釋了“政府戰略轉型→業務轉變→數據應用變革→云化大數據服務”的政務大數據驅動路線以及“數據采集→數據開放→數據共享→統籌匯聚”的政務大數據建設流程,針對數據開放共享存在的問題,她建議建立數據分級/分類機制和數據共享負責人制度。
中國信息通信研究院高級工程師、大數據發展促進委員會辦公室主任韓涵
以下是會議現場發言實錄:
非常感謝主辦方提供的機會,今天分享中國信通院在大數據,尤其是政府大數據領域的研究進展。中國信通院是工信部直屬事業單位,是國家《大數據產業發展規劃(2016-2020)》編制單位,也是《促進大數據發展行動綱要》編制主要職能單位,信通院在大數據產業發展、標準制定、地方政府產業規劃、頂層設計、系統建設方面有一定經驗,今天把這些經驗分享給各位嘉賓。
一、我國大數據發展基本狀況
第一,領導層高度重視大數據發展,國家密集出臺政務數據開放共享相關政策。從大數據的發展來看,最高級的指示是習總書記提到建設全國一體化的大數據中心,目前網信辦在具體討論該建設方案,中國信通院也是該方案的主要支撐單位。在去年的兩會上李克強總理提到大數據是"鉆石礦",將大數據技術放在了很高的關鍵位置上。
政府部門對于政務數據開放、共享和使用,這十幾年一直都在陸續推進相關政策,包括《政務信息系統整合共享實施方案》、去年底發布的《"互聯網+政務服務"技術體系建設指南》、6月份落地的《政務信息資源目錄編制指南》,文件發布很密集,相關的文件有5個。同時,2004年中辦發〔2004〕34號《中共中央辦公廳 國務院辦公廳關于加強信息資源開發利用工作的若干意見》中提出了以信息化帶動工業化、以工業化促進信息化,充分發揮信息資源開發利用在信息化建設中的重要作用,推進經濟結構調整和經濟增長方式轉變,實現經濟社會全面協調可持續發展,主要的理念與政務信息的發展如出一轍,因此數據資源的使用,十幾年以來在國家的政策中始終都沒有變過,這也可以證明大數據發展過程中的一些核心問題依然存在,面對這些問題我們如何開展工作,是需要我們產業界探討的一個方向。
第二,政府數據共享開放標準化進程不斷加快。從標準的層面,2007年國家發布了《政務信息資源目錄體系》和《政務信息資源交換體系》;2007年國務院頒布《中華人民共和國政府信息公開條例》條例,其中要求行政機關應當主動公開政府信息,還詳細規定了信息公開的方式、程序、監督和保障措施等。至今十年,沒有其它新的電子政務標準發布,不過,國家也成立了大數據領域的機構,陸續的標準正在制定和研討中,比如正在制定的大數據資源開放目錄和信息資源共享交換國家標準正在研討當中,但落地標準仍是2007年的這套標準。從這個層面來看,電子政務標準化進程十分緩慢,總結出的一些實際困難和問題也和十幾年前一樣。在各行業層面,陸續也有一些行業標準,比如交通、公安,它們的標準在行業體系內都比較成熟。國家層面非常重視信息化標準的建設,由網信辦牽頭,聯合質監總局和國家標準委發布了《"十三五"信息化標準工作指南》,為信息化標準建設、標準評估等提供一些明確的意見。
第三,大數據上升為國家戰略,全國多片區布局綜合試驗區。從大數據的視角,國家已將大數據作為國家戰略,列入了國家"十三五"規劃編制的內容中,工業信息化部發布了《大數據產業規劃建設2016-2020》文件,大數據最頂級的三部委批復貴州建設國家大數據(貴州)綜合試驗區,批準7個區域建設國家大數據綜合試驗區,試驗區注重創新和突破,注重新技術的應用,注重新的產業發展的培育。目前擁有包括京津冀、珠三角和省一級內蒙古、河南、上海和重慶等在內的區域性試驗區。
全國多片區布局綜合試驗區
第四,全國各地陸續制訂大數據發展政策規劃,開展大數據建設項目。前后有31個省市發布了大數據相關文件,近6個月來,文件發布更頻繁,包括地方大數據整體的設計指導意見、促進本地大數據產業發展的規劃以及推動具體項目落地的行動計劃。最近也有很多落實一些公開指導意見的地方性文件,關于落實國家政務信息系統統籌共享的文件以及關于國家信息資源體系的目錄文件也在頻繁發布中。因此,對于具體的大數據項目來說,政府在這一兩年里來,大數據建設項目數量增長非???,政府的占比也在增加,尤其是在從中央到地級文件的推動之下,大數據建設已從規劃戰略層面走向項目落地層面。
最后,當前政務大數據建設模式與問題。今天談到的政務大數據,把政務數據資源管理和數據治理作為一個重要角度,對于地方政府來說,政府發展大數據的目標非常清楚,主要面向三大政府需求:領導決策、政府治理和公共服務。數據資源發揮著重大價值,主要的手段就是資源的匯聚統籌和數據的共享。如何從技術的視角來促進政府大數據的建設,技術評價方案可以總結為真實、大量、快速、靈活、全面。從政府的角度,建設大數據系統,利用數據資源,整理政務信息資源目錄,提高政務數據質量,能夠滿足這些基本要求,從而使得數據的價值發揮更大,部署更加靈活,響應更加迅速,同時數據覆蓋維度更加全面。
同時,政府大數據的應用問題也非常顯著,2004年中辦34號文所提出的相關問題,比如數據孤島、數據互通、數據增值利用等,這些年也依然存在,物理層集中相對容易,真正的數據資源匯聚很難,從業務層面打通數據,實現協同和聯動則是難上加難。
二、政務大數據建設步驟
首先是數據采集。數據采集主要存在以下幾個問題:一是基層數據采集很困難,主要體現在業務部門太小,要求復雜,口徑又不一致,沒有管理規范,質量也沒有把控的體系。為了實現建設政府大數據的基礎,對基層數據的共享和校核是一個非常重要的步驟。目前各地都在建設基礎庫或者共享主題庫的一些基本原則,提倡編制動態、靈活和可變的信息資源目錄體系,而不是靜態的目錄。二是屬地化數據管理困難,在數據采集層面信息系統縱強橫弱,區域機構難以留存數據,難以建設區域統一的數據平臺,基層數據難以形成體系。有些區域級的政府對數據掌握能力比較弱,政務信息資源系統整合的目的以及建設政務信息資源目錄的目的也是加強區域級的政府對數據的掌控,同時在政務信息資源目錄編制的過程中,后續會采用屬地化的分層,而不是采用縱向的行業信息資源系統主題。三是歷史珍貴數據不夠重視。最后是實時數據獲取困難。
第二是數據開放。數據開放已經成為重要的工程,目前中央網信辦正在編制數據開放試點指導文件。從2009年美國建設大數據項目開始,在世界范圍內,政府數據開放成為一個比較重要的工作。政府信息開放是政府和企業之間資源共享的主要手段,政府數據共享是政府和政府之間數據共享的主要方法,政府和企業之間是主要的共享手段,企業和企業之間的共享融合主要靠交易,這也是大數據發展并推動數據資源價值利用的主要手段。
從開放的角度,政府信息公開、政務信息共享和資源目錄編制并不是完全一致的,目錄包括開放目錄、共享目錄和服務目錄。對數據開放來說,本身是有利的,更多的是政府和企業以及公眾之間共享層面的具體工作。數據資源希望流向社會,流向產業從而發揮更大的價值,而美國數據項目的初衷也是希望這些數據最終能流向產業,繁榮產業發展。因此,數據開放目前也是國家層面政府信息建設的主要方向。
在政府數據開放中存在的問題主要有以下幾點:一是“不愿開”,信息資源被視為獨家壟斷資源,擔心開放后部門權力削弱、經濟利益受損,并可能暴露部門業務問題;二是“不敢開”,尚缺乏保障數據開放的配套制度,缺少具有可操作性的強制性規定,與政府信息公開、保密法、檔案法等相關法律法規銜接不到位,各地對政府數據開放的范圍和潛在風險存在“后顧之憂”;三是“不能開”,數據基礎不牢,公共部門尚未建立一套完整的數據資源采集、管理、加工和開發利用的體系,很多信息資源缺乏數字化,數據資源多頭采集、重復建設、成本高昂,很多數據無人維護、不可持續,數據的質量和準確性也存在問題,有哪些數據資源也不清楚;四是“不會開”,開放質量不高,可利用性差,網站數據的質量問題突出,包括可機讀性差、數據更新頻率不高、數據互動性差等,網站缺乏標準化,增加了使用者成本。這也是從技術視角來探討數據開放不得不克服的一些問題。
第三是數據共享。主要通過共享交換平臺來實現,但是傳統的數據共享交換體系在大數據時代面臨一些問題:首先,在政策制約方面,一是政府數據共享缺乏全國統籌機制,協同不足,二是政府共享數據時,保護部門利益的本位思想較重;其次,在基礎制約方面,一是數據交換共享機制問題導致數據不落地,難以滿足大數據時代對多維度數據的需求,二是缺乏中心交換的政府數據共享技術,沒有數據融合的統一平臺。政府大數據共享交換體系與大數據時代未來發展更多維的數據融合以及以人工智能為基礎的智能型政府應用之間存在一些矛盾??偨Y國內各級政府發布的大數據政策中的重點任務要求,可以看到,開放平臺、共享平臺、目錄體系、基礎數據庫和管理中心是各級政府發展大數據的五項抓手。
各地方發展大數據的主要工作
第四是統籌匯聚。在數據中心層面,目前各地前期建設的很多數據中心在物理層是分離的,既擁有第三方數據中心、運營商數據中心,也有政府建設的數據中心,在區域級、行業級,根據不同的需求,歷史的數據中心都建設起來了。目前國家政策要求建設綠色、集約、節能、共享的數據中心,如何發揮大量的分散的數據中心的價值?需要實現各種資源整合共享利用,同時對新增的數據中心的管理要嚴格。關于數據中心建設,國家發改委也多次提出要統籌整合、共享利用已有的資源。在信息平臺層面,要統籌利用已有的資源,各地發展大數據時要徹底地整合政府數據。各級政府擁有很多信息平臺以及落地的政府項目,為實現融合貫通,需要采用一些技術手段來爬取一些信息資源,建設智慧型的統一共享公共平臺。但是對于已建成的分散的信息資源平臺,包括網站、信息系統等,不可能再推翻重建,對于落地的政府級項目也不可能把歷史的系統都拋棄掉,一般采取的措施是打通既有的舊的平臺,抓取相關的平臺資源來進行融合貫通,需要考慮到很多具體的實現方案,是采用爬取手段還是與既有平臺進行互動等,在“互聯網+政務服務”文件中都有所提及。在數據資源層面,目前各地都在建設共享較多的基礎數據庫,但是承擔的部門差異是很大的。數據資源層面同樣存在很多割裂的現象,如何真正地推動數據共享融合,提高政府數據的質量,形成資產化管理?除了加強舊的系統,整合既有數據以外,還要提高數據治理,建立數據管理的技術手段和規則以及業務流程。此外,社會普遍在探討政府和產業界的數據融合建設問題,比如采集部分互聯網數據資源,與企業共享一些相關數據。同時,對于大型機構掌握的核心數據,探討從防壟斷的角度來打破數據壁壘,這也是數據資源整合方面非常重要的一點。
三、中國信通院開展的主要工作
在《“互聯網+政務服務”技術體系建設指南》中,技術層面提出深化大數據和云計算等技術應用,大數據主要實現清洗比對、數據挖掘和數據開放等,云計算主要實現集約建設、共享利用等。政務數據資源的利用離不開以大數據和云計算為代表的技術手段,政務信息資源目錄文件的落地實施也需要新的信息技術支持。技術領域如何服務于政府,如何實現國家政策文件中提出的政務數據資源整合共享利用的目標,這是在研究層面需要探討的問題。我們希望進一步整理出目前面臨的實際問題,然后給出非常清晰的標準化的技術語言,讓各級政府部門來推動,在實際工作中作為參考。中國信通院開展的主要工作包括以下幾個方面:
一是技術應用白皮書,匯編各領域研究成果,集合業界經驗案例并對外發布。
《政務大數據建設標準體系》主要內容
二是政府大數據建設標準體系,首先,在技術層面建設大數據,要在多個視角進行體現,研究下一步的數據采集如何搭建目錄,數據爬蟲如何實現,如何滿足不同接口的需求;其次,在存儲和計算領域,要形成一個政府的數據化系統。數據量是否足夠大?技術要求是否足夠高?跨度或者傳統數據庫是否足夠?在這些層面,目前缺少一些明確的技術指標來作為參考;再次,在數據治理層面,我們在質量管理、評估、清洗方面提煉出一些技術標準來供大家作為參考;在數據分析層面,面向政府級的應用也比較復雜,我們希望能夠提煉出一些基礎性的數據分析參考模型以及面向大眾的、普適性的應用來作為導向標準;可視化主要問題是影響決策,希望出臺一些指導性意見,更好地引入外部數據;這是數據服務需要討論的內容,希望在具體領域與業界專家共同探討服務政府、服務產業界的標準體系,為產業發展做貢獻。以上是中國信通院前期的研究內容。