11月23-24日,“2017互聯網+智慧中國年會”在北京萬壽賓館召開。本屆年會以“智繪城市 數造未來”為主題,以數字政府、智慧城市、互聯網+政務服務、數據治理、信息社會等為主要議題。會議由中國社會科學院信息化研究中心、北京國脈互聯信息顧問有限公司聯合主辦,國脈海洋信息發展有限公司、浙江蟠桃會信息技術有限公司協辦,共有來自全國部委/省/市/區縣電子政務、智慧城市、大數據主管領導、行業專家、企業代表、主流媒體千余人參會。

在“2017政務信息系統整合共享與數據資產普查研討會”上國脈海洋常務副總經理、高級咨詢師王路燕以《大數據時代政府數據資產管理實踐》為主題進行了分享。

Jfoto2607_20171123_FF1_8516.jpg

國脈海洋常務副總經理、高級咨詢師王路燕

以下是會議現場發言實錄(根據速記和錄音整理,未經本人審核)

今天在這里跟大家分享國脈在目前政府數據資產方面的探索和實踐,政府管理要有基礎和經驗,我結合我們做過的浙江和海南及其他地方的實際案例與大家分享在大數據的時代數據資產的管理實踐經驗。

一、大數據時代的討論熱點

首先來看一下大數據時代討論的熱點,大數據概念提出幾年來,現在關于大數據的討論主要從三個角度來講:

第一個是大數據技術,現在做大數據,就要有平臺、傳統的數據倉庫以及實時的計算,這些都要涉及到方方面面的大數據技術。政府要做新的技術,要做大數據架構,我們有時候會問他們:到底哪些數據?這些數據的哪些部分適合哪些技術?很多地方企業都沒有想明白這個問題。

第二個是應用場景,這個圖是銀行給的場景,現在有這么多數據,這些數據到底要用在什么業務上?它的應用場景是什么?很多政府部門以業務需求為導向的做大數據,都是不切合實際的。

blob.png

應用場景

第三個是數據交易,這是最近的熱詞,以前公司都講有金融的資產、人力的資產、物資的資產,但是現在企業都在想做數據資產,包括國內外的一些專家、研究機構都在探討自身數據資產怎么進行估值,怎么樣能夠進入企業的資產負債表,最后能夠變成實際的價值。同時我們梳理了一下,目前全國各地成立的數據交易中心,這里我們只是列舉了一些,貴陽有兩個,貴陽大數據交易所、貴陽現代農業大數據交易中心。說到數據交易,數據在交易過程中,它是不是真的適合被交易,數據的一些特性是不是符合?在數據的數據質量方面,哪些數據的量、數據資產被盤點清楚了?這些問題都沒有考慮?! ?/p>

二、面臨的問題

通過對大數據時代熱點的討論,我們可以通過這些問題來進行導向,政府部門它的到底有哪些數據和系統?產生了哪些業務?這些數據系統之間,關系是什么樣的?這些都是不清楚的。最后總結起來就是數據資產不清晰,數據價值難以體現出來、數據質量是不可控的、質量不高因為我們沒有從底層開始做這個系統、業務,這些都是面臨的問題。

三、Gartner-數據管理成熟度

這個圖是一個國外的研究機構出的數據管理成熟度的分析,大家可以看到,左邊是2016年的內容,右邊是今年的。這里有一個非常有趣的現象,可以看到紅色的那些點,代表還沒有到達成熟期之前,這個詞已經過時了。通過圖可以看到,2016年有三個詞過時,一個是大數據,一個是大數據技術,從側面說明大數據發展這么多年里,現在這個詞已經過時了,原先叫大數據,現在大數據是一個常態了,剛出來的時候覺得很難處理,現在大家順應了這個趨勢,所以說這個詞已經過時了。

blob.png

Gartner-數據管理成熟度

2017年有兩個紅點,一個是數據目錄,第二個也是大數據相關的,這兩個詞以后還會過時,這些詞的成熟度反映了大家關心大數據未來的發展趨勢和方向,包括現在重點的關注度在哪?那么我們如何解決這些問題?

四、數據管理體系-DAMA模型

blob.png

針對以上問題,我們也做了一些相關的研究,這是國內提出的數據知識管理體系,提到數據管理分為十個層面,從數據的架構管理、開發、操作到元數據管理、數據質量管理、數據安全管理、主數據管理、數據倉庫管理、文檔和內容管理,最后到數據治理。這十個層面之間的關系是什么樣的?我認為基礎的核心工作首先要做數據的架構管理,然后做數據的開發,最后進行數據的操作,任何一個數據從無到有,都要經過這三個步驟。得到這些數據后,這些數據還不能用,我們還要去關注數據的三項方案,這三個專項的方案對應的是要做下面所有的特性和核心工作,從數據治理角度這些都是要做的。

數據治理和數據管理這兩個概念一直在混淆,數據治理具有方向性的,我的工作組織、體制機制、人員怎么樣,而數據管理管理是一些具體的工作。

五、數據生命周期

這些我們可以從兩個角度去判斷,第一個是從空間的視角,第二個是從時間的視角。從空間的視角看,我做了一個類比,上面一張圖是關于中國歷史的,為什么中國是一個集權的國家?其實這跟中國歷史有關,也跟中國的地理有關,因為中國以前有水患,黃河發水是四處流的,不管國家的邊界、區域、省份,水患發起來就四處流,要有一個相對集權的體制去治理水患。

blob.png

數據生命周期

類比到數據,從空間的角度,數據從哪里來,經過哪些環節,最后到哪里去。從時間的視角,數據的生命周期從數據的規劃、標準、開放、實施、維護,以前我們沒有關注數據的生命周期,我們關注是的系統下面的數據周期,以前我們做系統的規劃、分析、設計、開放到最后的部署上線,基于這個系統做數據的管理創建,這時候再考慮數據質量的問題,數據質量要求是不是符合提出的目標,其實這時候已經晚了,整個數據生命周期在規劃分析的時候就要考慮進去,這是圍繞數據生命周期來講的。

六、政府數據管理體系

blob.png

政府數據管理體系

針對數據的生命周期,我們提出了政府數據管理體系。我認為最重要的有四個:

第一個是數據資產體系,如何把數據資產理清楚,資產不是獨立的,要理清楚關系。

第二個是數據的標準體系,如何進行編碼的標準、分類的標準、分層的標準,

第三是數據架構體系,基于這些標準如何加架構?如何做模型設計?

第四是數據服務體系,基于這些模型,如何做整個的數據服務,包括交換共享、數據應用。

七、數據基因架構體系

我們對應的做了整個數據基因的架構體系,包括理論上、概念上的數據需求,從最開始的數據元和政府數據清單的梳理做資產的管理,通過一些技術手段做數據的采集,最后形成數據治理來提升整個數據的服務。

關于數據基因的服務體系,我們圍繞整個數據的體系提出了十個體系和九大服務,所有的產品都是技術加服務結合在一起做相關的工作。下面我講一下應用案例,如何把十大系統和九大服務體現在案例上面的。

八、應用案例-數據資產管理

我們做貴州資產登記的時候思考了很多,政府數據資產是什么?如何定義它?我們做了很多的權屬關系,數據資源的登記項包括這些清單的要素是什么,做了很多的梳理工作,梳理完之后,我們做了一張資產地圖,以下是我們應用的實際落地的幾個案例。

1.廣州市的數據資產管理系統

廣州市的數據資產系統時,我們梳理一級委辦局,信息系統近500個,系統資源近3000項,數據字段近25萬項,我們會選取一些出現頻率高的,對它做一些追溯的分析,做一些標準化和實際質量的報告。

2. 深圳氣象局做元數據的標準體系

深圳氣象局做元數據的標準體系,包括數據資產地圖和氣象領域目錄的分類。

3.浙江省信息系統普查

我們給浙江省做了全省的信息系統普查,普查了近1000多個系統。然后對這些系統普查之后,做了一個診斷,系統填報上來的清單有個自動診斷的功能,根據相應的條件進行設置,比如說孤島系統,我們要定義什么是孤島系統,按照量化去設計;比如業務專網,跟其他網絡不能通的,肯定是孤島。這個系統中跟其他系統沒有關聯的是一個孤島系統。我們掃描識別沒有上云的、訪問程度低的,日均少于1000的系統,這些條件設置好以后,系統自動會出一個診斷報告,告訴你這個系統要達到什么標簽,這是在浙江省在做的政務信息系統。

數據目錄梳理,我們做了很多地方的案例。這是我們目前梳理的一個主要路徑,首先從我的應用系統,我們現在的系統導向以應用為導向,就是引用系統里面有哪些數據,這些數據采用的結構是什么,這個表結構可以通過采集的方式,只要部門提供給你系統的用戶名和訪問的網址和密碼,你都可以把表結構提取過來,可以形成相應的數據資源目錄。

這個目錄不是說表結構里面是怎么樣就怎么樣,是要進行分層分級分類。對數據進行分層分級分類以后,就形成了一個數據目錄,基于這個數據目錄上,我們提出了一個概念叫做目錄梳理的流程即未來相應的所有部門,要去創建它的表或者修改它的表,它的路口一定要在這個目錄系統的路口,去生成相應的數據的庫表,把數據庫表結構導入前置系統中,然后部門再推送相應的數據。

我們也在海南省做這一塊相應的工作,包括跟國家層面的系統對接,包括淮安我們做了80個部門的對接。

后面一個案例是大家比較關心的,我們做到業務層面的浙江省的數據供需對接的案例,浙江省提出了幾個概念,第一個是數據項,數據項是我的證照、表格、結構化類的數據,然后由這些數據項組成了相應的數據,數據是在針對這些事項需要的材料,比如證照、批文,這些統稱所需要的數據。事項數據串是說事項要實現"跑一次",它涉及的數據集有些是可以自行填寫的,有可能是部門內部共享的,有可能是我形成一個事項數據串。到我的事項,我對這個事項的解析非常清楚,我的這些事項要實現"跑一次",這些材料涉及到哪些數據項,數據項是如何打通的?

相對應的數據共享的業務應用系統分為兩種部門,一個是需求部門,一個是數源部門。需求部門可以對事項去串需求,然后對數源部門去進行相關數源的確認,然后我們現在梳理了省級單位前100項,包括形成一個后續對接的情況。

具體在做的過程中,我們還做了一項工作是數據標準化的工作。我們發現部門的需求是各種各樣的,比如說一個證照、營業執照、營業執照副本、營業執照正本、印業執照復印件、工商營業執照、港商企業法人營業執照,其實這代表的都是一個營業執照,那么怎么樣進行規范化?我們做了一個技術數據字段標準,就是數源部門確認后就會加到這個標準里面。下一次需求部門提出來的時候,在這個標準詞里面會自動匹配過去。需求部門去提相應的需求,提了一個需求以后,這個需求就會對應的發送給這個數源部門,數源部門登錄這個系統,他就會來進行確認,這個數據字段提出的需求,是不是數源?如果是,它要確認,要確認這個數據是哪個材料?是哪個業務系統?哪個事項產生的?它的來源是什么?然后我們根據數源部門提供的形成這個數據責任表。當然也可以說不是數源,我們把這類數據進行系統派發,部門來進行命名,到底哪個部門才是權威的數源部門,這是支撐"最多跑一次"一體化政務服務平臺梳理好之后,通過共享平臺實現真正能夠實現一次去辦理。有些字段可以通過共享,不需要再重復填寫,材料不需要重復提交。

很多地方說,真正實現只要去一次或者兩次,很多前提是這些材料的代提,最難的是你如何做好這些材料的收集。浙江省做的工作是不要重復提交材料的,就是通過減材料這些環節。

這是非常完善的一個體系,前面是一個需求體系,后面是完善的共享體系,如何通過部門的需求清單,相應的需求提出來以后,把責任清單的數據歸集到數據資源中心,最后通過共享接口獲得想要的數據。

政府從2007年就在做數據共享這件事情,為什么做了十幾年,到現在為止還是在做?我們分析了一下,有幾個問題:

第一個是數據的形式,之前許多的資源目錄和交換平臺、共享平臺,有許多數據在上面,梳理出來的數據哪些部門真的看得懂、用得上,這些數據到底是不是真正發揮了價值?我經??吹讲块T報數據說,報送量是多少,在這其中它到底發揮了哪些價值。

第二個是管理模式,如何實現可持續的數據共享體系?我們在做浙江省項目時提出了一個概念叫做數據的共享,你要有一個共享需求,這個需求一定要與部門相關、能夠立即用的,一定要有一個完善的共享體系,整個共享平臺一定是非常健全的,最后形成整個數據之間的流動,歸集起來就是能夠使數據真正的活下來、用起來。

我們是理念+實際操作相結合的公司,包括我們自己對數據本質的理解,對政府做了這么多年咨詢工作的經驗總結,對政府業務的邏輯,以及我們自己對數據的落地實施案例,今天的分享主要到這里,謝謝大家。

演講PPT下載:大數據時代政府數據資產管理實踐.pdf

責任編輯:lihui