11月23-24日,“2017互聯網+智慧中國年會”在北京萬壽賓館召開。本屆年會以“智繪城市 數造未來”為主題,以數字政府、智慧城市、互聯網+政務服務、數據治理、信息社會等為主要議題。會議由中國社會科學院信息化研究中心、北京國脈互聯信息顧問有限公司聯合主辦,國脈海洋信息發展有限公司、浙江蟠桃會信息技術有限公司協辦,共有來自全國部委/省/市/區縣電子政務、智慧城市、大數據主管領導、行業專家、企業代表、主流媒體千余人參會。
在23日下午舉行的“政務信息系統整合共享與數據資產普查研討會”上,深圳市電子政務資源中心主任武剛以《深圳政務數據資源體系建設及應用探索實踐》為主題進行了演講。
深圳市電子政務資源中心主任武剛
以下是會議現場發言實錄(根據速記和錄音整理,未經本人審核):
今天我跟大家分享一下深圳政務數據資源體系建設及應用探索的實踐經驗。前面幾位嘉賓講的很到位,有國家層面的、理論實踐的,我們深圳的一些做法,可能跟其他地方不太一樣。今天我主要講三個方面。
第一建立政務數據資源體系是國家電子政務建設與發展的關鍵因素。這些大家都有共識了,資源體系建設對電子政務的體系建設方式方法來講,是顛覆性的一種路徑。前幾十年的政務系統的建設,導致的后果大家看得見。面向新的世紀,電子政務發展到一定的階段,政務信息建設是關鍵的因素。
第二介紹深圳市政務數據資源體系建設的一些探索,經過幾年的發展,我們做了一些工作,跟大家分享一下。
第三是體會與思考。
一、建立政務數據資源體系是國家電子政務建設與發展的關鍵因素
首先看一下重要性,習總書記在2016年的10月份講到,“以數據集中和共享為途徑,建設全國一體化的國家大數據中心,推進技術融合、業務融合、數據融合,實現跨層級、跨地域、跨系統、跨部門、跨業務的協同管理和服務?!边@是我們最高領導人關于數據的一些論述,李克強總理提到“要信息多跑路,群眾少跑腿”。作為信息化的部門,如何達到目標,這是我們應該思考的問題。
從國家部委來講,“十三五”也提出了實施國家大數據戰略,推進數據資源開放共享,這是落實國家領導人的一些談話和要求,出臺了很多文件,包括《政務信息資源共享管理暫行辦法》《政務信息系統整合共享實施方案》這些規范化的文件,對全國各地信息化主管部門來說都是實實在在的工作要求。
二、深圳市政務數據資源體系建設的具體實踐
1.存在的問題
?。?)數據煙囪林立
深圳怎么去落實國家的要求和指示?我們想跟大家分享一下。首先我們看一下導致數據資源不能共享,主要問題是什么?經過我們研究、分析發現應用系統太多,經過不完整的調查分析,深圳大概有1000多個應用系統,正是由于這些應用系統的存在,它給數據整合帶來了困難。當然如果沒有這1000多個系統,我們信息化發展也不能到現在這一步,信息化發展也有一個階段,早期是各單位、各部門獨立的開發和建設業務系統。到了今天是按照以數據為中心去云平臺建設我們的業務系統和數據中心。
?。?)數據割裂(入戶辦理程序)
在我們辦理業務中,因為有很多業務系統,我們辦一件事情要跑很多部門,花費很多天時間。例如深圳入戶辦理的程序,時間和天數給申請辦業務的群眾帶來了很多不便,主要還是因為我們的數據沒有跑路,我們的人在跑路,問題非常明顯。
2.出辦法:政務信息資源共享管理辦法
深圳2006年出臺了《深圳市政務信息資源共享管理暫行辦法》,這在全國比較早,以后國家部門做了幾個月的調研,又出臺了國家的一些管理辦法。這個文件是在2015年去掉了暫行,變成了真正的一個辦法,即《深圳市政務信息資源共享管理辦法》,對優化政務信息資源的配置起到了關鍵的作用。
基于對深圳市的調研,補充和完善出臺了《深圳市信息資源管理目錄體系》,深圳市信息共享開展的制度創新、管理創新和服務創新的這種模式,在2015年各部門進行了大膽的探索,創新服務共計617項,深圳市的信息共享工作得到了國家部委的充分肯定,獲得了全國唯一的示范市城市,這是國家給予的高度評價。
3.建平臺:建立數據共享平臺實現數據邏輯集中
那么我們介紹一下我們的做法。在實施當中,我們第一步做了數據的邏輯集中,早期我們叫做共享交換平臺,實際上解決的問題就是數據的邏輯集中問題,它不是一個物理集中數據庫,這是我們在建立數據共享平臺,實現數據邏輯集中的第一項任務。按照共享為原則,不共享為例外原則,建立了深圳市政務信息資源平臺,目錄包括61個市級單位,10個區,共4308類資源,這是共享平臺的數據邏輯集中的一個安排。
數據共享平臺5年變化情況
平臺運行五年來,接入單位數和資源目錄數大概有一個比較,從2013年到2017年,接入的單位數逐年在遞增,資源目錄數也在近五年發生了變化,2017年發生的變化最大。信息指標數增加最多,共享交換平臺,實際上是我們對解決數據的邏輯集中的一個最重要的手段。
?。?)數據融合的思路
關于數據融合的思路我們運用這個模型GLDM:跨部門跨系統跨業務(三跨)的政府通用LDM(邏輯數據模型)如圖所示:
邏輯數據模型
?。?)數據大融合的方法
數據大融合就是為了實現了數據實體集中的問題。如何解決數據的物理集中問題?為什么要做物理集中?其實邏輯集中這個問題沒有解決數據融合問題,邏輯集中無法解決數據融合,所以我們要做一個物理集中平臺,就是基于數據大融合的思路解決數據融合的問題,數據融合實際上核心是需要解決數據跑路的問題。
?。?)數據大融合的框架
有一個叫做跨部門、跨系統、跨業務的政府通用數據邏輯模型,通過對源數據的清理、脫敏、達到提供開放和交易服務的目的。那么清洗數據進入資源總目錄要實現物理集中,就要對源數據進行分幾個步驟處理,包括原子區、集市區、貼源區、整合區、應用區,最后形成應用系統。在這個建立物理集中的時候,我們規劃了對物理數據融合的一個大框架,最底下是我們的電子公共平臺,中間層是數據層,數據層包括主題數據資源和業務數據資源,上面通過數據挖掘、資源共享、比對服務進行操作。
目前來講,我們建立了幾個基礎庫以后,實際上各個部門的需求慢慢產生,因為有了資源,大家就有了想法,有了想法就有了辦法。最終通過數據開放平臺和一些網站,向社會公眾和政府部門提供服務。
4.深圳市公共基礎信息資源庫
那么看到我們具體做了幾個基礎的數據庫,有了大平臺我們的核心還是落在幾個大的數據庫里面,我們建立了基礎信息資源庫,主要是人口、法人和房屋三大類,共計148億條精準數據,人口數據達到了1859萬多,法人數據大概288萬,企業數據大概有不到300萬,房屋數據近83萬, 房間數據1351萬,還有29個部門接入,累計近148億條數據,這是我們基礎數據庫的建設情況。
?。?)人口基礎信息資源庫
我們的人口數據是通過什么方式建立的呢?實際上各部門相關人口的數據融合在一起,不僅僅是簡單的公關數據,我們要實現人口數據大融合,從一個人出生到死亡的相關數據都整合在一起,構造了我們的人口基礎信息庫,使它具有完整性,教育部門、衛計部門、人社部門、出租屋等等這些數據都有,在每一個節點上都有相關的數據,使我們的人口數據成為一個大融合的數據,這是人口數據。
?。?)法人基礎信息資源庫
法人數據也是一樣的,從企業注冊開始,到人員招聘、納稅、注冊幾個階段。因為政府部門對企業也是分段管理,就像治理河流一樣是分段管理,這樣導致數據是分散的,通過法人基礎數據庫的融合,就會形成一個完整企業生命周期的完整數據。市場監管委的基本信息大概有400多萬條,民政局、社團的基本信息有4000多條,企業信用中心的有40000多條。社保局提供的個人信息基本數據,公積金的基本數據還有市場監管委出的股東高管信息,這些信息都是屬于企業法人庫的信息。
?。?)房屋基礎信息資源庫
房屋納稅信息出自稅務局,房屋的融合數據有兩條線,一條線是大樓的起建,包括套數、位置、結構,以及配置的電梯,另外從出租屋是一條線,那么我們就把這兩個數據融合在一起,變成了房屋的基礎信息數據庫。
?。?)綜合監管和公共信用庫
除了三個大庫以外,我們還建立了數據庫,印發了《深圳市綜合監管和公共信用信息資源目錄》及其數據標準。目錄共包括74家信源單位,426項資源信息,其中綜合監管占56項,公共信用占370項。這里面的問題很多,數據的所有權、使用權和公示權在哪些部門有,在法律上沒有規定,例如一個單位處罰了一個駕駛員,處罰以后,駕駛員認為不合適,那個處罰單已經納入到了信息庫里,但是被處罰人到了中院起訴,你的行政過錯處罰有問題,那么在這個過程當中,法院出來調解,調解以后達到的結果是,被處罰人不希望把這個數據放到信用庫里,如果放到了信用庫里,誰有權力把它撤掉?我們實際在操作當中法律上是空白的,在信用體系建設當中,我們面臨的問題非常多,因為法律沒有認可,主管部門為了減少麻煩,在信息的使用當中,尤其是涉及到當事人的時候,這些事情是非常難處理的。
?。?)電子證照數據庫
電子證照庫也是我們在建設當中的一個技術庫,目前已有120個部門進駐了我們證照系統,目前發布34個,增量同步簽發26個,我們要實現全部達到電子簽發,電子簽發以后全面實現歸級。
5.數據標準管理系統
上述我們介紹了幾個主要的政務數據庫的建設,那么在數據庫的建設當中,我們認為數據標準的管理非常重要,必須要進行標準化的處理。
6.數據質量監測系統
還有一個是數據質量的監測,這里面是什么問題?數據質量監測是動態的,只有業主或者用戶們使用你的數據,他才知道你的數據質量是不是有問題,所以要基于這個原因,我們要建一套質量監測的平臺,出現了問題,通過這個平臺報出來,然后去核對,這樣才能使我們的數據進行動態化的優化,這是數據信息監測的重要作用。
7.政府內部數據服務--數據服務支撐平臺
還有一個是數據服務支撐平臺,我們要解決政府內部數據分級服務,安全可控三級等保環境向二級等保環境數據服務,它們不在統一的環境當中,要實現這些系統有障礙,要把收集的數據歸集到二保級環境上,這里面我們做了數據支撐平臺。
8.對社會大眾的數據服務--政務數據開放平臺
還有一個是政務數據開放平臺,解決政府數據有序對社會開放,安全穩定向政府網絡環境開放。
9.基本公共服務配置和供給管理系統
我們有了數據、平臺管理系統,保證了數據的質量,下一步是用數據,實際上用數據是最困難的,以前我們做系統是基于需求來開發系統,但是我們這次做的是基于數據的大歸集,然后向政府其他部門提供服務。
我們通過梳理,大概有十大服務事項和內容可以通過數據為社會提供服務。用大數據平臺,我們可以規劃深圳市小學學費的情況,這是一種應用。還有形成一個主動服務模式,我們查找年滿65周歲老人的信息,然后聯系到當事人,生日當天老人直接會收到郵件。有了數據以后,主動服務就成為了一種可能。還有深圳的社康數量的規劃,由政府規劃社康的布局。
積分入學應用前和應用后的例子,原來一個當事人要跑很多部門,辦理積分入學,現在教育局可以直接辦理,非常簡單。
10.管數據:從主觀的內部協調到客觀的制度保障
從主觀內部協調到客觀的制度保障,我們也做了一些工作,是真實社會建設"有織網工程",為了保障數據質量,出臺了管理辦法,這是制度保障。還有房屋的編碼標準,大家都知道深圳的農民房比較多,實際上每一棟房子都沒有編碼,很多房子都沒有路牌,有大量的標準化工作要做。
三、體會與思考
最后要分享一下關于我們的一些思考,從業務角度我們實現了市級各委辦局數據的大融合,提升了資源中心做為城市融合大數據支撐的能力,基于市公共信息資源庫進行了二次開發應用。從服務的角度來看,我們要將數據應用與安全平衡,我們是數據的歸集平臺,但我們不是使用部門,我們建立了三級等保環境,使用的環境和我們不太一樣,我們要解決使用的問題。
未來的話,大數據平臺還要按照國家的標準和要求進行新的改造升級。對于深圳市大數據的整體發展我們會有未來五年左右的一個發展規劃,包括現有云平臺技術做的相關工作。
由于時間關系,我就分享到這里,謝謝各位。
演講PPT下載:深圳市政務數據資源體系建設及應用探索實踐.pdf