信息技術浪潮推動著我們進入了快速發展和不斷創新的時代,樂觀者說這是一個偉大的時代。然而我們也面臨巨大的挑戰和機遇,無論是"互聯網+"行動,還是"中國制造2025"計劃,乃至于我們要從互聯網大國變為強國,最終實現中國夢的宏偉目標,都要求和驅使著我們要不斷去思考、實踐和創新。

  數據只是客觀世界的記錄,正如涂子沛所說,若要最終為人類所利用,必須要經歷不斷的萃取、提煉和升華的過程,使之成為信息,成為知識。由此產生的工業經濟、互聯網經濟乃至信息經濟,最終都會成為人類所處階段卓越的生產力,這樣說來,數據是資源,一種不同于化石資源的人類社會未來需要依賴的資源,對于這種資源的發掘和應用,將使我們的生活變得更加美好,毋庸置疑的是,我們已經由IT時代進入到DT(數據時代)。

  一、新形勢的要求助推地方政府進入數據時代

  地方政府面臨嚴峻的治理挑戰,肩負著經濟、民生和社會發展重擔,"胸懷"偉大時代的歷史使命,不論發達與否、愿意與否,新形勢的要求助推地方政府進入數據時代。

  地方政府面臨的新形勢可從內、外兩個角度來觀察,地方政府治理的"內因"主要表現為法治政府、透明政府、服務型政府建設的目標和要求,驅使地方政府不斷強化信息技術在政府管理和公共服務中的應用,"用數據說話"已經成為許多地方政府領導的共識和工作習慣,但用"鮮活"的數據去解決問題、預測分析則是地方政府電子政務面臨的共同難題。

  地方政府面臨的"外勢",主要表現為伴隨著信息技術突飛猛進的發展,政府的服務對象發生了深刻的變化,市民年齡、結構和素質的變化,以及對于政府服務內容、服務形式、頻度、服務質量以及個性化等的要求,都使得各級政府部門的傳統服務面臨嚴峻挑戰。這些"外勢"倒逼政府進行改革,電子政務建設也開始從控制為主的IT時代向以互聯網民主為主要特征的DT(數據時代)邁進。

  地方政府是國家治理的基本單元,也是電子政務"條塊結合"的"塊數據"的基本載體和集合。"塊數據"是貴陽市和大數據戰略重點實驗室提出的概念,將一個物理空間或行政區域形成的涉及人、事、物的各類數據的總和稱為塊數據的定義,非常適合地方政府的數據認知和建設思路。"條強橫弱"是地方政府電子政務建設的短板,應用"塊數據"概念,地方政府建立類似于計算機主板的"塊數據"平臺和機制,匯聚條線數據,真正讓地方政府的"塊數據"能夠為推動產業升級、服務改善民生、推進城市轉型和倒逼政府改革做出貢獻。

  二、數據時代地方政府的數據意識

  進入數據時代,地方政府需要積極轉變觀念和意識,應具備以下但不局限于此的意識。

 ?。ㄒ唬祿季S和互聯網思維

  明略數據的吳明輝認為,通過量化的數據解決問題,就是所謂的數據思維。數據思維有個重要的前提就是首先要了解所要解決的問題。地方政府需要轉變意識,用數據思維去解決政務管理和政務服務過程中遇到的問題,由此導致電子政務的建設重心由硬件建設、軟件建設轉變為數據建設。電子政務建設需要向企業信息化和電子商務學習,尤其是對于互聯網思維的理解和靈活運用,互聯網思維中的用戶、簡約、極致、迭代、社會化、平臺、流量以及跨界等理念和觀點,對電子政務建設具有良好的啟發和指導作用。

 ?。ǘ┱諗祿捶?/p>

  在數據時代,對于坐擁海量數據資源的地方政府而言,理應讓政務數據資源發揮更大的作用,產生更大的價值,政務數據即服務是數據時代地方政府所應具有的數據意識。

  政務數據即服務,也為地方政府的服務職能賦予新的內容,服務型政府的理念已經深入人心。在數據時代,將政府掌握的大量數據,在法律允許公開的范疇內向社會和公眾開放,是新型服務型政府建設的重要內容之一。

  分層服務理念是云計算架構的重要特征之一,政務數據即服務也對電子政務架構產生深遠的影響,是電子政務架構設計所應遵循的規則。

 ?。ㄈ┱諗祿馁Y產觀

  數據是數據時代中如同土地、空氣和水資源等一樣的資源,政府掌握了80%的數據,是各類組織中最大的數據源和信息源。政府的治理過程也是數據和信息產生的過程,積累和沉淀下來的數據可以轉變為重要的數據資產。孫傲冰在《政府"大數據資產"的所有權、管理權和開發權》[1]中定義的數據資產是指企業、自然人、國家擁有或者控制的能以價值或有用性來計量或判斷的數據資源的總和,包括各種數據庫系統、文件系統和應用系統等所能管理的所有數據。根據資產的權屬關系,可以分為企業數據資產、個人數據資產和政府數據資產。對于企業和個人的數據資產,應依法予以保護。對于政府數據資產,則明確數據的所有權歸國家所有,管理權可由各級地方政府行使,開發權可適當地進行開放,允許相關電子政務和數據服務企業加入。

  數據資產與實物資產具有相似性,具有確定的生命周期屬性,數據資產具有價值屬性,其價值需要在數據的應用和流通中體現。數據資產的使用同樣需要進行管理和盤活,盤活政府存量數據資產,使之能為政府治理和公眾的信息消費做出貢獻也是地方政府在數據時代的主要任務。

  并非所有的數據都可以變為資產,如企業數據變為資產通常必須滿足以下條件:被企業擁有和控制;能夠作為無形資產,使用無形資產計量規則來計量;能為企業帶來經濟利益。

  將數據變為資產,意味著資產變現與交易的實現,還意味著資產的保值與增值。在數據的使用過程中,要注意數據的安全,還要防止數據的盜用、濫用和數據資產的流失。

 ?。ㄋ模┱諗祿拇髷祿^

  狹義的大數據是指無法使用傳統流程或工具在合理的時間和成本內處理或分析的信息。大數據的產生源于云計算、物聯網和移動互聯網的快速發展,地方政府所能感知到的大數據大多來源于物聯網設備采集的數據和互聯網獲取的數據。地方政府面對大數據的"洶涌而來"之勢,容易迷失方向,感到恐懼,無所適從,或為功利廠商所誤導,產生浮躁,誤以為大數據應用能夠一勞永逸地解決傳統電子政務中的痼疾和頑癥。其實,大數據只是數據積累發展的一個自然階段,是數據思維的延伸和發展,政府部門的大數據應用也大多是信息驅動型大數據應用,它與傳統的統計數據處理的目標是一致的,都是要從數據中提取信息供決策使用,都是面向人腦用戶的大數據應用[2],只不過需要一些新的工具和方法應用進來。因此,地方政府毋需恐懼,也不宜浮躁。

  政務大數據并不適合大決策,大數據的長處是對具體業務進行改進,擅長解決的是小問題而不是大決策,它只對業務管理已經走上正軌的部門有所幫助,對于管理不善的部門無能為力。[2]

  大數據的大容量、多樣性、速度快、真實性以及價值等特征,說明它并不是什么新生事物,而是在面對傳統數據激增到一定規模后,突破傳統處理手段后引發的關于如何對待、處理這類數據的思考、手段和應用。此外,基于管理視角,大數據具有復雜性、決策有用性、高速增長性、價值稀疏性、可重復開采性、功能多樣性等特征[3],也深刻地揭示了政務大數據是數據時代地方政府電子政務建設的必由之路,對于大數據的開發是一種能力,而且是數據時代地方政府必須具備的能力。

  三、地方政府電子政務數據規劃思路的要點

  進入數據時代的地方政府電子政務建設應以數據建設為中心,因地制宜,結合本地區的信息化現狀,制定適合的數據規劃與建設策略。對于多數地方政府而言,傳統政務應用積累和沉淀下來的"小數據"將和新出現的政務大數據在一段時期內長期共存,"用好現有小數據,適應未來大數據,共同建成塊數據"應是地方政府電子政務數據規劃的主要目標。面臨新的形勢,地方政府在進行電子政務數據規劃,乃至于電子政務總體規劃時,還應理解和掌握以下規劃思路上的要點。

 ?。ㄒ唬╇娮诱枕攲釉O計中應有數據治理的內容

  政府治理的最終目標是"善治",需要應用信息技術實現電子治理,而電子治理的基礎是數據治理。數據時代的地方政府,需要積極將政府治理的目標逐步落實到數據治理中。參照企業數據治理的定義,電子政務數據治理可定義為:在政府范圍內,通過對政策、流程、標準、技術和人員的職能協調和定義,將數據作為政府資產管理,從而實現政府主數據的統一化和標準化;實現對政府范圍數據的全面管理;實現對政府數據準確性、一致性、安全性、及時性和可用性等的有效管控;以及實現政府數據的可控增長。電子政務要適應新形勢的發展要求,無論是依法治國理念的貫徹,還是簡政放權的改革,還是大眾創業、萬眾創新的激發,都對地方政府的信息化建設和數據治理提出更高要求。因此,在電子政務頂層設計中必須要有數據治理的規劃和設計內容。

  地方政府的電子政務數據規劃首先應明確地表達政府及部門對數據治理的態度,制訂相應的數據治理參考模型。該參考模型要充分結合組織、業務和技術的要素,從了解數據、清理數據、數據轉換與加工到交付數據,從元數據貫穿全程的運用,到定義業務問題、業務成熟度的評估,從確定治理的實施路線,到數據治理結果的度量,從數據來源及責任的明確、劃分,到數據隱私、風險、安全管理角色的設立,從包括主數據在內的數據了解,到自動化流程的協作機制的建立,既為數據時代的電子政務的建設指明方向,也是地方政府盤活存量數據資產,進而從數據資產中獲取價值的必要途徑。

 ?。ǘ┱諗祿呢熑斡騽澐?/p>

  有別于電子商務和企業信息化,政務數據具有鮮明的責任域特征。在現階段條件下,地方政府的業務仍舊由地方政府政務管理和政務服務兩類事務組成,政務管理以政府傳統內部事務管理為主,政務服務則是以面向公眾提供公共服務為主,政務管理與政務服務相輔相成。[4]

  將數據從政府部門的層級提高到政務管理和政務服務是一個進步。筆者并不認同不加區分的數據一體化,它忽視了政府部門的實情,也忽視了電子政務建設的現狀。政務管理和政務服務兩個責任域的劃分,也是基于數據生命周期的考慮,更加符合互聯網思維的要求。

  劃分后的政務服務領域中數據的權屬關系變得明晰,地方政府公共服務過程中獲取到的個人、企業相關的數據,在正式提交給政府部門之前,數據的屬主仍是個人和企業,只有正式提交給政府部門后,才真正意義上成為政府采集獲取到的數據。如此,將公共服務領域中一直以來困擾服務部門和服務對象的關于數據的權屬和責任的問題就迎刃而解。

  政務管理領域的數據屬于政府部門,其中包含政府部門依法通過物理設備采集到的用于公共服務和公共決策的數據。政府部門具有保護政務管理領域數據合法、合理使用的責任和義務,政務管理領域數據統一歸地方政府而非某個部門所有,這從根本上打破了部門數據壟斷的藩籬。

  政務管理和政務服務領域的數據責任不同,數據應用對象和目標也會有所不同,為進一步配合部門責任清單的梳理工作奠定基礎。數據雖然按照責任域進行了劃分,但數據是活水,通過平臺、流程、接口流動起來,在面向公眾的整體政府建設的過程中,數據橫貫政務服務和政務管理兩個責任域,既能保證政府面向公眾服務的一體化、完整性和高效率,又能兼顧到政府部門職能的差異和責任的分擔。

 ?。ㄈ祿寗酉碌碾娮诱占軜嬓枰獎撔潞桶l展

  傳統電子政務總體架構的設計仍舊以應用、系統平臺作為重點,顯然不適應數據驅動下的電子政務總體架構的設計要求。數據驅動下的電子政務總體架構,需要圍繞數據這個中心,更多地關注數據的生命周期,更應從數據視圖來對待應用的需求和資源的需求。如前所述,在數據時代,地方政府應具有政務數據即服務的數據意識,這種意識也對地方政府的電子政務架構產生深刻影響。數據即服務隱含地包含了云計算架構的要求,間接地對地方政府邁入云計算架構提出了要求。政務數據即服務,也對數據的應用方式提出了要求。電子政務數據也必然要經歷數據集成與理解、數據感知與交互、學習與認知、交易與經濟等階段。如何適應上述階段的發展,同樣也對電子政務的架構提出要求,需要不斷創新和發展。

  數據驅動下的創新地方政府電子政務總體架構應該是依據數據責任域劃分,聚焦政務服務和政務管理兩個領域,應用平臺理念,逐步構建"一體雙核"架構。創新電子政務架構還應該體現在對于數據質量的重視,雖然大數據不關心數據的因果關系,只關注數據的關聯,但數據的真實性不高以及大量的"壞數據"更容易嚴重影響到數據的應用。創新電子政務架構還體現在"小數據"和"大數據"的應用結合上,通過應用多種工具和方法,利用"小數據"的精準性和"大數據"的全面性,為地方政府處理和解決具體問題,可以起到良好的輔助決策作用。有鑒于此,創新的電子政務架構既要滿足傳統"小數據"的采集和應用,也要滿足"大數據"的處理和分析。

 ?。ㄋ模祿卫淼那疤岷椭攸c是元數據管理

  眾所周知,元數據是關于數據的數據,然而在整理或管理元數據時,卻很難將其析構并進行有效管理。Forrester Research將元數據定義為"用于描述數據、內容、業務流程、服務、業務規則以及組織信息系統的支持政策或為其提供上下文的信息",恰如其分地滿足了業務、技術以及管理等不同角色對于元數據的認知,這種方式更加適合對電子政務元數據的理解和認知。地方政府四大庫(人口、法人機構、空間地理和宏觀經濟)和信用庫的建設,依法行政、公共管理和公共服務過程的標準化建設,政務管理和政務服務流程的定義和管理以及政府部門本身具有的政策貫徹、政令通行等,均可反映在廣義的元數據上。元數據既反映了業務的觀點,又代表了技術的特征要求,還體現了操作上的記錄和痕跡。本文對所述元數據的概念外延進行了擴展,元數據、元模型以及"元-元模型"等統稱為元數據。

  數據治理成功的關鍵在于元數據管理,通過元數據管理,可以管理復雜數據集成環境中的變化,交付可信、安全的數據。通過業務利益相關方參與數據治理的元數據管理,可將業務相關的元數據與技術相關的元數據關聯,為地方政府的協作提供統一完整的語義信息,元數據管理的效率直接影響到管控和配置的效率。大數據應用和治理,同樣離不開元數據管理??梢哉f,元數據管理是數據管理的基礎。

 ?。ㄎ澹┯行Ч芸叵碌臄祿蚕砼c開放

  政府的數據開放與信息公開既有區別又有聯系。首先,數據是對客觀世界的測量和記錄,而信息則是加工后的數據。其次,在開放的目的上,政府信息公開的重心在于"知",旨在保障公眾的知情權,提高政府透明度,側重于公開信息的政治和行政意義,信息公開是政府的一種責任;而開放政府數據的重心在于"用"。[5]第三,形式不同,政府信息公開中的內容往往是加工后的、以相對人可閱讀的文件形式存在,而開放的數據則要求是機讀的數據集。政府信息公開和數據開放又是緊密聯系的,推進政府數據開放是政務公開工作的重要組成內容。

  數據共享和業務協同一直是電子政務建設的目標。在政府尚未解決好這些問題的情形下,地方政府面臨數據時代的沖擊。電子政務數據共享和開放首先是在有效的管控下,這也是為了適應新形勢的要求而較為有效的途徑。其次,要在政府部門或電子政務范疇內實現數據共享。第三,在共享基本實現的基礎上,逐步實現數據開放。數據共享和數據開放是電子政務不同發展階段的要務。

 ?。╇娮诱罩械臄祿切枰\營的

  數據驅動下的地方政府電子政務數據是需要長期運營的。數據生產和應用是個長期的過程,既要滿足地方政府短期對于數據價值的需求預期,也要遵循數據從采集到歸檔或廢棄的完整生命周期的"自然"規律,還要不斷地實現數據總量的可控增長。地方政府數據治理成熟度的評估與考量,需要數據運營團隊在數據的應用過程中度量、考核、反饋和改進。數據共享與開放需要數據運營團隊按照實施路線穩步推進。此外,打破部門數據壟斷藩籬、實現數據管控流程自動化、數據安全與隱私保護等,同樣需要數據運營團隊來保障實施。

  四、新形勢下地方政府電子政務數據規劃

  新形勢下地方政府電子政務數據規劃應按照自頂向下的路徑,從"一體雙核"的創新電子政務總體框架出發,闡述數據治理的邏輯架構及組成。

 ?。ㄒ唬I務視角的"一體雙核"架構

  如圖1所示,地方政府整體政府建設主要按照政務管理和政務服務兩個責任域進行規劃和設計,采用"一體雙核"的技術架構。政務服務領域可以充分借鑒互聯網平臺的思路,其支撐平臺主要側重于對多租戶信息空間的支持,政務管理領域則是狹義的電子政務范疇,其支撐平臺主要側重于對數據集成與交換、流程服務、表單配置、移動應用支持等能力的建設。支撐平臺在邏輯結構上是由能力、內核和支持環境等三部分組成。政務服務和政務管理既相互區別,又相互聯系,二者通過支撐平臺連接。圖1揭示了政務管理的業務組成,展現了行政執法和刑事執法兩法銜接的關系,還從資產角度描述了不同權屬數據的關系。本文論述的數據治理更多側重于政務管理領域。

業務視角的"一體雙核"架構

圖1 業務視角的"一體雙核"架構

 ?。ǘ祿卫淼倪壿嫾軜?/p>

  數據驅動下的地方政府數據治理,是地方政府電子政務建設的重要任務,也是數據時代地方政府治理的新內容。地方政府政務管理中數據治理的邏輯組成如圖2所示。

  數據治理架構主要由數據集成、數據處理、數據應用、數據管控及數據運營等部分組成,各組成部分主要由應用或能力單元構成,能力單元是可以復用的應用、經過抽象和提煉的功能,能力單元的宿主是支撐平臺。資源化和能力化是現階段云計算的主要形式和特征,能力適應了云計算的架構特征,也為在具體平臺、技術、數據、系統架構上進行細化描述提供指導。

 ?。ㄈ祿卫砺肪€圖

  與企業治理不同的是,政府治理的目標更加遠大,更有廣度和深度,影響更加深遠。依法治國、依法行政以及透明公開都對地方政府的電子政務及其中的數據治理提出新的更高要求(參見圖3)。

數據治理功能邏輯架構

  圖2 數據治理功能邏輯架構

面向組織的數據治理路線圖

  圖3 面向組織的數據治理路線圖

  如圖3所示,面向組織的數據治理路線圖也體現了PDCA的"螺旋上升,持續演進"的理念,該路線圖由六個步驟組成:

  • 結合地方政府開展的"十三五"信息化規劃以及國家電子政務相關政策,參照企業數據治理流程參考模型,對本地區電子政務中的數據治理現狀進行評估。

  • 在對數據治理現狀進行評估的基礎上,制訂數據治理策略,該策略理應出現在信息化規劃中,建設和實施周期應與信息化規劃相匹配,在數據治理策略中,還應體現電子政務元數據的管理策略。

  • 依據數據治理策略,從組織、人員、技術、流程、規章制度、管理辦法等多個維度,建立適合本級政府使用的數據治理體系;此外,還應包括元數據、主數據、數據質量、安全與隱私等具體工作要求的內容。

  • 與企業信息化不同的是,指標度量和績效考核一直是電子政務的軟肋,政務數據治理度量指標可在參照企業數據度量指標的基礎上,運用裁剪、補充、自定義以及支持工具等方法,逐步建立和完善電子政務的數據治理度量指標。

  • 數據治理過程管理是對電子政務數據生命周期過程進行監控、管理、增值的過程,在該過程中,要確保所制訂的度量指標能夠獲得;其次,數據治理過程管理還應在面向數據應用的前提下,聚焦數據質量和數據安全。

  • 數據治理結果度量,應用預先設置的度量指標,對比獲取到的數據,進行科學評估,為下一輪的數據治理現狀評估提供依據。

  五、地方政府電子政務數據建設方向

  在數據驅動的地方政府"一體雙核"架構中,政務管理領域中的政務應用均需以統一的政務管理支撐平臺為基礎,通過應用功能開發、應用插件改造、遺留系統微服務開發與改造、可復用的應用功能的能力單元改造等方式,完成創新政務應用開發和建設。

  政務數據治理架構,主要是通過數據治理類應用得以實現,其中需要解決好如下核心功能的開發和實現。

 ?。ㄒ唬┱展芾碇纹脚_的作用

 ?、闭展芾碇纹脚_的組成

  政務管理支撐平臺是創新電子政務"一體雙核"架構的重要組成部分,它主要包括支持環境、內核和能力等三部分。其中,支持環境既包含對應用開發、測試、運行以及維護等環境的支持,也包含了對物聯網、互聯網等大數據基礎運行環境的支持,包括大數據基礎運行環境,基于內存計算以及流計算技術框架的引入和支持。內核是基于組件、服務總線、元數據引擎、容器等技術的高可靠性、彈性收縮、具有自恢復能力的核心組件。能力是在內核之上,提供工作流、數據集成、數據交換、業務表單配置以及移動應用支持等政務支撐服務和應用能力的開放、可擴展的政務能力單元的集合。能力單元之間為松耦合關系,同層次的能力單元受相同的能力框架約束,能力框架通常由支撐框架、協議棧、工具集、接口服務以及元數據等組成,此外,能力框架具有自我恢復和彈性伸縮的能力。

 ?、才c數據治理的聯系

  政務管理支撐平臺是政務管理領域的核心支撐平臺,為其上的數據治理提供支撐,其中的數據整合和集成、數據處理等,既是數據治理類應用,也可經過標準化,改造為政務管理支撐平臺中的能力單元,以接口服務的方式供其他政務應用調用。作為數據治理基礎的元數據管理的應用,也可以能力單元的方式供其他能力單元和應用功能調用。元數據管理中的流程自動化和協作機制也是基于工作流能力單元來實現的。由此可見,政務管理支撐平臺對數據治理至為重要。

 ?。ǘ┱諗祿膩碓?/p>

 ?、闭諗祿膩碓?/p>

  政務數據的來源主要由政務基礎信息數據庫、政務管理和政務服務過程中的業務數據庫、政府基于物聯網依法采集的環境數據構成的物聯網數據庫、通過互聯網及移動互聯網依法獲取的行政相對人的行為數據構成的互聯網數據庫等組成。

 ?、不A信息數據庫的建設和完善仍舊是電子政務的主要任務

  基礎信息數據庫既包含以自然人基礎數據庫、法人基礎數據庫、自然資源與空間地理基礎數據庫和宏觀經濟基礎數據庫等組成的基礎數據庫;也包括政務數據資源范疇的如行政權力庫等在內的政務信息資源基礎數據庫;還包括其他的諸如稅收、金融、社會、民生、文化等領域的基礎數據庫。

  與傳統四大庫建設內容不同的是,應更加強調基礎數據庫的建設和完善,既是其作為基礎索引庫存在的必要性;也是逐步弱化數據倉庫和數據集市作為數據建設主要內容的過程,數據倉庫及數據集市將以可選應用服務的方式作為數據治理的應用,而不會以"畢其功于一役"的傳統方式作為政府電子政務的核心任務;還是適應大數據應用和大數據分析的形勢要求??v向來看,基礎信息數據庫的建設和完善同樣包含了庫、平臺和門戶等部分,在數據治理總體框架中,則是由眾多分散的能力單元和應用組成。

 ?。ㄈ┱諗祿募?/p>

 ?、卑髷祿趦鹊恼諗祿?/p>

  從數據整合和集成流程上可分為數據采集、數據清洗、數據轉換和數據加載等步驟。在創新架構中,要求數據的采集、清洗、轉換和加載都應成為能力,能夠對外提供服務。從數據對象、方式上可分為傳統數據集成和物聯網、互聯網數據采集兩大類。從數據形態上,可分為結構化數據集成、半結構化數據集成以及非結構化數據的集成。

 ?、矓祿虾图傻哪芰?/p>

  數據集成的能力主要體現為數據采集、清洗、轉換和加載的能力,數據采集能夠作為連接器連接各種數據源,采集服務具有良好的安全性,能夠隔離、多線程采集,做到互不干擾,有良好的擴展性,支持分布式架構,支持云計算架構上的水平擴展。數據清洗則是對于出現的諸如拼寫錯誤、不合法值、空值、不一致值、重復值以及不遵循引用完整性等的殘缺數據、錯誤數據和重復數據等"臟數據"經過加工、補全、去除、修正等方式"清洗干凈",進入后續的流程。數據轉換是對數據的合并、清理和整合。通過轉換,可以實現不同的源數據在語義上的一致性,和數據清洗最大的區別是,數據轉換并不剔除數據。數據加載是對清洗數據轉換后的數據,按照預先定義好的數據倉庫模型,將數據全量或增量載入事實表和維度表的過程。

 ?。ㄋ模┱諗祿奶幚?/p>

 ?、闭諗祿募庸?/p>

  政務數據處理包含了數據加工、標簽、畫像、多維、聚合等多種方式和操作。數據加工是在清洗后的數據基礎上,為提高數據質量,方便數據的應用,對數據進行加工處理,形成高附加值的增值數據服務的必要步驟。數據標簽是基于業務需求,通過數據分析和挖掘,為分析對象添加一系列可以表達其特征的指標。畫像常指用戶畫像,是大數據常見應用,通過用戶數據標簽的集合來勾勒和刻畫用戶的主要特征。數據多維和聚合是常見OLAP的概念和功能,根據多個維度指標,構建多維的矩陣立方體,分析人員通過基于維度的數據集市快速探索和分析數據。聚合則是根據維度進行數據聚類合并的過程。

 ?、舱諗祿慕粨Q

  政務數據處理的另一個常用功能或主要能力是數據交換,數據共享與交換是電子政務建設過程的主要工作內容。創新電子政務架構賦予數據交換精細化管理的功能,數據交換可分為直接交換和安全交換。對于不敏感可共享的數據,通過原始數據直接交換;對于敏感不可共享的數據,采用數據加密以及數據需求方代碼審核和輸出結果表審核雙重保障等方式,保證提供方數據的可用不可見。

 ?。ㄎ澹┱諗祿墓芸?/p>

 ?、闭諗祿芸氐囊饬x

  政務數據管控是地方政府根據自身職能對數據管控的實踐,也體現了按照數據生命周期進行的數據資產化的重要思路,還是對數據的使用狀況進行監控和管理,確保數據安全的責任承諾和兌現。政府數據共享與開放是有效管控下的共享與開放,數據管控也是數據治理的重要內容。

 ?、舱諗祿芸啬芰M成

  政務數據管控主要由數據的存儲、數據質量、數據運維、數據監控、數據度量以及數據安全等組成。其中:

  • 數據管控既要滿足"小數據"的存儲,也要滿足"大數據"的存儲,既可采用集中式,也可應用分布式存儲,數據存儲更大程度上體現出的是選擇和配置的能力。

  • 數據運維需要和數據運營界定工作范圍,應用標準規范,依托自動化工具,完成日常維護工作,保障數據治理應用的穩定運行。

  • 數據監控是通過構建政務信息單一視圖,并在此基礎上通過事件管理、儀表盤、統計報告以及數據分析與洞察等方式,能夠反映完整信息供應鏈(信息供應鏈是由普華永道分析員提出的適用于企業信息化的概念)上的數據流動和相關組件的運行狀況,確保日常數據生產、加工、使用過程能夠正常運行。信息供應鏈是與傳統的供應鏈(稱為物理供應鏈PSC)平行,以數據報告、合規性檢察、風控以及輔助決策等為目標,突破傳統供應鏈中信息流為物流服務的限制,更加重視供應鏈節點數據的質量和價值,并可基于信息供應鏈優化企業供應鏈的數據驅動的價值鏈研究方法。

  • 數據安全是數據管控的手段,也是數據管控的目標。政務管理中的數據保密、政務服務中的個人隱私數據等都對數據管控的安全體系構建提出要求。

  • 數據質量是用來提高數據的準確性、一致性和完整性,給予大數據質量足夠的關注和重視,不關心大數據質量,誤以為以量取勝、以全取勝,只會降低數據可信度,影響數據分析的結果。數據質量覆蓋完整的信息供應鏈,基于元數據,通過列分析、主鍵分析、外鍵分析、跨域分析、基準分析、數據降噪、置信區間確定以及運用數據規則和指標等,對數據標準化、匹配度、存活力以及價值度進行長期的質量監控。數據質量管理工作機制和流程的建立,質量基線的控制,也是數據質量管理的主要工作內容。

 ?。┱諗祿?/p>

  政務數據應用是在數據處理的基礎上,通過接口服務的調用,實現政務數據的應用和決策分析。從應用范圍角度,包括所有的政務內部應用和面向公眾服務的外部應用;從數據應用的形態看,包括了應用程序和能力單元。數據應用程序又可細分為類SaaS的政務數據應用軟件和獨立的應用程序和功能,將數據應用的部分功能"優化、抽象"為能力單元,以接口服務的方式為其他政務應用、公眾服務平臺提供應用和分析的支持,最終實現應用即服務、分析即服務,體現了政務數據即服務的價值。

 ?。ㄆ撸┱諗祿\營

  政務數據是需要運營的,具體而言,它是為了體現數據的價值而進行的一系列數據推廣、部門和服務對象的協調、開展日常運營活動、運維的保障以及相關績效考核的行為和機制。政務數據的協調側重于政府部門之間的橫向聯系、溝通和保障,政務數據的推廣則面向政府服務部門以及作為服務對象的公眾,依托政府信息公開門戶和服務門戶,并在此基礎上逐步建立本級政府的數據開放門戶,對公眾、社會、企業提供數據服務,實現數據增值。政務數據的績效考核短期主要面向政府內部部門之間的績效考量,遠期則面向整個信息供應鏈和數據價值鏈的所有節點的個人和組織。數據運營也對電子政務工作提出新的要求,逐步改變單純系統建設運維的傳統工作模式,通過對運營團隊、機制、流程的建設,逐步引入社會力量,運用公私合作關系PPP模式,實現數據在政府與社會之間的合理流動,產生新的商業價值。

 ?。ò耍┰獢祿芾?/p>

  數據治理的基礎是元數據管理,元數據貫穿了上述數據操作的所有環節,是數據治理中真正的"影子"成員。參照企業數據治理規劃,電子政務中的元數據通常分為業務元數據、技術元數據和操作元數據等三類。業務元數據主要包括電子政務領域內的業務規則、業務模型、流程定義和術語等,行政權力電子監察中的監察項以及效能績效考評中的指標、權力清單和責任清單項目等均屬于業務元數據的范疇。技術元數據則是用來定義信息供應鏈組成部分的元數據結構,包括各種數據對象、結構、屬性、依賴性以及計算方法和運算規則等。操作元數據則是指應用程序的運行信息及操作的日志等記錄。

  元數據管理同樣遵循自上而下的實施路線,地方政府首先要在數據治理規劃中明確元數據管理策略,建立元數據管理體系結構,應用基于模型驅動(MDA)、遵循公共倉庫元模型(CWM)標準的元數據集成架構,實施元數據管理,完成日常數據監控,度量數據治理成果并進行評估和反饋。

  在整個電子政務框架中,元數據管理是一項重要的能力,它在數據治理中無處不在,又自成體系,從存儲到可視化管理,都具有相應的功能和能力,此外,它也適應了大數據時代的要求。各級地方政府的電子政務建設者需要給予元數據充分的重視,并可從以下方面建設、發展和完善:①了解數據和連接數據;②元數據的存儲和讀取獨立于其他數據,需要由專門的引擎負責執行;③包含政務業務術語及規則在內的業務詞匯庫的建立和管理;④基于CWM的中央共享元數據庫的建立和完善;⑤由業務部門來管理和維護的業務元數據平臺;⑥通過元數據統一管理和維護平臺可對所有的元數據進行瀏覽、管理、維護,并為用戶提供信息供應鏈全程的數據流報告、數據血緣和依賴性分析;⑦提供包括客戶端、接口、服務以及開發包等多種訪問元數據的方法。

 ?。ň牛祿Y源目錄體系的建設

  數據資源目錄是數據共享和開放的基礎,也是基于元數據管理的基礎應用,是數據共享和開放的前提,還是開展數據運營的基礎條件。數據資源目錄的管理對象是政務領域中的數據資源。正如"并非所有的數據都能歸為資產"一樣,數據資源目錄中管理的也并非是數據的全集,而是出于主題應用、決策分析、共享交換、安全管控、數據開放以及其他確定目的而需要管理的數據資源。數據資源目錄體系是用近似于目錄的方式,基于元數據管理提供的能力,對電子政務領域的數據資源按照類似目錄的方式進行管理。與傳統數據資源目錄或政務信息資源目錄管理方式不同的是,創新電子政務架構中的數據資源目錄體系的建立首先要充分借鑒互聯網平臺的經驗,采用"工具+平臺+政策、標準規范+運營"的方式,由運營團隊和業務部門共同構建和管理。平臺需要在目錄內容編目、資源注冊、發布、查詢、資源發現與定位、資源維護以及資源審計和安全管控等方面提供自動化的能力。此外,對于目錄的管理,可支持多種管理維度,引入標簽概念,可為不同的數據資源項"貼上"用于不同目的的標簽,便于歸類和快速檢索,將標簽技術與傳統的層次型目錄結合使用,可實現對數據資源目錄的有效管理。

  結語:

  進入數據時代的地方政府面臨新形勢的挑戰,這些要求伴隨著新概念的宣傳蜂擁而至,強調以數據為中心的數據規劃和建設,并不是說政府治理的中心內容是數據,而應在任何時候都將其僅僅作為治理的手段和依據。此外,這些新概念也是相通的,"互聯網+"最為核心的特征是數據化,數據的共享與開放促進了分享經濟的產生,分享經濟又是信息經濟的重要組成部分。政府為了實現"善治"目標,不斷調整其與社會、市場之間的關系,行政審批改革、透明政府、法治政府和服務型政府的建設是政府為實現目標而進行的自發的改革,電子政務是改革依賴的新型有效載體,在此基礎之上的數據規劃和建設,包括數據生產、應用、共享和開放的數據供給可被看作是供給側改革內容的有效補充。政府信息化正是通過柔性的信息技術、流動的數據之水,沿著經過業務流程重組的流程管道,仿佛血液流經整個剛性上層建筑的機體,使得政府治理更加健康和諧。

    作者:霍小軍、袁飚、舒春燕

  參考文獻:

  [1]孫傲冰.政府"大數據資產"的所有權、管理權和開發權[EB/OL].[2016-09-12].http://sunaobing.baijia.baidu.com/article/286764.

  [2]胡小明.大數據思維形成的兩種視角:信息技術驅動及應用拓展[J].電子政務,2015(12).

  [3]楊善林,周開樂.大數據中的管理問題:基于大數據的資源觀[J].管理科學學報,2015(5).

  [4]霍小軍,周萬順,袁飆.基于政企服務數字空間的區域融合服務模式的研究[J].電子政務,2014(6).

  [5]鄭磊.開放政府數據的價值創造機理:生態系統的視角[J].電子政務,2015(7).作者簡介:霍小軍,男,蘇州工業園區計算機信息中心高級工程師,研究方向:電子政務、云計算、IT治理等。袁飚,男,蘇州工業園區計算機信息中心主任、高級工程師。舒春燕,女,就職于諾基亞網絡蘇州有限公司,研究方向:工業數據獲取與分析、SAP實施和應用、企業數據治理等。

責任編輯:qinpeng