摘要:數據開放已經成為政務公開的一項制度安排內容。根據相關要求, 我國將構建統一高效、互聯互通、安全可靠的國家數據資源體系, 推動公共數據資源向社會開放, 建設全國一體化的國家大數據中心, 推進技術融合、業務融合和數據融合;一些部門和地方政府正在積極探索如何整合建設和開放利用政府數據資源, 這些都給政府數據開放管理提出新的挑戰。本研究探討加強政府數據開放管理的必然性和可行性, 根據國內外實踐提出并分析了有待研究解決的數據分類、數據權屬、數據生命周期、數據規范、數據質量、數據利用和數據收費等七個基本問題, 為政府數據開放管理后續研究和工作推進給出一些建議。

  政府數據開放是信息技術、政治和社會發展到一定時期的產物, 它是政府數據資源內部生成、協同共享和外部開放利用的一個管理過程, 旨在促進政府治理和服務能力的提升, 提高公共數據資源的開發利用水平。

  一、政府數據開放的必然性

  加強政府數據開放管理, 不僅是適應互聯網發展新趨勢的要求, 還是全面推進政務公開, 增強互聯網+政務服務能力的重要途徑, 更是打造廉潔政府、創新政府和服務型政府, 激發市場活力和社會創造力的重要抓手。

  (一) 符合互聯網時代發展的大趨勢

  數據資源是互聯網時代最為寶貴的戰略性資源之一?;ヂ摼W基礎設施的快速發展為大數據的產生提供了可能。人類從2012年開始進入大數據時代, 龐大的數據資源使得各個領域開始量化進程, 決策將日益基于數據和分析而做出。我國在1994年接入全球互聯網, 歷經20多年發展, 互聯網已經走進千家萬戶和普通企業。據CNNIC統計數據, 截至2016年6月, 我國網民人數有7.10億, 手機網民規模達6.56億, 網站總數454萬個, 域名總數3 698萬個, 政府網站 (gov.cn結尾) 55 290個。據中國政府網全國政府網站數據庫顯示, 截至2016年12月中旬, 我國政府網站運行總數47391個。網絡環境的完善和手機上網的普及, 人們對政府數據資源獲取的渠道日益便捷。

  互聯網大數據的迅猛發展, 正在創造出巨大的經濟和社會價值。政府數據資源也是互聯網大數據的重要組成部分。目前, 互聯網上的數據每年以50%的速度增長。據IDC預測, 到2020年全球將總共擁有35ZB的數據量。以數據開放、數據流轉、數據挖掘和數據可視化等為基礎發展起來的互聯網信息服務業正在成為規模龐大的新興服務產業。

  在互聯網時代, 管好政府數據, 利用政府開放數據為群眾和企業服務, 是提高政府透明度, 推進“互聯網+政務服務”, 發展政務大數據服務業的重要前提, 可以為產業轉型升級和創新創業提供新的支撐點, 符合時代發展的趨勢。

  (二) 符合政府管理的國際發展動向

  進入21世紀以來, 各國政府高度重視政府數據資源的管理和利用。發達國家在政府數據的開放、管理和利用等方面已經形成一套完善的制度體系, 引領政府管理的新潮流。

  美國、英國等國在政府數據開放和開發方面已形成完備的法律制度, 通過統一的數據開放平臺為公民和企業提供數據服務。美國通過《信息自由法》《電子信息自由法令》《陽光下的政府法》《隱私權法》等來推動和規范政府數據開放。英國2011年推出的《國家數據開放行動方案》、2013年出臺的《開放政府合作伙伴2013—2015英國國家行動方案》都提出要推動開放政府數據。美國政府早在2009年建成統一數據開放平臺, 英國、法國、加拿大、澳大利亞、新西蘭、愛爾蘭、新加坡和韓國等相繼建立政府數據開放網站平臺。2012年, 英國政府成立開發數據研究所, 加快政府開放數據的商業化進程。

  (三) 符合政府建設和政務服務發展預期

  推進政務公開, 建設透明政府既是提升治國理政能力的必然要求, 也是保障公民民主政治權利的基本前提。政府數據開放正是其中一項重要工作。開放政府數據作為互聯網時代政府的新職能, 可以增進施政民意基礎, 提高政府工作透明度, 加強有效監督, 促進社會創新, 提升社會福祉。

  利用“互聯網+”創新提供政務數據服務, 既是加強政府數據管理的必然選擇, 也是公共服務發展的新趨勢?!盎ヂ摼W+”是創新2.0推動下的互聯網發展新形態。河南、重慶、廣東和上海等地都在利用“互聯網+”的理念將政府服務接入互聯網平臺。大數據作為“互聯網+”的內容載體, 是一國之基礎性戰略資源, 對經濟運行、社會生活和政府行政方式具有重要影響。運用政務大數據推動經濟發展、完善社會治理、提升政府服務和監管能力, 深化大數據應用, 推動政府治理能力現代化, 正在成為趨勢。其中之一就是大力推動政府數據開放共享, 促進各類公共數據資源有效整合。

  二、政府數據開放的可行性

  經過近三十年的發展, 我國電子政務運行體系基本建成, 各級政府網站和各類業務系統承載大量的政府數據資源。管理和利用好政府數據對于透明政府建設和政務服務能力提升十分重要。

  電子政務建設積累了豐富的政府數據資源, 開放政府數據成為大勢所趨?!笆濉薄笆晃濉薄笆濉逼陂g國家重點推進的金字工程、重要信息系統和基礎信息庫建設, 已經取得階段性進展。這些基礎信息庫和重要信息化工程, 為政府數據資源的積累打下基礎。為了促進大數據發展, 建設透明政府, 一些地方和部門分別通過政府網站向社會開放數據。如國家林業局對各級林業主管部門的各類數據成果資料、國內外林業信息資源進行整合, 在2016年2月建成中國林業數據開放共享平臺, 免費提供十六大重點數據庫的數據資源, 數據庫的資源數量為58, 889個。國家統計局、中國氣象局以及北京、上海、浙江、武漢、廣州、深圳和青島等地通過建設政府數據開放網站或者專欄, 向公眾提供網站數據服務。

  政府網站管理數據已有一定的積累, 取得較好的開放效果。2015年, 全國第一次政府網站普查活動建立了政府網站基本信息數據庫, 記錄全國各級政府網站的名稱、地址、主管單位、運行狀態等基本信息, 形成準確、完整的政府網站動態檔案庫。該數據庫在中央政府門戶網站開放后, 在兩個月時間里, 搜索量達8萬余次, 下載1.3萬余次, 深受網民和企業的好評。

  一些政府部門也開始與社會合作實現政府數據的社會化再利用, 釋放政府數據的潛在價值。據實地調研, 國務院一些部門通過各級政府網站平臺向部分企業授權開放政府數據, 充分發揮政府網站數據應用價值。一些地方政府通過舉辦各種開放數據應用大賽活動推動政府數據再利用, 為社會公眾生活提供了更多便利。

  我國政府數據資源的開放和管理雖然已取得一定進展, 但與社會和公眾的期望還有一定的距離, 還有一些基本問題有待研究和解決, 如政府開放數據確權、數據源管理、開放流轉利用規則、關聯部門之間協同關系、數據大通道建設和管理、政務大數據的清洗與隱私保護等。研究和分析這些基本問題對于穩步推進政府開放數據管理有重要的現實意義。

  三、政府開放數據面臨的主要問題

  本研究在梳理國際政府數據管理經驗的基礎上, 結合國內部委和地方相關調研, 提出政府數據開放管理的若干重要問題, 并做如下分析。

  (一) 開放數據分類

  在數據分類方面, 電子數據和科學數據的分類已有一些研究成果。政府開放數據分類研究目前比較少見。根據我們的實踐經驗, 政府開放數據的來源可以分為四種類型。一是政府部門在管理和服務過程中獲取、產生和發布的數據, 如公告、公示、留言回復、辦事服務、報告中的數據;二是其他政府部門提供的數據, 如部門或行業后臺信息報送庫;三是與自然環境互動產生的數據, 如氣候氣象、環境監測、科學試驗等;四是與各類信息化系統交換共享的數據, 如國家基礎數據庫、政務共享交換平臺、數據開放平臺、信用信息平臺、政務信息化系統提供的數據。

  單純從網站類數據來看, 政府網站數據又可分為五類:網站行業管理數據、網站用戶行為數據、用戶個體屬性數據、網站系統業務數據和網頁內容數據。一是網站行業管理數據, 包括網站管理基本信息、網站地址導航、網站地圖等;二是網站用戶行為數據, 指用戶訪問政府網站時后臺產生的留痕數據;三是用戶個體屬性數據, 如用戶注冊認證、參與互動活動、咨詢或投訴時提交的各類個人身份信息;四是網站系統業務數據, 是指依靠政府網站承載業務系統或者自然人文環境監測工作而獲取、產生的數據, 有時候包含少部分用戶個體屬性數據;五是網頁內容數據, 主要是網站主管部門和政府相關職能部門通過網站內容管理系統等公開發布或查詢得到的頁面內容數據。這五類網站數據都在不斷增長, 其中, 用戶行為數據呈指數級增長。網站數據類型除了數值、文本、圖片、圖形、語音和視頻, 還有地理位置、實時視頻流等富媒體數據, 開放程度各有不同。

  開放數據是從數據開放的維度對上述各類政府數據重新進行劃分, 二者既有關聯, 也有區別。政府開放數據可能來自網站行業管理數據、信息化系統業務數據, 一旦決定通過政府門戶網站或者政府數據開放平臺對外提供開放數據集, 這類數據就成為網頁內容數據。用戶行為數據和用戶個體屬性數據經過脫敏處理后, 也可以選擇部分群眾急需的有價值的部分內容作為網頁內容數據對外開放。因此說, 網站數據是政府數據管理和數據開放的基礎, 政府開放數據是政府網站數據對外服務的一種形式。

  政府開放數據的分類需要考慮國家安全和隱私保護等法規的要求, 需要依靠深化政務公開來推進。專家認為, 政府數據開放的內容重在“數據”, 重在“機器可讀”的“數據組”, 這是技術層面的考慮?!懊绹鴮φ當祿_放都是通過立法進行限制, 強調數據的開放必須在國家安全、法律執行、個人隱私保護等方面達成平衡”, 遵守《信息自由法》規定的9項信息公開豁免條款, 符合《隱私權法》《電子信息自由法令》《陽光下的政府法》《文書工作削減法案》《電子政府法》《開放政府指令》《信息自由法的備忘錄》《透明和開放的政府備忘錄》等。就政府網站數據而言, 雖然不完全屬于秘密數據, 但也存在一些敏感數據。比如, 用戶個體屬性數據, 存在大量的公民和企業敏感字段, 網站系統業務數據也會包括一些敏感信息。網站敏感數據不是固定的, 它是動態變化的, 在數據生產、加工匯總的不同階段具有不同的敏感度。對于個體信息之類的敏感數據的保護, 目前缺乏相應的制度, 經常成為部門擔心開放數據導致泄密的顧慮緣由, 這在政府開放數據的分類中必須予以關注。

  (二) 數據權屬關系

  2010年, 英國首相卡梅倫正式提出“數據權”概念, 認為數據權是信息社會一項基本的公民權利。數據開放運動的興起, 數據權也進入公眾的視野。

  根據專家的觀點, 數據權基本譜系分為數據主權和數據權利兩大框架。

  “數據主權是指國家享有對其政權管轄地域內的數據生成、傳播、管理、控制、利用和保護的權力。對數據跨國流動的管理和控制是數據主權的重要內容。數據主權包括數據管理權和數據控制權”, 其主要功能是在信息社會鞏固國家主權的地位。歐盟及其成員國在數據方面的立法, 重點是通過加強數據跨國流動的管控, 來保護其數據主權?!皵祿芾頇嘀笇Ρ緡鴶祿膫鞒?、傳入和對數據的生成、處理、傳播、利用、交易、儲存等的管理權, 以及數據領域發生糾紛所享有的司法管轄權。數據控制權, 指主權國家對本國數據采取保護措施, 使本國數據免遭被監視、篡改、偽造、毀損、竊取、泄露等危險的權力, 保障數據的安全性、真實性、完整性和保密性?!睌祿鳈嗖坏赶驀野踩? 而且直接指向公民整體的隱私、財產和人身利益等。

  由于信息是有意義的數據, 知識是可解釋的信息, 數據與知識存在天然的密切關聯, 數據權利與知識產權在權利屬性上比較接近, 數據權利跟知識產權一樣, 是一種兼具人格權和財產權雙重屬性的權利, 但卻與知識產權具體的權利內容迥異。

  數據人格權主要包括數據知情同意權、數據修改權、數據被遺忘權等三大權屬, 主要功能是保障公民隱私空間。2015年12月15日, 歐盟《一般數據保護條例》 (General Data Protection Regulation, 簡稱GDPR) 賦予社會公眾數據可攜帶權、數據被遺忘權和數據知情權。

  數據知情同意權分為數據知情權和數據同意權兩部分, 知情是同意的前提, 同意是知情的“后續”, 知情權是同意權的基礎, 立法上多是通過對數據收集者或控制者課以告知和證明告知的義務, 來保障數據主體的數據知情同意權。數據知情同意權是指服務提供商 (或政府) 在采集或處理個人數據前均須先告知數據主體數據采集的目的、用途、后續變化、處理方式、撤銷方式并征得數據主體同意。從立法趨勢來看, 近年來有消極同意 (沉默或不作為推定為同意) 向積極同意 (明確表示同意) 轉變的趨勢。

  數據修改權和數據被遺忘權, 是指在個人數據因不準確、不完整、滯后等原因可能對個人帶來負面影響時有修改和被遺忘 (刪除) 的權利。數據修改權具體指數據主體享有或授權他人修改其數據的權利, 也就是數據主體有權通過對相對方設定義務, 禁止他人未經其授權而擅自修改其數據, 旨在維護個人數據的準確性、真實性和完整性。網站數據往往不由數據主體掌控, 而由服務商或政府機構管控, 更需要保障數據主體的修改權。但是, 數據控制者和處理者為數據免遭泄密所做的匿名化處理是業內慣例, 不屬于數據主體修改權保護的范圍。

  信息技術已經讓人類喪失遺忘的能力, 被遺忘權應運而生。歐盟早在1995年《數據保護指令》中就規定了被遺忘權。歐盟和美國的專家認為, 被遺忘權包括傳統遺忘權和刪除權, 傳統遺忘權是針對服務商收集使用個人被動共享公開的數據, 保證個人擁有將某些公開數據 (如搜索引擎、門戶網站記錄、電商網站記錄) 完全刪除的權利;刪除權針對用戶自己公開表達傳播的內容, 保障個人擁有刪除個體自己傳播的數據的權利, 數據主體可以有效控制他們的個人數據。

  數據財產權是與知識產權、物權、債權等并列的一項財產權, 不需要比照物權下的所有權的占有、使用、收益、處分等四項權能配置其權利內容, 不等同于所有權。數據財產權主要包括數據采集權、數據可攜權、數據使用權和數據收益權, 其功能是促進數據資源合理高效利用。

  數據采集權是數據主體有權同意或禁止對其數據進行采集的權利, 旨在規范服務商、運營商、政府等初始采集者的數據收集活動, 防止數據“寡頭”的出現。

  數據可攜權是指數據主體有權要求掌握其數據的相對方協助其將個人數據在不同系統或設備等載體之間進行遷移、保存, 符合“權利帶來便利”的邏輯。

  數據使用權是指數據主體, 哪怕沒有直接控制或占有自己數據, 也有使用其數據的權利, 借此“對沖”數據寡頭所帶來的負外部性。

  數據資產并非公共資源或公共資產, 屬于增量財產, 能帶來財產性收益, 凡是將非自有的數據用于商業目的, 都應當支付“對價”給數據財產權主體, 而不能無償使用。數據收益權是指數據主體基于其數據獲得收益的權利。

  美國的政府數據資源不受著作權保護, 英國政府擁有政府數據資源的著作權?!睹绹鳈喾ā返?05條規定, “該法規定的著作權不適用于任何美國政府的作品, 但不禁止美國政府獲取和持有通過授權、購買或其他方式轉讓給它的著作權”。英國《1988年著作權、設計和專利法》規定:“政府文件受皇家著作權或議會著作權保護, 或作為法案、行動受到保護?!庇J為, 政府信息資源的生產和來源都依賴于人民的納稅, 而從政府信息資源的開發、利用中獲得大量經濟利益的是少數人。在法律層面上, 我國政府數據資源并沒有明確的權屬人。

  我國政府數據權屬關系也需要在數據主權和數據權利兩方面分別構建不同的框架。數據主權需要考慮數據管理權和數據控制權, 數據權利需要考慮數據人格權和財產權。2016年6月的《民法總則 (草案) 》第一百零八條提出權利人依法就數據信息享有知識產權權利, 已將數據財產權與知識產權并列。2016年11月通過的《網絡安全法》在數據權利方面做出許多明確的規定, 如網絡運營者不得泄露、篡改、毀損其收集的個人信息;個人發現網絡運營者違反法律、行政法規的規定或者雙方的約定收集、使用其個人信息的, 有權要求網絡運營者刪除其個人信息;“任何個人和組織不得竊取或者以其他非法方式獲取個人信息, 不得非法出售或者非法向他人提供個人信息”。政府數據權屬關系如何界定還有待深入研究。

  (三) 生命周期管理

  政府數據管理的生命周期分為六個階段:數據生成和發布、權限配置管理、網上流轉、數據呈現、利用管理和更新管理。以網站數據為例, 不同類型網站數據管理的目的各不相同。網頁內容數據管理重在實現頁面內容的準確性、一致性、持續性和時效性等;網站用戶行為數據管理重在規范行為數據的采集、存儲、利用和傳播等;用戶個體屬性數據管理突出Cookies的使用規則、隱私權政策、未成年人的隱私信息保護、網站經營者責任;網站系統業務數據管理重點放在數據的生成、存儲、共享、交換、開放、使用和保護等;網站行業管理數據的管理要體現數據的權威性、時效性和便捷性等。

  數據采集是政府數據生成的原始步驟。政府數據共同的來源渠道有政務公開數據、公眾互動數據和用戶行為數據等, 部分來自部門之間數據共享交換、現場采集或數據上報, 共同的特點就是隨政府部門公共職能而產生, 具有行業業務特性。不同渠道采集數據可以實現數據的比對, 確保數據全面和準確, 但也可能導致數據之間存在沖突或不一致, 需要依據行政職能和數據質量進行數據處理。采集后經過處理的數據要展現到網站上讓民眾知道和下載還需要進行數據發布。數據發布, 無論是自動發布還是人工發布, 都要遵循相應的管理流程。

  數據權限配置管理包括部門權限配置管理和崗位權限配置管理, 崗位權限配置管理包括政府數據的產生、比對校驗、調取審計、安全保密、敏感信息審核和審核審批等進行崗位職責和權限的界定。

  政府數據的網上流轉主要涉及數據產生過程、處理過程、比對校驗過程、審核過程、數據流轉方式以及數據留痕管理。流轉方式有多種, 包括線下環境流轉到網站系統、業務系統數據流轉到網站系統、網站系統數據流轉到業務系統、政府部門網站之間的數據流轉。

  數據呈現需要突出實用性、權威性、人性化、個性化和集成性, 提供良好的用戶體驗。不同格式種類的數據需要用不同的方式來呈現, 數據呈現方式關系到用戶體驗和數據使用效果。

  政府數據的利用包括內部利用、外部利用、決策利用和利用評價等四種方式。只有做好數據的利用管理, 才能提升電子政務系統的整體績效。內部數據利用包括直接利用、授權利用、交換利用等方式, 重在做好權限管理、接口管理和安全保密管理。外部利用主要指社會公眾、企業法人和其他社會組織和個人對政府公開數據 (也包括依申請公開的數據) 的利用, 需要體現合法性和公開性的原則, 是政府數據資源充分發揮價值的關鍵所在。外部利用以免費利用為主, 面向社會營利機構、研究機構提供的整理或再加工的數據, 可以實施收費利用。決策利用主要指向領導層提供決策所需數據的利用。利用評價是指用戶對數據利用的反饋, 包括數據利用效果評價、數據利用建議等。

  政府數據有時效性和生命期限, 需要不斷更新清理。過期失效的網站數據應該及時清理更新, 或者標示過期失效提示, 對歷史數據進行歸檔存儲, 繼續提供服務。

  (四) 數據標準規范

  數據標準規范是數據管理和利用的基礎。不同部門對數據業務管理的要求不同, 主要體現在不同的數據采集口徑、轉換和加工規范;對數據的技術管理因開發商的不同也有差異, 主要體現在數據的格式、字段、載體的隨意性。

  數據標準規范就是要對各類數據 (主要是元數據和交換數據) 進行規范化定義和統一解釋, 實現業務部門、技術機構對政府數據資源的統一理解和規劃, 增進數據的一致性, 減少數據格式轉換, 規避信息支離破碎, 促進政府數據的信息集成和高效共享, 提供高質量的數據服務。

  在國外, 完善的數據標準管理是政府數據開放成功的關鍵。美國政府數據開放門戶網站data.gov問世前, 超過2萬家政府網站提供格式各異的數據格式, 用戶搜尋信息、處理信息的難度很高, data.gov按照統一的數據規范來整合各級政府部門、公共機構的開放數據, 通過統一元數據格式及元數據地圖對外提供集中的數據服務, 提升政府數據的社會使用效率。美國政府網站數據的標準管理, 主要解決兩個方面的問題:一是定義政府網站的標準元數據目錄, 消除數據歧義;二是統一數據交換標準, 整合各部門發布的數據資源, 保證數據暢通。

  (五) 數據質量管理

  數據質量管理要保證數據的真實性、一致性和時效性。

  數據真實性是指在網站上發布的數據必須是客觀的、真實的, 沒有人為干擾的數據。受各種歷史原因和現實條件的制約, 開放的政府數據不可避免地會有一些失真、“難看”, 甚至是無意的修飾, 真偽難辨, 產生各種偏差。國外開放數據管理是通過采用優化統計方法、監控數據質量等方式提升數據質量。

  數據一致性包括兩個方面:一是同一份分散在不同地方的數據, 或經過簡單轉化后的數據之間是否一致;二是在業務上有關聯的數據之間的邏輯關系是否正確和完整。國外政府網站一般提供一個統一的平臺, 由政府統一管理、統一發布, 所以結果是一致的。提高數據一致性, 一是可以按數據類型統一數據發布部門、發布口徑, 規范一致性管理, 確保一數一源;二是各部門內部進行數據一致性分析與梳理, 保證符合業務邏輯關系;三是部門之間要分析關聯關系與業務規則, 將不一致數據發送回相關部門進行修復;四是在技術上, 建立統一的數據采集和共享發布平臺。

  數據時效性就是依靠發布和更新規則及時公開信息, 拓展信息傳播和推送渠道。國外政府數據開放網站分別制定了各類數據發布、更新標準, 公布數據發布日程以及修改說明等。

  (六) 數據利用管理

  發達國家普遍建立了政府數據集中管理和整合利用的模式。以滿足用戶數據需求為核心, 通過多種途徑整合前后臺資源, 在中央政府和地方政府間, 努力實現跨區域、跨平臺的數據服務, 并以集中的方式提供給用戶。

  美國不僅重視政府數據資源的管理和開放, 還重視數據資源再利用。美國聯邦政府鼓勵盡量多地向公眾開放有價值的政府數據資源, 鼓勵社會公眾和私營部門進行開發。美國將政府數據資源再利用分為公益開發和商業開發, 允許和鼓勵個人或私營機構對政府原始數據資源進行商業再開發并出售。私營部門擁有公共信息的使用權, 及其研究成果的專利權。美國政府部門負責規范數據開發競爭機制, 只能從事公益性的信息服務, 營利性的開發以私營部門為主。

  英國政府主要采用“貿易基金模式”、“公—私競爭模式”、鼓勵公眾參與、“許可證框架”等方式來管理和促進政府數據的社會化利用?!百Q易基金模式”就是將一些政府數據機構, 如地震局、測繪局、氣象局等, 改為“半自立”的政府基金機構, 讓它們在半商業化的基礎上提供商業性的信息服務, 依據與財政部簽署的協議向社會用戶收費, 也可通過授權信息的再利用進行收費?!肮礁偁幠J健? 即政府部門不僅能夠支持私營部門從事政府數據的市場化開發, 而且可以與私營部門展開競爭。公私部門之間的競爭形式具體包括伙伴關系、民營化和合同外包。鼓勵公眾參與, 就是以互聯網為主要參與渠道, 設立互動論壇, 組織有獎競賽活動, 收集并評估公眾需求, 鼓勵獻言獻策, 促進政府數據利用?!霸S可證框架”包括三個不同的許可證 (見表1) :一是“開放政府許可證”, 授權不論是商業性目的還是非商業性目的的政府信息的免費使用;二是“非商業性政府許可證”, 授權出于非商業性目的的政府信息免費使用;三是“收費許可證”, 授權收費的政府信息使用。

image.png

表1 英國政府許可證對比信息

  我國在政府數據利用方面急需統一的政策。政府開放數據在頂層設計、利用流程管理、資產化管理、數據依申請公開、共享與保密等方面需要建立相應的政策法規體系, 進行前瞻性戰略布局;盡快建立并推廣統一的政府數據共享開放平臺, 大力增進行業與行業之間、地區與地區之間、上級與下級之間對彼此的數據資源的了解和掌握。讓那些有強烈數據需求的部門, 可以借助數據共享交換平臺快速確定數據的提供者和獲取渠道方式, 同時, 配備專責單位來協調提供相應的技術服務, 規范數據的表達和接口。

  (七) 數據收費利用

  我國政府數據的社會化利用在是否收費、如何收費方面沒有明確規定。我們在調研中發現, 很多部門有向社會開放數據、提供服務的積極意愿, 政府數據的價值與增值潛力受到空前重視, 公眾和企業對政府數據的供給充滿期待。

  國際上, 對政府數據社會化利用有明確的收費規定。通行的做法是把信息作為資產進行管理。歐盟國家主要以通過向增值開發用戶收取信息使用費的形式來收回數據采集、加工和整理過程中耗費的管理成本。歐盟2003年的《政府信息資源再利用指令》規定, 數據利用的收費原則上應僅限于個人利用請求的邊際成本 (復制、提供和傳播成本) ;收費不得超過生產和傳播數據的成本, 同時考慮合理的投資回報, 鼓勵政府機構降低收費或者不收費;當收到數據利用請求時, 應讓申請人知曉收費的計算方式;應提前制定并公布收費標準和數據利用的條件, 如果拒絕某項數據利用的請求, 必須解釋原因并提供幫助信息;如果政府部門利用其持有的信息提供增值信息服務, 并與私營部門數據利用者進行競爭, 那么政府部門也應付費。美國政府規定, 即便是高價值的數據, 仍盡量保持免費提供的方式, 如果收費, 不得高于信息的傳播成本。

  英國政府除了提供公益性的數據服務, 還進行營利性的數據資源開發, 收取“合理的投資回報”。英國政府法規規定對公開信息的加工和再利用需求可以收取一定的費用。英國政府對數據資源社會化利用的收費原則是在生產和傳播成本之外, 還可收取一定合理的投資回報。政府部門除了從事公益性、非營利的信息服務, 還可開展營利性的商業信息服務, 與私營部門展開公私競爭。如英國氣象局增值開發的特殊天氣預報服務通過收費電話和短信來收費。英國的《政府信息資源規定》將收費分為三種情況:一是大部分情況下, 收取信息生產、發布、傳播的邊際成本;二是當政府部門工作人員需要收入來覆蓋大量信息成本時, 可收取信息收集、生產、復制的傳播直接和間接成本, 此外, 還可收取一定合理的投資回報;三是圖書館、檔案館和博物館, 可收取信息收集、生產、復制、傳播和保存的直接成本和間接成本, 此外還可收取版權清理費、一定合理的投資回報。

  從實際運作來看, 我國政府數據社會化利用, 存在多種不同形式的間接收費。數據間接成本包括大量的數據采集、清洗、加工、整合、整理、展現。目前, 收費的重點是一些增值服務、海量數據的提供。調研表明, 我國未來可以收費的政府數據類型可分為如下五類。

  1. 需加工處理才能滿足需求的數據。

  需對原始數據進行篩選、加工處理或需經過其他加工、運維、軟件部署、升級更新工作提取數據的需求。如相關單位要求將政府數據及其相關軟件打包部署到自己的獨立網絡環境中, 實現本地化部署、數據管理軟件升級、數據更新等。如果對此進行收費利用的話, 收費主體可以由軟件系統或政府數據的運維方, 主要針對數據的運營成本進行收費。

  2. 需提供調用接口才能滿足需求的數據。

  這類數據類型復雜、實時性強, 需要提供數據調用接口, 進行二次開發。如某些部門在原始數據之上提供的二次開發接口, 以及相應的應用說明和代碼示例, 用戶據此可以輕松調取政府數據資源。這類需求的收費主體包括兩部分:一是提供數據資源的數據主管部門, 主要針對數據的運維成本進行收費;二是提供二次開發服務或資源接口的服務商, 主要針對數據再利用方面進行收費。

  3. 需跨單位調取整合才能提供的數據。

  數據需求本身橫跨多個部門, 需要經過復雜的調取處理流程, 采集來自不同部門、不同業務、不同區域、不同系統的數據, 進行整合后, 才能滿足用戶提出的數據需求。比如, 交通運輸部門春運黃金周期間的全國人口遷徙量、出行距離特征、熱點城市、熱點出行路線、熱點客運樞紐等方面的數據需求。這類數據需求的收費主體可以參考英國的管理模式, 設立專門的機構或委托給相關支撐單位, 按照與政府部門簽署的協議, 以及規定的收費標準, 進行半商業化運營, 提供數據供給服務。

  4. 數據量龐大的原始數據。

  這類海量原始數據, 有視頻流數據、環境監測數據、海量統計數據等。這類數據需求的收費主體可以參考上述的管理模式, 由專門的機構或相關支撐單位進行半商業化運營, 負責提供數據支撐服務。

  5. 時間跨度較大的歷史數據。

  這類數據時間久遠, 并未完全數字化, 要恢復提供需要耗費不少人力物力。這類數據需求的收費主體可以參考上述的管理模式, 由專門的機構進行半商業化運營, 負責提供數據支撐服務。

  圍繞數據收費, 需要同步建立政府數據管理機制。具體是制定收費原則, 建立收費清單, 明確收費標準, 確定收費職責。對于研究機構或從事公益性使用的用戶, 可以免費或低價開放使用。對于個人或者商業機構的數據需求, 制定合理的統一收費標準, 費用主要包括信息收集、生產、復制、傳播的直接和間接成本。其中, 涉及承擔社會公共責任的商業機構予以低價優惠, 費用不得高于傳播成本。針對不同的數據存儲介質收取不同的費用。存儲介質一般分為電子版數據和紙質版數據兩種。

  四、進一步討論

  數據是互聯網時代各級政府的“血液”, 起著潤物無聲、貫通內外的作用。就信息化發展變化趨勢而言, 以應用系統和技術平臺建設為重點將向數據開放利用為重點轉變。政府數據這座“金山”一直在沉睡, 有必要在政務公開和“互聯網+”的大潮中被喚醒, 與社會數據一道承擔起新的歷史使命, 推動經濟社會轉型發展。除了加大對以上主要問題的研究, 還需要在如下四個方面開展工作。

  (一) 開展全國政府數據資源普查, 摸清家底

  盡快在全國范圍內開展政府數據資源普查, 摸清數據家底, 為政府數據利用和開放提供決策支撐。

  對已有的數據進行梳理標注, 建立數據資源底賬。數據資源底賬包括元數據、數據溯源信息、數據管理信息等。數據梳理按照地區和條線劃分層級, 逐步做到條線和層級的全覆蓋。對于某一層級缺失的數據資源要找出缺失原因, 并盡快補足。在此基礎上, 制定網站數據開放目錄和數據采集更新標準。

  同步開展社會公眾在工作生活中的公共數據需求調查, 提出數據需求清單。按照優先推動民生保障、優先做好公共服務的原則, 依托政府網站公開一批社會普遍關注、公眾普遍依賴的政府數據, 讓公眾共享政府網站數據管理和利用的成果。

  (二) 啟動開放數據管理利用綜合試點, 積累經驗

  選擇一批有基礎、有條件的單位, 啟動綜合試點。開放數據利用是一項全新的工作, 迫切需要積累經驗, 創新發展, 少走彎路, 避免走傳統電子政務發展的老路。數據分類、敏感數據、元數據、利用開放、質量控制、生命周期管理、數據收費、考核評估、數據接口、技術平臺和PPP等方面的工作, 都需要總結、探索?,F有的成功案例需要提煉形成操作指引, 供其他部門參考。

  圍繞數據采集、交換、開放和保護等關鍵環節, 啟動管理規范制定的試點。定義標準數據, 防止各級各類政府數據開放平臺由于標準缺失造成管理混亂, 同時, 統一政府數據交換標準, 避免交互不暢。統一定義政府基礎數據, 形成統一的元數據字典, 每個數據項、指標都有明確定義;“統一數據邏輯, 每個數據和指標的計算邏輯都有明確的規定, 統一計算公式和計算口徑;統一數據基本字段的編碼, 對數據、指標進行統一編碼”;統一數據授權管理框架, 合理配置數據的使用, 保證數據合理合法訪問和使用。

  在“互聯網+政務服務”實踐中, 試點推進政府網站數據整合利用。建立網站數據與電子政務系統數據和其他數據之間的雙向流動機制, 形成統一的政府數據管理平臺, 發揮政府網站數據集聚、規范和“血庫”作用。從內容、技術、管理方面加強數據整合, 以中國政府網綜合數據門戶為龍頭, 依托區域、條線的數據中心, 形成若干個綜合政府數據中心, 實現全國政府數據的邏輯互聯、整合利用和集中服務, 為國家大數據中心的建設提供內容支撐。

  (三) 開展開放數據管理頂層設計研究, 制度入軌

  政府數據管理利用要實踐好“創新、協調、綠色、開放、共享”的發展理念, 就需要做好頂層設計, 主動融入深化改革、發展經濟、改善民生、建設透明政府的工作體系中, 統籌規劃發展, 推動相關制度規范的出臺, 加強數據應用。政府數據管理利用, 離不開制度的保障, 需要分階段、分步驟地制定并實施。

  盡快推動出臺數據管理方面的法規。綜合考慮數據采集、加工和利用等環節, 從數據定位、數據權屬、數據質量、運行維護等方面對數據管理做出明確規定, 引導各級政府做實開放數據內容, 完善數據管理手段, 擴大影響力, 規范管理。

  加強開放數據應用研究和推廣。提高“互聯網+政務服務”能力, 現已成為簡政放權、放管結合、優化服務的關鍵環節。充分利用政府開放大數據, 探索應用創新, 加大數據挖掘力度, 共享“互聯網+政務服務”發展成果。

  (四) 建立政府數據資源管理體制, 理順機制

  建立中央和地方兩級數據管理體制。理順政府數據資源管理部門間的協同管理和上下級指導管理, 實現數據管理工作全國“一盤棋”。完善政府數據資源管理和相關職能部門的職責, 既要填補工作空白, 又要減少工作交叉或重疊, 避免出現條線之間、政府層級之間的權責沖突, 厘清責任, 依規管理。

  明確領導體系和責任主體。確定分管領導, 明確工作機構, 配備專職人員或指定兼職人員。建立工作機構與支撐機構之間的協調機制。數據管理作為政務公開的內容之一, 納入政府績效考核體系, 保證一定的權重比率。

  作者:鮑靜 張勇進 董占廣

責任編輯:qinpeng