2017年12月3日-5日,第四屆世界互聯網大會將在浙江烏鎮舉行。本屆大會以“發展數字經濟,促進開放共享——攜手共建網絡空間命運共同體”為主題,邀請來自政府、國際組織、企業、技術群社和民間團體的互聯網領軍人物與會,圍繞數字經濟、前沿技術、互聯網與社會、網絡空間治理和交流合作等五個方面進行積極的交流與探討。

第四屆互聯網大會

作為世界互聯網大會前奏,由國家互聯網信息辦公室、科學技術部、工業和信息化部、浙江省人民政府共同主辦的第四屆世界互聯網大會“互聯網之光博覽會”于12月2日率先拉開帷幕,包含BAT在內的眾多一線互聯網科技公司和創業創新企業齊聚參展。繼去年作為“互聯網+”領域代表首次亮相烏鎮,今年,國脈再次受邀,就國脈數據基因、國脈數據智能門戶系統(DIPS)等成果進行展覽展示。

烏鎮互聯網國際會展中心

烏鎮互聯網國際會展中心

在2日上午舉行的創新發布會上,受大會主辦方、舟山市人民政府推薦,國脈集團總經理鄭愛軍發表《數據基因與政務大數據服務知識圖譜》演講,為嘉賓和代表們介紹數據基因,并與眾多國內外嘉賓一起,思考和探討知識圖譜在促進政府智能化服務方面的創新應用。

國脈集團總經理鄭愛軍

國脈集團總經理鄭愛軍

以下內容為現場發言要點:

一、知識圖譜重構思維方式、重塑聯系力量

知識圖譜,是一張由知識點相互連接而成的語義網絡,是基于圖的數據結構,由節點(概念或實體)和邊(關系)組成,是關系最有效的表達方式,是大數據智能的前沿研究問題。

大數據時代已經到來,數據正在重塑當今時代的資源觀,大數據是基于鏈接和關系層面,更精準地反映、認識、掌握世界,而知識圖譜是大數據語義鏈接的基石(語義:數據的含義,只有被賦予含義的數據才能夠被使用),將重構我們的思維方式、是重塑聯系的力量。

以“政府”為例:由“政府”可以聯想到“政務→電子政務→互聯網+政務服務→浙江省‘最多跑一次’→數據基因”、“電子政務→國脈電子政務網→數據智能門戶系統(DIPS)”,還能聯想到“‘看得見的手’→亞當·斯密→《國富論》→經濟→政治→政府”等等。通過知識圖譜,對數據進行連接,有助于我們發現隱藏在數據連接背后的“故事”、甚至創造“故事”,進一步釋放數據價值、提升數據資產管理能級。

二、知識圖譜的發展階段與主要特征

知識圖譜的發展可歸結為三個階段:①引文分析階段,主要特征是連接、關系、評價,核心作用是關聯性、前瞻性、客觀性、準確性;②結構圖視階段,特征是結構、圖表、標簽、推理,核心作用是系統性、邏輯性、直觀性、科學性;③智能決策階段,發展特征是數據活化、智能化、自流程化、融合化,核心作用是全面性、融合性、抽象性、創造性。

三、知識圖譜促進了政府智能化服務應用

近年來,知識圖譜已在多個行業有所應用,包括政務領域:①政務信息服務方面,政府網站語義搜索、人機智能問答系統提供政策咨詢、投訴建議等交互服務;②政務知識庫構建,比如國家安監總局的“政府垂直行業知識庫”、科技部知識庫等;③AI(人工智能)+政務層面,知識圖譜是AI核心基礎能力;④公安部門案情調查、情報分析;⑤司法部門事理圖譜、輔助判案;⑥政府部門專題分析和決策研究、輿情監控等。

其中,浙江省“最多跑一次”數據串梳理項目就應用到了知識圖譜,并簡單介紹了浙江是如何利用知識圖譜對事項串、數據項等進行關聯,目前浙江省26家省級單位前100項高頻事項關聯的材料已有1451項,這些材料涉及很多的申報表、證照、證明、批文等,以及各種各樣的自行填寫、外部分享、內部分享、數源單位確認,而所有事項的確認、來源、關聯都是通過國脈數據基因普查系統進行的。

四、數據基因,基于知識圖譜構建數據治理能力

國脈數據基因,是基于知識圖譜構建數據治理能力的一個重要平臺、系統、工具,是數據管家、數據治理專家,已榮獲多項軟件著作權,是國脈十二年咨詢的產品化,由國脈集團下屬國脈海洋信息發展有限公司數據基因研發基地開發而成,具有多版本,包括政務類、通用類、教學類、平臺工具類、行業應用類、標準化類等。

其中政務類數據基因,是國脈目前擁有最多最廣泛應用案例的產品系列,包括十大核心產品:①數據資產登記(普查)管理系統(管資產);②政務信息資源采集系統(管數量);③信息資源編目管理系統(管目錄);④數據體系標準化管理系統(管標準);⑤公共數據元(主數據)池和標簽管理系統(管基因);⑥數據分析加工管理系統(數據清洗比對入庫)(管質量);⑦數據治理與評估系統(管治理);⑧政務信息系統整合決策支撐工具(管整合);⑨數據供需對接與認責管理平臺(管共享);⑩政務服務事項(最多跑一次)支撐管理平臺(管業務)。涵蓋了從數據采集、加工、清洗比對、入庫、應用等數據服務生命周期。

數據基因知識圖譜在政務方面的應用案例:第一個是海南省政務采集云項目,在基礎目錄分類過程中,對基礎類、主題類、部門類等大類下屬的各種類、項、目、細目組合用知識圖譜的概念進行了關聯, 比如針對一個市民,通過數據基因能關聯到20多個相關部門和200多個要素,又如一個部門(工信廳等)下面的系統、數據庫、數據表、數據字段都要進行關聯;第二個是數據智能門戶系統(DIPS),其基于數據基因開發,是站群集約化管理平臺,可直觀展現DIPS系統知識圖譜以及行業知識圖譜。

五、基于數據基因提供政務大數據服務

以政務數據基因為核心,國脈提供數十項政務大數據服務,主要包括以下幾部分:①數據大腦:提供基于數據的頂層設計,由大數據架構支撐;②“兩手抓”:一手抓方案(數據咨詢),包括數據體系設計、數據治理流程設計、大數據(產業、園區、企業等)規劃、第三方數據評估;一手抓軟件(數據產品),包括數據基因系列產品、數據智能門戶系統(DIPS)、數據治系統/工具等;③兩“腳”支撐:一個是平臺支撐,基于大數據資產管理平臺,提供基礎、主題、部門、標簽、綜合庫等核心數據池建設;一個是管理支撐,在大數據管理方面提供標準化建設、安全制度規范、政策/課題/研究等保障體系建設。

國脈在政務服務領域積累了豐富經驗,對數據本質的理解、對政府業務的把脈、對技術落地的執行,未來將繼續在大數據全口徑、全流程、全活化、全精準、全可視方面進行推進,在知識圖譜、智能關聯、數據理解等方面做進一步突破。

責任編輯:lihui