一、 數據資產梳理的重要性
數據資產梳理是數據安全治理和數據安全運營的前提和基礎。
通過對數據資產的梳理,可以確定企業數據資產在系統內部的分布,確定數據資產是如何被訪問的,確定當前的賬號及其授權狀況等。根據數據資產的數據價值和特征,梳理出組織內部的核心數據資產,并對其分類分級,才能真正落實數據安全的精細化管理。
數據資產梳理有效地解決了企業對資產安全狀況摸底及資產管理工作,改善以往傳統方式下企業資產管理和梳理的工作模式,不僅提高工作效率,也保證了資產梳理工作質量。合規合理的梳理方案,能做到對風險預估和異常行為評測,很大程度上避免了核心數據遭受破壞或發生泄露的安全事件。
在數據安全治理實踐中,尤其關注針對敏感數據資產的梳理,這是數據安全體系建設及數據資產管理中的一項基礎性工作。 對數據資產進行及時準確的梳理用以掌握其中敏感資產的分布、數量、權限及使用狀況,是進行后續數據安全治理工作的基礎與先導。
數據資產梳理也是國家法律法規、條例規范,行業數據安全管理辦法,以及數據安全技術標準里明確要求的數據安全管理工作之一。在2022年10月12日頒布,將于2023年5月1日實施的《信息安全技術 關鍵信息基礎設施安全保護要求》GB/T 39204-2022里,在網絡安全等級保護的基礎上對于數據資產識別、梳理提出了更高的要求:
《信息安全技術 關鍵信息基礎設施安全保護要求》GB/T 39204-2022,6.2節,資產識別要求:
● 識別與關鍵業務相關的數據,并建立數據資產清單;
● 能夠識別關鍵業務數據變化,動態更新資產狀態;
● 基于數據資產關鍵級別實施安全保護。
工業和信息化領域有眾多關鍵信息基礎設施運營者,并且大多關系到國計民生甚至涉及國家安全。因此,如何把“關基”保護新國標貫徹執行,其中的關鍵環節就是進行有效的數據資產梳理。
隨著大數據,云計算,工業物聯網等新一代信息技術和工業制造的融合和發展,眾多工業企業都通過互聯網增強企業在設計、生產、制造、運輸、服務等方面的能力,“工業數據孤島”被進一步打破,數據流通和共享趨勢增強。在這種場景下,工業互聯網數據資產梳理面臨著巨大挑戰。
二、 工業互聯網數據的特點
工業互聯網數據形態和種類多樣,“工業”和 “互聯網”屬性兼具。工業互聯網數據是指工業互聯網這一新模式新業態下,在工業互聯網企業開展研發設計、生產制造、經營管理、應用服務等業務同時,圍繞客戶需求、訂單、計劃、研發、設計、工藝、制造、采購、供應、庫存、銷售、交付、售后、運維、報廢或回收等工業生產經營環節和過程,所產生、采集、傳輸、存儲、使用、共享或歸檔的數據。
工業互聯網數據涉及的主體較多,既包括含有研發設計數據、生產制造數據、經營管理數據的工業企業,也包括含有平臺知識機理、數字化模型、工業APP信息的工業互聯網平臺企業,還包括含有工業網絡通信數據、標識解析數據的基礎電信運營企業、標識解析系統建設運營機構等工業互聯網基礎設施運營企業,含有設備實時數據、設備運維數據、集成測試數據的系統集成商和工控廠商,以及含有工業交易數據的數據交易所等。這些不同類型的企業都是工業互聯網數據產生或使用的主體,同時也是工業互聯網數據安全責任主體。
工業互聯網數據同時具備“工業”屬性和“互聯網”屬性,但相比傳統網絡數據,工業互聯網數據還具備以下特性:
1. 多態性
以關系表格式存儲于關系數據庫的結構化數據,如生產控制信息、運營管理數據;以時間序列格式存儲于時序數據庫的結構化數據,如工況狀態、云基礎設施運行信息;以文檔、圖片、視頻格式存儲的半結構化或非結構化數據,如生產監控數據、研發設計數據、外部交互數據。
2. 實時性
工業現場對數據采集、處理、分析等均具有很高的實時性要求。
3. 可靠性
工業互聯網數據十分注重數據質量,在數據采集、傳輸、使用等環節中都要保證數據的真實性、完整性和可靠性,確保工業生產經營安全穩定。
4. 閉環性
工業互聯網數據需要支撐狀態感知、分析、反饋、控制等閉環場景下的動態持續調整和優化。
5. 級聯性
不同工業生產環節的數據間關聯性強,單個環節數據泄露或被篡改,就有可能造成級聯影響。
6. 更具價值屬性
工業互聯網數據更加強調用戶價值驅動和數據本身的可用性,用以提升創新能力和生產經營效率。
7. 更具產權屬性
工業互聯網數據產生于企業實際生產經營過程,數據產權屬性明顯高于個人用戶信息。
8. 更具要素屬性
工業互聯網數據是驅動制造業和數字經 濟高質量發展的重要引擎,具有更強的生產要素作用。
上述工業互聯網數據的特點,決定了工業互聯網數據資產梳理必須是通過主動探測技術實現數據載體檢測,結合被動檢測技術實現工業互聯網數據應用場景,業務屬性識別,通過數據分析、關聯等技術實現多維度的數據資產可視化。
三、 全息數據資產測繪系統
全息數據資產測繪系統是協助企業完成數據資產梳理的技術工具,通過部署實施測繪系統,實現對目標環境中的數據資產梳理,即:完成全面清查、摸排,通過了解數據資產類型、數據資產分布、數據資產權限、數據資產使用等信息,構建數據資產目錄的過程。
全息數據資產測繪系統基于全息專利技術,在數據載體探測,數據資產發現、內容識別,數據分類分級標記產生的大量信息,進行數據分析和關聯,最終實現工業互聯網數據資產的梳理工作:
1. 多數據源數據關聯和分析,驗證數據資產發現,識別
通過數據資產主動探測技術、被動探測技術,以及敏感數據內容識別技術獲取的多方數據源經過處理里后產生的關于數據資產載體信息,數據資產類別級別信息,承載數據處理應用系統信息,用戶訪問信息等,通過大數據分析技術進行數據關聯,相互之間對數據資產屬性進行完善、補充和驗證,最終形成完整、精確的數據資產清單。
2. 以數據為中心的多維度信息關聯和分析,實現對數據處理活動的識別
參與數據處理活動,以及對數據安全產生影響的要素主要包括:實體(用戶和設備),訪問和操作(應用,指令),以及數據本身(歸屬,類別和級別)。
在工業互聯網數據安全場景下,對數據資產進行測繪的主要目的就是摸清對工業互聯網數據的類別級別,數據資產分布,以及識別數據處理環境和數據應用場景,為制定數據安全策略,工業互聯網數據安全風險評估,數據安全合規評估,數據安全事件溯源等奠定基礎。因此,在數據資產測繪過程中需要開發機器學習或行為分析能力,通過行為監控和智能分析提供更高層次的數據處理活動的洞察力,形成以數據安全為中心的資產知識庫(實體知識庫、應用和系統知識庫、數據資產庫),建立數據活動和數據安全基線,完成數據資產測繪。
3. 數據資產可視化分析
根據數據安全場景和數據安全管理需求,動態、實時的從數據安全知識庫中提取相關信息,形成數據資產可視化和數據安全態勢可視化。工業互聯網數據涉及及跨地區、跨行業、跨實體的工業設計、研發、制造、服務,其數據量呈指數級增長,數據資產需要實時監控和維護平臺的運行狀態,數據維護人員需要分析大量的信息,監控工業互聯網運行數據。然而,面對大量的數據資產時,傳統的數據搜索方法難以滿足當前工業互聯網平臺的需求。
全息數據資產測繪系統根據工業互聯網數據的多態性、實時性、關聯性的特征,把數據資產從多個維度,多個視角充分展現,將數據轉換成表格、折線圖、條形圖等形式,以觀察數據資產的趨勢。利用大數據可視化技術,可滿足客戶個性化需求創建可視化圖表,以便對數據資產進行可視化分析。
更多精彩,請關注“官方微信”
國脈,是大數據治理、數字政府、營商環境、數字經濟、政務服務、產業服務等領域的專業提供商。創新提出“軟件+咨詢+數據+平臺+創新業務”五位一體服務模型,擁有營商環境流程再造系統、營商環境督查與考核系統、政策智能服務系統、數據基因、數據母體、產業協作平臺等幾十項軟件產品,長期為中國智慧城市、智慧政府和智慧企業提供專業咨詢規劃和數據服務,運營國脈電子政務網、國脈數字智庫、營商環境智庫等系列行業專業平臺,廣泛服務于發改委、營商環境局、考核辦、大數據局、行政審批局、優化辦等政府客戶和中央企業。