大家下午好,在我曾經工作過的地方跟大家見面了,非常榮幸跟大家一塊交流和學習互聯網立法方面的一些心得和體會。
馬志剛 先生 阿里巴巴集團法務部法務總監
我今天給大家分享的題目是大數據政策法律問題的思考。我們國家大數據政策法律體系不斷建設和完善過程之中,目前已經取得了一些大家共識的卓有成效的成果。但是我們從現狀比較的話,我們和國外還有一些差距,依然需要繼續討論和深入思考。
我統計了十幾個問題,供行業內我們相關工作的同事來一起思考,看看這些方面我們立法怎么進行繼續優化。
第一個是數據脫敏的問題?!毒W安法》第42條對數據脫敏、數據匿名化留有立法余地。這個立法授權,實際上給未來的立法、商業實踐工作提供了廣闊空間。對于數據脫敏問題,行業和第三方機構應該加大協調統合力度,對涉及到個人相關的敏感數據,在流轉流通過程當中,要采取匿名化、去身份化等脫敏措施,確保整個數據使用過程處于安全狀態,即使遭到濫用,對數據主體本人不會產生損害。
第二個是數據的可讀性和互通性的問題。美國等國提出大數據戰略的同時,同時特別關注數據的可讀性和數據互通性的標準化,曾前后發布多個總統行政令,特別強調數據可讀性和標準互通性。在我國,數據格式不一致,或者不同領域、行業的數據格式完全不同,導致這些數據在同一個場景進行應用的時候無法做到互通,這是擺在數據利用者和數據行業面前一個比較嚴峻的問題,嚴重影響了數據質量,導致數據不能發揮應有作用。
第三個,要進行數據清洗,提供數據使用的價值。在大多應用場景中,人們收集的數據是一些混雜的數據,真數據、假數據、真實數據、錯誤數據混雜的情況下,這些數據在進入正式流通渠道之前,不對它清洗,對數據中的重復性要進行消重,數據錯誤信息不進行糾錯,那么數據的價值沒法得到體現。對數據進行清洗,加強數據凈化相關立法,推動相關第三方機構建設,使得一批行業從業人員能夠投身數據清洗工作,為數據提煉貢獻一份力量,讓行業數據真正展現出價值。
第四個問題就是要加快數據追加更新,確保數據真實性可驗證。數據是可流動的,我們生活的世界是流動的世界,動態性是保證物理世界正常運轉必不可少的條件。如果與動態物理世界相影射的數據世界是靜止不動的,那么其中的數據顆粒馬上就會失真。為了保證數據有價值,就需要對其不斷進行追加、不斷進行更新,確保數據源與日俱增、與時同流,在互聯網相關行業應用過程中源源不斷地收取和抓取數據,推動數據庫與物理世界同步成長,讓有價成為數據永葆青春的關鍵魅力。
第五個問題就是數據權益。數據流動過程中涉及到的主體很多,每個主體有不同的角色,擔當各種的職能,有各種各樣的權益,這個權益是動態架構,不是一個靜態的固定模式。如何在這個動態架構下,對相關主體的權益進行合理分配、界定,這是當前一個比較緊迫的問題。美國學界當前正在討論利益平衡機制原則等數據權益分配原則,在此展現出來,看看能否對我們會有一些啟發和思考。美國還強調以用戶為中心的數據治理模式,有學者提出應對OECD數據保護八大原則進行適當調整和改進,部分觀點直指本人同意原則,認為這個原則嚴重過時,限制了大數據時代的數據利用需求,應當進行大的調整;部分觀點主張要用使用場景合理原則來替代用戶同意原則。網安法才剛剛實施,網安法規定的許多重大原則卻面臨著更新和淘汰,充分說明數據發展無止境,數據立法也不會有終點。
當前人們還在熱議數據權屬問題。歐盟有一個判例,歐盟最高法院在判決西班牙岡薩雷斯數據保護機構訴谷歌數據隱私侵權案件中,認定一個數據有兩個權益,也就是說一個數據元素、一個數據集具有兩個權益,一個權益是對人權,另外一個是對世權或者叫對物權,對人權包括數據本人、數據主體合理的權益;對物權是指一個機構、公司、企業以提供服務為目的,對搜集的數據進行加工和處理,因投入成本而產生的權益。同樣一個數據,具有這兩種權益,這兩種權益誰大或者誰小,誰應該服從誰,歐盟法官提出,當發生沖突的時候,對人權優于對物權,例如本人可以對機構提出刪除,也可以可攜,還可以更正等,對本人賦予很多優于機構的權利設計。這種機制對我們也有一些啟發,設計我們數據權屬的時候,我們是不是也可以借鑒歐盟和美國現有的一些成熟做法。
第六個方面,供大家思考的問題是數據管理。因為數據有價,所以要進行管理。世界各國,特別是美國很早提出來對數據全生命周期按照資產進行管理。這個理念很先進,在今天互聯網時代也很合適,行業、企業和政府機構,擁有數據庫的,是不是應當肩負使命,把數據作為資產在全生命周期管理起來。甚至有一些比較激進的學者提出將數據納入資產負債表來進行管理,這種觀念同時提出數據會計計賬模型、數據會計準則等可操作的方法和模型。這種做法和秉承的理念,也對我們是有啟發意義的,至少能夠說明數據是有價值的,至于采取會計方式還是采取其它非會計方式來進行管理,這都可以討論。
第七個方面,我想給大家討論一下數據的使用許可機制,要打造可信的數據流通渠道。數據如果不被許可,數據無法進行流通。數據在使用之前,一定取得數據控制人的使用許可。在這個使用許可上在這個框架里有設定,現在有法律安排、合同安排,互聯網企業,往往會在一個類似于信息政策,對其用戶做出一種用戶本人同意的法律安排。這個安排一旦點進了一個按鈕,我就認為,你對我已經授權了,我可以使用你的數據。所有這些安排,是不是可信,或者靈活動態,都需要進行討論,有些授權機制,本身可能具有壟斷、濫用的嫌疑。數據必須進行流通,如果不流通不能價值,不能追加更新,就變成動態數據。為了變成動態數據,在架構里面流通,架構就是數據架構或者互聯網,要進行數據流通,基礎設施配套,它的價值才能被體現。
第八個方面,數據應該合理使用,切實提高數據利用效率。數據具有壟斷性,數據壟斷可能對其它市場主體產生市場排擠,從而影響市場公平競爭。比如企業掌握了末端數據,有可能會壟斷最后一公里的服務提供,導致其他服務提供商的服務無法觸達末端用戶,不經過末端數據控制人的許可,或者取得末端數據的使用權,其它服務商提供的服務便無法觸達末端用戶。數據被少數人所擁有、所控制,使得同樣的用戶只能接受這個服務提供者提供的服務,不能接受廣泛、普遍的市場主體提供的服務,這其實就是一種市場壟斷,應該得到政策和法律的糾正。糾正的一個主要措施,就是要提倡數據的合理使用、提高它的使用效率。必要時需要引入強制許可制度,規定在特定情形下,申請人提出數據使用的要求是合理的,法律強制數據控制人同意申請人提出的合理要求。
第九個方面,數據使用透明度問題。第九個方面,建議增強數據使用透明度,營造開放透明的數據使用環境。企業要通過各種政策宣示和實際行動,增強其數據使用的透明度,增加用戶對自己數據控制方的信任度。
第十個方面,開展數據風險評估,消彌數據使用環節各種風險和隱患?,F在已有中國信息通信研究院、中國互聯網協會等一批第三方機構,已經依據《網安法》開始進行類似的風險評估和安全檢測,隱私保護工作如雨后春筍蔚然成風,這是新的網安法落地實施所帶來的良好成效,說明我國數據使用環境越來越成熟,對行業、生態發展都提供了正面、可喜的支撐。
最后給大家拋出一個問題,要引入建立雙邊多邊認證機制,推動安全數據跨境流動。數據跨境流動是當前討論最熱的、最廣泛的話題,在這里不多說。國際上看,數據跨境流動主要有三種機制——用戶本人同意模式、控制人擔保模式和雙邊認證模式,世界各國大體上通過這三種模式來安排本國與他國之間的數據跨境合理流動。這些模式為我國處理數據法律問題提供了可資參照的模型和原則,這些命題的提出,對完善我國數據政策法律環境和制度建設,無疑具有較好的參考作用。