“新石油”開發(fā)記⑤:隱私計算,離改變“游戲規(guī)則”還差耐心與時間
21世紀經(jīng)濟報道記者尤為廣州報道
編者按:已然來臨的數(shù)字時代,數(shù)據(jù)是核心驅(qū)動要素。圍繞數(shù)據(jù)的開發(fā)利用,一場新的生產(chǎn)與認知革命正在展開。想要了解這個時代,必須要先認識數(shù)據(jù)。南方財經(jīng)全媒體·21世紀經(jīng)濟報道策劃了數(shù)據(jù)要素市場系列報道,以期為行業(yè)和社會公眾提供理解數(shù)據(jù)的敲門磚。
兩位富翁相遇,都覺得自己比對方有錢,有沒有辦法不說出自己的真實身價,卻能比出個高下?
這是首位獲得圖靈獎的華人科學家、中國科學院院士姚期智在40年前提出的著名的“百萬富翁”問題。如今,這個問題已被隱私計算解決。
對于與上述問題存在相似困境、正在興起的數(shù)據(jù)資產(chǎn)與數(shù)字市場來說,隱私計算的意義可以用“顛覆性”來形容。因為它解決了數(shù)據(jù)交易中一個最為核心的、曾經(jīng)似乎無法兩全的問題——既想使用數(shù)據(jù)、結果,又要保護數(shù)據(jù)中包含的隱私。
在隱私技術的蓬勃發(fā)展之下,隱私與數(shù)據(jù)流動這對“魚與熊掌”如今可以兼得了。
更完整的稱謂應該是“隱私保護計算”
何為隱私計算?在中國信通院云計算與大數(shù)據(jù)研究所和隱私計算聯(lián)盟聯(lián)合發(fā)布的《隱私計算應用研究報告(2022年)》中,隱私計算的定義為在保證數(shù)據(jù)提供方不泄露原始數(shù)據(jù)的前提下,對數(shù)據(jù)進行分析計算,保障了數(shù)據(jù)在產(chǎn)生、存儲、計算、應用、銷毀等各個環(huán)節(jié)的“可用不可見”,有效提取數(shù)據(jù)要素價值的一類信息技術。
外行人乍一聽隱私計算,覺得像是拿隱私來做計算,會認為這是一項偏負面的技術。實際上,數(shù)牘科技高級總監(jiān)李宗勇向21世紀經(jīng)濟報道強調(diào):“隱私計算更完整的稱呼是‘隱私保護計算’(或隱私增強計算),可在保護隱私的同時對數(shù)據(jù)進行計算。”
“可用不可見”又該如何理解?華控清交戰(zhàn)略總監(jiān)、標準化負責人王云河舉例解釋,如果所有數(shù)據(jù)加上一個常數(shù)后再交易,機器將看不到原始數(shù)據(jù),但這是“不可見”嗎?“我覺得遠遠不夠。因為對于稍有點推測能力的機器而言,很容易推導出原始數(shù)據(jù)。”他強調(diào),從本質(zhì)上來講,“不可見”是指在密碼學上的保密性或機密性達到足夠強度,推導不出原始數(shù)據(jù)。“可用”則相較容易理解,指能夠計算并輸出正確的結果,也就是對數(shù)據(jù)使用方有價值的結果。
解決數(shù)據(jù)交易的核心問題:各方互不信任
數(shù)據(jù)已與土地、資本、勞動力、技術并列成為生產(chǎn)要素,被譽為數(shù)字經(jīng)濟時代的“石油”。培育數(shù)據(jù)要素市場、釋放數(shù)據(jù)更多的價值的前提是實現(xiàn)數(shù)據(jù)大規(guī)模社會化流通,但在實際操作的過程中仍面臨許多難題。?
數(shù)據(jù)作為表征現(xiàn)實世界人和客觀事物的性質(zhì)、狀態(tài)等特征的抽象符號,承載著隱私信息;雖然有的企業(yè)數(shù)據(jù)不具備人格化特征,不能被稱之為隱私,但仍負載著商業(yè)信息,屬于商業(yè)秘密。不可避免的,數(shù)據(jù)的流通和交易會涉及個人隱私或企業(yè)商業(yè)秘密的安全問題。
數(shù)據(jù)在計算機和互聯(lián)網(wǎng)環(huán)境中以二進制的形式存在,這種數(shù)字化形態(tài)對數(shù)據(jù)流通過程的數(shù)據(jù)隱私保護形成了主要阻礙。數(shù)據(jù)提供方一旦將原始數(shù)據(jù)交予數(shù)據(jù)使用方,將無法有效管控后者對數(shù)據(jù)的使用、傳播或買賣等行為,相當于喪失數(shù)據(jù)所有權和控制權,使得數(shù)據(jù)的價格、可出售次數(shù)大打折扣。
多位專家對21世紀經(jīng)濟報道記者表示,這里的核心問題是“信任問題”。
數(shù)據(jù)流通的理想狀態(tài)是“我足夠信任你,相信你不會作惡,而你用完數(shù)據(jù)后會妥善保管或銷毀數(shù)據(jù)。”李宗勇強調(diào),而現(xiàn)實中數(shù)據(jù)在大規(guī)模社會化流通中,由于參與方大多相互并不熟知,互不信任,因此需要用技術去建立參與各方之間的信任基礎,“與業(yè)務無關、相對中立的隱私計算技術就承擔了這一角色。”
他還強調(diào),“跨網(wǎng)跨域數(shù)據(jù)在流通中僅有安全若沒有實現(xiàn)數(shù)據(jù)的價值,那也是沒有意義的。隱私計算保證的就是跨網(wǎng)跨域數(shù)據(jù)在流通融合過程中的隱私安全問題。”
華控清交戰(zhàn)略高級總監(jiān)劉崢也認為,目前來看,基于密碼學的隱私計算能夠解決在“不相信人”的情況下,讓數(shù)據(jù)規(guī)模化的流通、融合、應用,是一個“非常好的解決方案”。
數(shù)據(jù)交易2.0時代——有價值的不是原始數(shù)據(jù)而是計算價值
數(shù)據(jù)來源于用戶,可平臺又對數(shù)據(jù)進行了加工,那加工后的數(shù)據(jù)權屬到底歸用戶還是平臺?其中還涉及到哪些權利?權益該如何分配?這些問題一直懸而未定,制約著數(shù)據(jù)要素市場的發(fā)展。
隨著隱私計算逐漸進入商業(yè)化落地的階段,業(yè)內(nèi)稱數(shù)字交易進入2.0時代——“數(shù)據(jù)不再以原始數(shù)據(jù)本身進行流通和交易,而是以反映業(yè)務價值的數(shù)據(jù)融合計算結果來進行流通和交易。這意味著,數(shù)據(jù)交易的標的從數(shù)據(jù)直觀可見的信息價值轉(zhuǎn)變?yōu)槿诤嫌嬎銉r值,即多方數(shù)據(jù)通過算法,結合算力進行運算,最后得出計算結果,實現(xiàn)特定業(yè)務價值。”李宗勇解釋。
平安集團首席科學家肖京認為,在傳統(tǒng)的數(shù)據(jù)交易中,數(shù)據(jù)交給第三方很容易被復制篡改,導致所有權受到損害。而在隱私計算的支持下,第三方無法獲取原始數(shù)據(jù)。交易標的從信息價值轉(zhuǎn)變?yōu)橛嬎銉r值,“這就相當于把數(shù)據(jù)的所有權和使用權分開了。”
談到隱私計算在數(shù)據(jù)交易中發(fā)揮作用的環(huán)節(jié),李宗勇表示,隱私計算主要在數(shù)據(jù)流通和融合的環(huán)節(jié)發(fā)揮作用,是支撐業(yè)務實現(xiàn)的技術底座。劉崢進一步解釋,“在流通、融合之前需要對數(shù)據(jù)進行分類分級,凡是涉及個人隱私或商業(yè)秘密的數(shù)據(jù),都需要經(jīng)過隱私計算技術的處理。”
“隱私計算是支撐數(shù)據(jù)交易的核心技術,也是數(shù)據(jù)服務市場的底層基礎設施。”肖京強調(diào)。
隱私計算離真正落地還需要時間
目前,業(yè)界主流的隱私計算技術主要分為三類:第一類是以多方安全計算為代表的基于密碼學的隱私計算技術——姚期智為解答“百萬富翁”問題研發(fā)出多方安全計算,可在無可信第三方的情況下,多個參與方共同計算一個目標函數(shù),且保證每一方僅獲取自己的計算結果,無法通過計算過程中交互數(shù)據(jù)推測出其他任意一方的輸入數(shù)據(jù)。
第二類是以聯(lián)邦學習為代表的人工智能與隱私保護技術融合衍生的技術——可實現(xiàn)在本地原始數(shù)據(jù)不出庫的情況下,通過對中間加密數(shù)據(jù)的流通與處理來完成多方聯(lián)合的機器學習訓練。
第三類是以可信執(zhí)行環(huán)境為代表的基于可信硬件的隱私計算技術——通過軟硬件***在中央處理器中構建一個安全區(qū)域,保證其內(nèi)部加載的程序和數(shù)據(jù)在機密性和完整性上得到保護。
那隱私計算到底是如何保護隱私的呢?肖京舉例進行了講解,比如為了實現(xiàn)兩方數(shù)據(jù)相加測算總額,但同時不泄露任何一方的數(shù)據(jù),可以將每方的數(shù)據(jù)分拆后加密(比如100可拆分成70+30,對70進行加密),只傳分拆加密后的部分數(shù)據(jù)給對方,然后在不解密的情況下,使用隱私計算技術,各自方將對方傳來的、加密的部分數(shù)據(jù)和自己未傳出的、加密的部分數(shù)據(jù)相加,得到各自的部分和之后,再傳到第三方中控服務器,相加得到最后的總和。這樣就在數(shù)據(jù)不出本地、保證不泄露的情況下,實現(xiàn)了相加測算。
2022年1月,國務院辦公廳印發(fā)的《要素市場化配置綜合改革試點總體方案》中提出,要探索“原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見”的交易范式。
無論是從政策支持還是業(yè)界期待來說,隱私計算可謂前景光明,但它能在短時間內(nèi)撬動數(shù)據(jù)要素市場嗎?
“這還需要一個過程。”王云河表示,目前隱私計算在本領域和信息安全圈相對火爆,但還未“出圈”。數(shù)據(jù)交易涉及領域、行業(yè)眾多,隱私計算還需要更多圈層的認知和接受;另外,從“知道到真的敢落地使用,也還有一定的距離”。他強調(diào),這牽涉到政策對隱私計算的態(tài)度以及監(jiān)管對數(shù)據(jù)流通交易相關紅線劃定的問題。
除了外部因素,隱私計算自身也存在短板。從上述實例可以看出來,隱私計算技術的算法設計嚴謹、流程復雜,需要經(jīng)過大量的加解密過程,這些都是“很耗算力的”。肖京表示,僅聯(lián)邦學習建模時的單次模式迭代耗時就成指數(shù)級增長,“如果不解決算力問題的話,數(shù)據(jù)交易的市場規(guī)模也會受到限制。”他強調(diào)。?