也許你已經習以為常,早上出門上班,手機告訴你到單位需要多長時間;也許你已經司空見慣,新聞客戶端的頭條都是你關心的話題;也許你已經不足為奇,各家電商向你推介準備入手消費品的打折信息;也許你已經見怪不怪,通訊軟件將多年杳無音信的同桌推薦給你。可是!你并沒有告訴手機,我的單位在哪,我想看哪些新聞,我需要哪些消費品,誰曾經是那個同桌的她。這就是大數據!短短幾年時間里,我們自覺或不自覺、自愿或不自愿地產生著大數據,同時也被大數據所環繞、籠罩和支配。大數據顛覆了我們的生活方式,也對國家安全產生了巨大影響,國家秘密更是首當其沖。大數據模糊了密與非密的界限,打破了傳統的定密習慣,改變了情報搜集的方式,也給反竊密防泄密提出更大的挑戰。
大數據時代對保密范圍和方式的挑戰
隨著傳感網和物聯網的快速發展,人、機、物三元世界高度融合引發數據規模幾何式增長和數據模式極度多樣化,網絡化的大數據時代已悄然來到我們身邊。大數據時代對于保密工作的直接挑戰是,一些重要信息可保性急劇下降,關系國家安全的關鍵性數據亟須納入保密管控。
日本3?11地震期間,***先向公眾宣稱放射程度沒有那么危險,核輻射處于控制之中;隨后,核反應堆墻體被沖垮,在冒著滾滾濃煙的畫面下,***欲蓋彌彰仍稱情況在不斷好轉。大數據時代,這種行為只能稱之為作死,日本各地成千上萬人自發上傳蓋革(Geiger)計數器(用于測量放射性污染程度)數據,通過Pachube平臺對外發布,***和東京電力公司的“人設”瞬間崩塌。在一個可以有效感知并能分享信息的世界中,將數據算法運用到大數據上,就不難對部分***希望保密的事項進行推斷和預測,這顯然是對傳統***壟斷重要信息的巨大挑戰。舍恩伯格等在《大數據時代》中舉例,美國勞工統計局每個月統計、公布消費價格指數(CPI),花費巨大且結果滯后。兩位麻省理工學院經濟學家通過軟件在互聯網上每天收集50萬種商品價格信息,通過大數據分析,就能比官方提前兩個月發現通貨緊縮的趨勢。
對數據進行有選擇性地屏蔽是***控制信息的傳統***,大數據時代此法可能不再奏效。以“谷歌街景”作為類比來看,谷歌公司的圖像采集車在很多國家采集了道路和房屋的圖像以及大量備受爭議的數據,德國民眾強烈***這一行為,認為這些圖片會幫助黑幫竊賊選擇有利可圖的目標。在巨大壓力下,谷歌公司將一些房屋或花園的影像模糊化,但這種模糊化卻起到了此地無銀三百兩的反作用。與之類似,如果***試圖屏蔽某些大數據庫里的數據,則有可能引起相反的效果。
大數據格局下,要求***重新審視需要保守的國家秘密范圍,對于已不具有可保性的,及時從范圍中剝離出去;對一些通過大數據分析有可能被準確預測,且確實關系國家安全的信息,要研究如何切斷數據獲取、分析和預測的途徑,而不僅僅是將國家秘密信息放在保險柜中。
大數據背景下,過去沒有引起足夠重視的一些數據,對國家安全的重大影響逐步顯現。比如,過去我們對人種基因的安全重視不夠,隨著醫療大數據、基因大數據的快速發展,已直接關系國家存亡甚至種族延續;對壟斷性電商銷售數據的長時間匯總、分析,就有可能直接掌握各地區經濟發展態勢、居民購買力等重要信息。
此外,大數據將對涉密人員管理產生巨大影響。我們的通話、電子郵件、即時通訊信息等被加上時間印戳備份在通訊公司、軟件公司的服務器中;我們在電商處買東西的偏好和支付能力被詳細統計分析;我們的即時行蹤被手機廠商完全掌握;甚至我們的音容笑貌都被各大街角和商場的攝像頭實時捕捉并存儲在網絡上。可以說,每個人在大數據面前都是***,當然也包括涉密人員,這就有可能對國家安全產生間接威脅。帕特里克?塔克爾在《***裸的未來》中舉例,2010年,美國羅切斯特大學研究員亞當?薩迪雷克組織了一項研究,如果鎖定的目標關掉GPS,且不再發布含有地理定位的信息,能否對其準確定位?他們通過搜集目標朋友或親屬公開的推特信息,利用其中帶有的定位標簽,大數據分析預測目標的行蹤準確率高達47%。2011年,薩迪雷克和研究員約翰?克魯姆又組織了一項研究,他們雇傭了數百個受試者,讓其隨身攜帶追蹤器。經對受試者及相關人員超過6年的監測,可以通過大數據分析,在80個禮拜或更久前預測受試者所在的位置,準確率高達80%。
可以想見,未來的保密已不僅僅是信息的保密,構成信息的基礎數據的保密將會同等重要。這要求我們不僅僅考慮信息的保密,還要考慮在大數據分析條件下,哪些數據可能推測出相關信息。必要時,要通盤考慮對數據的保密管理要求和技術防范措施。
總體國家安全觀提出的國家安全體系,使得國家安全的外延得到進一步延伸。國家安全的概念不僅包括傳統上的政治、軍事、領土等國家生存安全的領域,還逐步擴大到包括文化、社會、科技等多個國家發展安全的領域;不僅包括傳統安全領域,還包括非傳統安全領域。在涉及國家發展安全方面,如經濟安全、生態安全等,一定程度上依托于大數據安全;在非傳統安全領域,如糧食安全、文化和意識形態安全、網絡與信息安全等,都涉及或者包含大量的相關行業、部門、區域的大數據信息,而掌握這些信息,并由此進行梳理、整合、分析,可以得到更有價值涉及國家安全的重要信息或者重要結論、判斷。比如,我們對糧食安全的判斷,可以基于耕地數據、氣候數據、農業技術數據以及農產品市場數據、主要產糧國家經濟政治數據等予以推斷;我們對金融安全的判斷,可以基于信息化背景下金融系統大數據的分析和研判。因此,大數據在一定程度上直接決定了很多國家安全領域重要信息的安全與否。
當前,世界主要國家在數據***上的博弈日趨激烈,發達國家相繼推出“數據治國”戰略并制定發展規劃以贏得先機。對此,我們必須未雨綢繆、防患未然,在總體國家安全觀的指引下,認真分析對國家安全可能造成重要影響的大數據安全,并有針對性地采取保護措施。
大數據時代的泄密風險
隨著時代的發展,保密管理經歷了針對紙質文件資料的“三鐵一器時代”、針對電子文件資料的“涉密信息系統管控時代”。這些方式之所以有效,在于找到了紙質和電子文件資料泄露的風險點。大數據時代,泄密風險發生了質的變化,需要有針對性地研究。
過去,國家重要信息的擁有者和發布者主要是國家。大數據時代,信息的跨國流動已成為現實,***不再是信息的唯一擁有者和權威發布者。全世界單獨的個體被調動起來形成巨大的合力,足以打破***對信息的控制。比如,在馬航MH370失聯事件發生后,美國數字地球公司通過Tomnod軟件應用平臺,提供其所匯集的失聯區域數據和高分辨率衛星圖像,邀請來自世界各地的科技志愿者搜索失聯航班的任何跡象。該平臺共動員了全球800萬志愿者尋找失聯航班,提供各類信息。不難預見,這種動員能力如果用于針對獲取某個特定國家的國家秘密和重要情報,后果是不可想象的。據報道,美國數字地球公司最賺錢的業務,就是為美國情報界提供相關服務。該公司曾經在上述軟件應用平臺推出了一個名為“搜索挑戰”的項目,要求志愿者利用其發布的高分辨率衛星圖像,幫助搜索上千平方公里內的軍事飛行器和車輛。值得玩味的是,這個搜索項目的目的并沒有公布。
從大數據發展態勢來看,即將到來的世界是人、機、物融合的三元世界,機中有人、人中有機,物中有機、機中有物的世界已逐步走近我們。隨著人、機、物的相互融合,對不同領域的大數據進行跨領域、集成式研究,就有可能推測和判斷國家重要信息。比如,針對某涉密科研院所,通過對研究人員在互聯網及數據庫中的搜索記錄進行分析,可能了解研究課題的主要方面甚至遇到的瓶頸問題;對該院所最近一段時間購買儀器設備記錄進行分析,可能推斷正在進行的課題研究方向甚至進展程度;對該院所研究人員、管理人員的電子郵件進行分析,可能發現有關項目的協作配套等信息;從該院所公開的外部人員來訪報道進行分析,可能推測出項目委托方情況;如果可以幸運地侵入該院所實驗設備構成的物聯網中,獲得產生的實驗數據,據此判斷項目進展情況就顯得更加輕而易舉了。也許單一來源的信息可能不會暴露國家秘密或重要情報,但如果像上述分析一樣,可以將某個事件、某個人或者某群體的很多行為,從不同的獨立角度聚集在一起時,信息就有可能被泄露,因為有關這個事件、這個人或者這個群體的數據已經足夠多。傳統以信息為主要形態的國家秘密或重要情報,在大數據時代發生質的改變。它們不僅簡單地以文件、圖片、資料的形式存在,還可以通過直接或者間接有關的大數據,經過細致的分析、推理和判斷,描繪出其細致輪廓,甚至分毫不差。
此外,部分大數據自身就是重要的戰略資源。比如,媒體頻繁披露的境外機構、人員在我境內實施非法測繪活動,其目的就是獲取我國家基礎地理信息數據;再如,媒體曾報道美籍華人薛峰實施非法竊密活動的主要目標就是我油氣資源數據。其他譬如氣象數據、基因數據等,也是境外非法獲取的重點目標。
近年來,境外非法獲取國家秘密和重要情報的方式日趨多樣,大數據分析重要性顯著上升。《參考消息》2014年11月24日報道,據美國情報系統的研究,所有情報中有90%來自公開渠道,只有10%是通過秘密管道獲取。顯然,大數據分析功不可沒。
觀察各種復雜系統得到的大數據,直接呈現出來的往往是一個個孤立的數據和分散的鏈接,但這些反映相互關系的數據和鏈接整合起來就是一個網絡。大數據往往以數據和鏈接背后復雜的關系網絡予以存在。大數據分析給竊取國家秘密和重要情報提供了重要依循,通過對數據背后的網絡進行查找、分析和挖掘,基于相互關系分析基礎上進行預測即可獲得或者推斷有關信息。此外,對于已經獲得的國家秘密和重要情報,還可以通過大數據分析的方式,印證信息的準確與否。比如,對于一些重大涉密會議、活動安排,可以通過組織人員、已知參加人員的即時通訊記錄、電子郵件記錄數據,有關機場、火車站的調度安排、警衛情況數據,賓客下榻***客房、餐飲準備數據等大概分析出會議、活動參加人員、行程、議題等內容,而不必一定拿到會議、活動安排方案。再比如,對于一些涉密的軍隊調動情況,通過相關地區的攝像頭監控網絡數據、有關機場或火車站的調度數據、有關軍隊飲食供應站情況數據,如果再增加一些沿途網民上傳的照片、消息等數據,將會準確掌握軍隊調度的路線、規模甚至目的等重要信息。
大數據分析不同于傳統的邏輯推理研究,而是通過將海量碎片化的數據匯聚到一起,積少成多,再進行統計性的搜索、比較、聚類、分類等分析歸納,在碎片化的數據之間建立某種整體聯系,就有可能挖掘出隱藏在大數據背后的重要信息。因此,大數據分析具備了從大量不敏感信息中發現國家秘密和重要情報的能力,日益成為境外情報機關搜集信息不可或缺的重要渠道。
美國國家安全局長期對全球通信系統和互聯網進行大數據采集、挖掘和分析,從中搜集他國國家秘密和重要情報信息。斯諾登曝光的美國國家安全局實施的棱鏡計劃(PRISM),顯示出美國情報機關較早便采用大數據分析方式獲取情報,甚至可以說美國情報機關具有瘋狂獲取大數據的特殊癖好。棱鏡計劃監視范圍很廣,參與的公司包括微軟、雅虎、Google、Facebook、Paltalk、YouTube、Skype、美國在線、蘋果公司等;采集的數據范圍很廣,包括日志數據、社交網絡數據、過程行為數據、傳感網絡數據、智能終端數據等,可以監控包括電子郵件、即時消息、視頻、照片、存儲數據、語音聊天、文件傳輸、視頻會議、登錄時間和社交網絡資料等信息。
臺灣地區情報機關也在強化運用大數據分析方式獲取大陸情報。2015年,媒體曝光了臺“國安局”建構了運用大數據概念的“輿情監控系統”對大陸搜集情報,可同時搜集超過200個網站、1000個網頁,并對海量網絡數據進行自動分析、存取。據《環球時報》報道,早在2007年,臺灣地區情報機關已對我***和軍隊以及國防科研機構、軍工企業網絡實施大規模的網絡攻擊行動,受攻擊單位遍及我絕大部分省、自治區、直轄市,還包括我十幾個駐外機構。臺灣地區網絡間諜李芳榮案中被控制的電腦和網絡達數百個,竊密內容涉及政治、軍事、外交、經濟、醫療衛生等多個領域。不難看出,此類網絡攻擊的動機就是竊取目標用戶的海量數據,作為大數據分析竊密的基礎。
大數據時代的風險防范
***總書記強調,要切實保障國家數據安全。要加強關鍵信息基礎設施安全保護,強化國家關鍵數據資源保護能力,增強數據安全預警和溯源能力。要加強政策、監管、法律的統籌協調,加快法規制度建設。大數據時代的到來,必將推動保密管理又一次產生新的革命性變革,直接對保密的方式、要求和標準產生質的影響。對大數據時代的泄密風險防范,我們必須進行深入研究,切實采取有效措施以應對這一重大變革。
數據是信息的載體,信息是數據的內涵。數據的價值不只限于特定的用途,它既蘊含我們所需要的信息,也包羅我們尚未發現的信息。判斷數據的價值需要考慮到未來它可能被使用的各種潛在方式,而非僅僅考慮它目前的用途。大數據時代告誡我們,不能把眼光僅僅局限在涉密信息的安全上,還要考量能夠直接獲得或者推測判斷出涉密信息的基礎數據的安全。要充分認識這些基礎數據的基本價值和潛在價值。需要注意的是,大數據時代的一個突出特點是,非結構化數據的比例要遠遠高于結構化數據或半結構化數據。不論是結構化數據、半結構化數據,還是非結構化數據,這些數據都具有顯性或者隱性的網絡化存在,使得數據之間的復雜關系無所不在,一旦忽視其中的重要環節,就有可能導致重要情報的泄露。因此,大數據時代給我們的第一個挑戰就是,對于關系國家安全和利益的數據進行準確的判斷和篩選,既要注意各類結構化、半結構化數據,也需要考慮容易引起忽視的非結構化數據。
過去我們對國家秘密信息的保護,往往是通過切斷或者減少信息傳播的途徑來實現的,比如知悉范圍的最小化、信息設備的物理隔離等。大數據時代下,這樣的方式顯得力所不及。大數據分析的優勢和缺陷是一致的,即通過大數據綜合分析可以得到有效信息的前提是,用于分析的數據“噪聲”比較少,即虛假或者無用數據相對較少。大數據分析的真正意義在于對數據進行分析之后產生的價值,因此數據的可靠性和準確性是實現價值的關鍵因素。關于大數據的一個普遍觀點是,數據自己可以說明一切,數據自身就是事實。但是,成也蕭何,敗也蕭何,如果對基礎數據不仔細甄別,數據也會欺騙。正如由于網絡刷單的存在,我們現在已經越來越難地從電商賣家的銷售數量中判斷該賣家的信譽和貨品的質量;我們也很難通過點評網站上用戶的點評,判斷某家餐館的菜品質量。因此,為了保護一些關系國家安全和利益的大數據,我們可以人為地制造“噪聲”,使其無法或者很難從真假混雜的大數據中提取出有效的數據。通過偽造或者刻意制造的數據,可以引導分析者得到錯誤的結論,誘導分析者獲取不實的信息。
大數據時代開啟了一場尋寶游戲,不同的人對大數據的因果關系有不同的理解,不同的人也就可以在浩瀚的大數據中挖掘不同的寶礦。2015年8月,國務院常務會議通過《關于促進大數據發展的行動綱要》,提出要推動***信息系統和公共數據互聯共享,深化大數據在各行業創新應用。由此可見,通過大數據的共享共用,實現對各方面事業的巨大推動作用,是當前經濟社會發展的一個重要著力點。恰當地控制大數據可能造成的危害和充分地利用大數據共享所產生的巨大成效,是擺在大家面前的一項重要抉擇。在國家大數據戰略背景下,需要我們認真地研究大數據互聯共享可能造成的潛在危害,并根據實際妥善采取相應的方式,有效地控制這種危害的產生。要堅持大數據互聯共享為原則,關系國家安全和利益的數據保密為例外,把必須保密的數據控制在最小的知悉范圍,適當限制可能危害國家安全和利益數據的共享,密切關注公開的大數據并能在一旦發生危害國家安全情況下,采取必要的應急處置措施,這應當是我們面對大數據保密、共享與公開應有的態度。
***總書記強調,善于獲取數據、分析數據、運用數據,是領導干部做好工作的基本功。各級領導干部要加強學習,懂得大數據,用好大數據,增強利用數據推進各項工作的本領,不斷提高對大數據發展規律的把握能力,使大數據在各項工作中發揮更大作用。大數據時代的到來,對保密工作而言是挑戰也是機遇,需要我們站在更高更廣的層面,系統研究保密的范圍以及保密工作的對象、方式,實現保密工作在大數據時代的轉型升級。學好大數據這門必修課,應當成為每一位保密工作者的基本功。