工行首席技術官呂仲濤:金融業數據治理的突破口
工行首席技術官呂仲濤:金融業數據治理的突破口
中國金融四十人論壇
呂仲濤表示,當前,我國的數據治理工作面臨着一系列問題與挑戰,包括數據歸屬權和使用權界定有待進一步明确,數據流轉制度和技術基礎有待夯實,跨金融機構數據共享亟待深入推進等。他強調,“數據信息的合理利用與依法有序流動,是商業銀行數字化轉型、有效防範化解金融風險的關鍵手段。”
針對這些問題,他對數據治理的工作思路提出三方面建議:? 加快厘清數據歸屬權和使用權;? 探索适應數據要素市場化流轉的制度與技術基礎,加快建立多層次數據交易市場;? 大型金融機構先行開展金融領域數據要素市場化試點。
具體而言,呂仲濤提出,國有大行可先行先試,充分利用隐私計算等新技術,防範信貸資金違規使用、多頭開戶多頭授信和欺詐洗錢等金融風險。運作機制方面,可在人民銀行的指導和召集下,依托特定交易主體進行試運行,逐步摸索相應的定價、運營和風控模式。
文 | 呂仲濤
數據治理是當前的熱門話題。銀行本質上是經營數據的行業,承載着大量的客戶個人信息和财産信息,且這些信息在銀行的經營活動中發揮着非常關鍵的作用。我将結合新經濟形勢下出台的一系列政策和法律法規,從技術角度出發,聯系自己在銀行業的工作體會談一談數據治理問題。
1. 數據歸屬權和使用權的界定有待明确
目前,很多情況下數據的歸屬權不夠明确。例如,客戶姓名、身份證号、手機号等個人信息實際上可以被不同組織和機構在不同場合中獲取。各項業務的辦理過程,如商品購買、财務處理等,也會産生大量數據,在其基礎上,又可以進一步加工生成更多的衍生數據。現在這些數據的歸屬權界定尚不清晰。
與一般生産要素不同,數據在物理層面上并不具有唯一性和獨占性的特點——從技術角度來說,數據可以支持不同主體同時分别使用。因此,隻有厘清各類數據的歸屬權與使用權,包括在一定條件下的轉讓權,數據才可能成爲按市場經濟規律進行配置的一種生産要素,才可能按照市場化方式進行交易和流轉。
目前我國已經針對數據安全、個人信息保護等問題出台了一系列法規,包括《個人信息保護法》《網絡安全法》《數據安全法》等。然而,考慮到當前對有效指導和規範市場主體運作的需求,依然有許多地方需要進一步研究明确。
例如,《個人信息保護法》對“個人信息”的定義是,“以電子或其他方式記錄的與已識别或者可識别的自然人有關的各種信息,不包括匿名化處理後的信息”。而問題是,法規中的一些概念在實際操作中很難界定。
比方說,根據法規,客戶在銀行辦理轉賬業務所産生的數據應該歸屬于客戶,但銀行能否合理地使用這些數據?應該在什麽情況下使用?在統計分析時能否使用?在産品推介時能否使用?這些問題都有待厘清。
原先一般認爲,銀行原則上是可以将客戶數據用于這些業務的。但細究起來,這種做法在操作層面上存在問題。因爲法律規定,銀行使用客戶的個人信息時,必須“明示”客戶特定數據的使用目的和處理方式等,但銀行使用這些數據的部分場景,比如涉及複雜統計過程的精準營銷,事實上很難詳細、個别地向客戶說明。可如果不能做到“明示”,銀行就超過了自身對數據的使用權限。
在此之外,對于客戶開戶的三要素信息,即姓名、身份證号和地址,銀行使用權的邊界在哪裏?實際上,很多基本數據經過不同組合可以産生大量新數據,因此厘清銀行對這些數據使用權的界限格外重要。這些都是銀行在日常工作中經常需要面對的具體問題,在法律法規層面上還需要進一步斟酌完善。
2. 數據流轉制度和技術基礎有待夯實
可流轉是市場經濟環境中生産要素的基本特征之一,但由于數據可以無限複制和傳播,市場主體在通過交易形式轉讓數據後并不會完全喪失數據的使用權,從技術層面上看,該主體仍可以繼續使用甚至重複轉讓這些數據。有别于傳統生産要素的交易和流轉,目前還缺乏能夠準确度量特定數據的價值和影響的有效手段,數據流轉方面的市場定價标準、風險評估手段等也十分不足。我認爲在這個問題上有三個方面需要關注。
第一,可流轉數據範圍有待明确。哪些數據可以流轉、哪些數據不能流轉、哪些數據在特定條件下可以流轉,都需要有清晰的界定,同時還要考慮跨主體、跨國境等各種數據流轉情況。最近部分互聯網公司涉嫌信息披露違法違規而被調查、互聯網平台的個人信息與金融機構“斷直連”等,也在一定程度上反映了當前可流轉數據範圍存在的問題。
第二,數據交易市場的建立方式需要深入思考。這一問題在征信等垂直領域已經有了一些探索,部分地方政府也在推動建立數據交易市場。然而在必要的行政力量之外,如何構建市場化的交易平台目前仍不明晰。此外,哪些數據應當以市場化的方式交易,哪些又必須基于特定交易主體進行交易,也有必要進行探索。
第三,數據要素市場化機制如何設計,如何定價以确保價格與權益相匹配,還需要探讨。數據市場要做活,必須激發各市場主體的積極性,這當中最重要的一點就是定價。隻有通過價格手段有效平衡各參與主體的成本、貢獻和收益,數據才能真正流通起來,要素市場才能建立起來。另外還需要考慮的是,如果要确保價格與權益相匹配,就不應當允許市場主體隻支付一次就能無限制地使用數據甚至于二次轉讓數據,這會對市場造成傷害。
3. 跨金融機構數據共享亟待深入推進
數據信息的合理利用與依法有序流動是商業銀行數字化轉型、有效防範化解金融風險的關鍵手段。雖然各家金融機構已在内部數據的挖掘方面取得了很大突破、獲得了一些成果,但僅從金融風險防範的視角來講,我們依然迫切需要開展跨金融機構的數據融合應用。
當前不同銀行間賬戶資金往來極其便捷,一筆資金可以在短短幾分鍾内流轉到多家銀行,同一客戶也可能在多家銀行申請信用卡或貸款,頻繁的資金往來爲鑒定資金的真實來源和流向、規避惡意信用透支等風險帶來很大挑戰。有時從單一銀行範圍來看似乎一切正常,可一旦從更高的視角出發進行全局觀察,就會發現存在一些潛在的系統性風險。而以各家銀行目前的運行機制,很難達到“風險聯防聯控”的要求。各家銀行隻有打通數據孤島、實現跨行數據的共享,才有可能實現對系統性金融風險的防範。
除了這些共性問題,目前金融行業中還普遍存在三個問題,那就是“不敢共享”“不願共享”“不便共享”。
“不敢共享”方面,實際上金融數據具有一定的敏感性,涉及到個人隐私、商業秘密甚至國家安全,因此在一些法律法規不太清晰的領域,商業銀行進行數據共享時會顧忌法律風險、不敢輕易行動。
“不願共享”,則是因爲數據是銀行的戰略性資源和關鍵生産要素,數據持有方在缺乏相關利益補償機制的情況下,主觀上缺乏共享數據的動力。
“不便共享”是指傳統的數據共享方法面臨很多制約條件,較長的實施周期也極大限制了數據價值的發揮。例如,在共享數據時需要進行數據的脫敏、傳輸、複制、核對、标簽等工作,各銀行的合作難度很大,實現過程也相對複雜。
1. 加快厘清數據歸屬權和使用權
要兼顧數據的安全保護與發展,就必須要厘清數據的歸屬權與使用權。金融數據是價值資産,其作爲新生産要素的社會推動作用必将日益凸顯,我們需要在數據安全保護與發展利用之間找到平衡點,既要避免管得過緊,影響數據價值發揮,又要避免管得過松,難以保障用戶隐私又不利于數據要素的長期可持續發展。對于加快完善法律法規、厘清數據的歸屬權和使用權,我有四方面建議。
第一,用戶個人的自然屬性數據,例如姓名、身份證号、手機号等,歸屬權應當屬于用戶個人,數據采集主體可在用戶授權範圍内使用,但要防止過度索權、寬泛索權的問題。
第二,服務辦理過程中産生的數據,例如購物、支付數據,可由交易相關主體共同擁有,因爲整個交易過程涵蓋了買賣雙方的信息,整合起來才會成爲最終的訂單信息。因此這類數據應當是共有的,在各相關方的主體範圍内可以自由使用。
如需向任何其他主體提供該數據,必須由相關主體共同授權。例如,對于平台類電商的購物數據,我們認爲平台不應擁有數據所有權,其可以在充分尊重數據人格權的前提下,根據相關約定對自然人的有關數據進行統計和所謂的客群分析,但不應進行精準營銷行爲,因爲平台隻是中介方,并非真正的交易雙方中的任何一方。除非經過交易中甲乙雙方用戶的專門授權,平台在數據使用中不得追溯至原始自然人信息,信息的所有權由買方和賣方共同擁有。
與此同時,要嚴格管控非數據直接生成方開展有關主體的數據超融合,這一現象包含着巨大的風險。現在有大量第三方公司自身不産生數據,卻通過各種交易市場進行數據搜集,并将之進行超融合。在這種情況下,追溯數據來源将變得非常困難。
第三,上述原始數據進行匿名化處理後得到的衍生數據,在确保數據不可回溯到自然人的前提下,可歸數據加工方所有,并由其決定如何使用。在這個過程中,匿名性非常重要,現在我們往往把“去标識化”和“匿名化”混淆,但匿名化處理實際上并沒有那麽簡單,即便用加密算法來做也未必不能破解。因此,對匿名性的判斷要更加嚴謹。
第四,要明确數據的主權屬性。數據主權應當是國家主權的一部分,對于境内或者其他某些特定場景産生的數據,國家應當擁有對這些數據的最高權力,前述的數據歸屬權、使用權等都應該服從于主權管理這個大前提。這與下文将談到的系統性金融風險防範密切相關——如果從國家數據主權的角度出發,由國家特定機構來負責推進相關事宜是沒有問題的。
2. 探索适應數據要素市場化流轉的制度與技術基礎
數據要素市場化是新生事物,世界各國均無此先例。我們可以在把握好風險底線的基礎上,借鑒改革開放之初的特區建設思路,“摸着石頭過河”,加快探索在國内建立多層次數據交易市場。
首先,要對關系到國家安全、經濟安全、社會穩定和公共健康的數據交易進行嚴格管控,或者限制市場交易隻在特定的交易主體間開展、在國家管理的特定場所進行。有關部門可以通過發布負面清單、完善相關規定、采用類似《征信業管理條例》的方式對市場進行規範。
而另一方面,對于非受限數據,則可給予各地數據交易市場更大的空間。考慮到潛在的不可控因素,也可以借鑒沙盒機制,允許相關數據交易市場在一定數據範圍内組織部分有代表性的市場主體,圍繞數據定價、交易手段、權益界定、風險防控和技術工具建設等問題展開積極探索,争取在打造數據特區方面開辟出一條可行的道路;通過階段性地總結特區經驗,提煉形成深化數據要素市場化改革的政策框架與法律制度,爲後續參與數字領域的國際規則和标準制定做好準備。
對此我提出三點建議:
第一,要完善金融行業數據共享與治理的有關法規。《數據安全法》第21條明确指出,“各地區、各部門應當按照數據分類分級保護制度,确定本地區、本部門以及相關行業、領域的重要數據具體目錄,對列入目錄的數據進行重點保護。”金融行業的主管部門理應盡快明确金融數據保護的有關管理規定,指導和規範各地區金融數據交易及各金融機構數據共享,現階段可優先圍繞金融風險防控來推進。
第二,要研究建立支撐金融行業數據共享與治理的配套實體。一方面要成立特定的交易主體,負責金融行業數據共享的日常組織和運營;另一方面要成立數據治理的監管機構,監管金融數據的跨行業、跨境流動,并着重從三方面對金融行業數據共享的有關市場主體進行監管:
(1)準确性與安全性,主要包括數據來源是否合法有效,數據的獲取、傳輸、存儲是否安全;
(2)透明度與公平性,主要包括數據加工過程中涉及的算法模型是否公正公平,是否具備可解釋性、是否注意避免歧視特定人群;
(3)消費者權益保護,主要在于客戶的知情權能否得到充分保障。
第三,要研究建立适應數據要素特點的監管能力和工作模式,要建立涵蓋事前、事中、事後的全流程監管機制。事前可研究建立由行業專家、領域專家、技術專家、法律專家等參加的聽證制度,對數據共享的合規性和必要性進行評估;事中可通過配套的制度性與技術性安排,開展定期的審計評估,對數據共享和數據使用過程進行監督和監管;事後,則要建立數據共享相關的争議仲裁及風險補償機制。
3. 大型金融機構先行開展金融領域數據要素市場化試點
我大膽設想,中國可依托大型金融機構先行開展金融領域數據要素市場化的試點。對于這一舉措有三方面的考慮。
第一,機構禀賦方面,大型金融機構客戶覆蓋面廣、業務和技術能力比較強、風險也比較可控。
第二,技術可行性方面,隐私計算等新興技術已經取得發展,大型金融機構實際上已經有足夠的技術儲備來開展跨機構資金流向的追蹤、查詢、客戶授信和審核等。特别是對于防範信貸資金的違規使用、客戶多頭開戶和多頭授信、交易流水變增等,目前都可以在技術上實現。然而由于當前跨行數據流通面臨的制度障礙,這些措施無法實現。
第三,運作機制方面,可在人民銀行的指導和召集下,依托特定交易主體進行試運行,逐步摸索相應的定價、運營和風控模式。這一舉措從技術角度來看也是完全可行的。
請先 登錄後發表評論 ~