《中國金融》雜志刊發云信達張兵撰文:提升數據管理能力是數字化轉型根本
時間:2020-05-12來源:未知 作者:acetouzi 點擊: 次以下為《中國金融》雜志刊發原文。
提升數據管理能力是數字化轉型根本
云信達公司創始人兼CEO張兵
在嚴峻的新冠疫情期間,國內某知名的互聯網企業發生嚴重的“刪庫”事件,一夜之間蒸發12億港元的市值。盡管數據保護在金融業一直是最重要最基本的風險管理目標,但作為數據管理行業的一名老兵,筆者認為這個事件給所有行業的數字工作者以警示,數字化既是機遇也是挑戰。人民銀行提出的做好數據治理推動數字化轉型的規劃和部署,其中數據保護、數據治理和數字化業務轉型,這三者之間究竟是什么關系,是一個需要首先討論的課題。
做好數據治理迎接數字化時代到來
數據是企業最核心的IT資產,數字化時代,數字化生存離開了數據一切都灰飛煙滅。近年來,各行各業在進行數字化轉型,無疑疫情會加速中國及世界的數字化轉型,使競爭更加白熱化。古語說,積小流成江海。金融業的數據資產是在長期業務發展過程中沉淀下來的,無論按照單位數據價值(Value per bit)還是數量,金融行業無疑排在前列。如何用好數據海洋,這一重要課題一直為金融業以及金融監管者所關注。
在數據達到一定規模之后,金融業都會面臨全局數據治理的問題。在此之前,金融機構的數據是離散的,分布在多個信息系統內部,形成人們經常說的“數據孤島”,這是金融行業數據治理首先要面臨的課題,其實何嘗不是數字化時代的基礎課題,然而,現實中這個問題并沒有很好地得到解決,不少機構還沿用傳統的數據管理方式。
應用煙囪和數據孤島
就銀行內部來說,數字化轉型首先開始于信息科技部門。組織內部的業務部門和職能部門,一般形成垂直與橫向交叉的矩陣式架構,以業務為中心,而職能部門從業務單元抽離出來形成橫向管控和支撐。于是我們提出了橫跨信息科技部門和業務部門的數據管理職能,類似許多管理矩陣中存在的大量虛線匯報關系的虛擬組織,某些金融科技公司的數據管理職能目前普遍虛擬化或者干脆缺失。科技部門有數據庫管理員卻沒有“數據管理員”,這個現象和“數據孤島”互相作用,形成一個死循環。上述現象在人民銀行科技司李偉司長撰寫了一篇文章《做好數據治理推動數字化轉型》中被視為金融數據治理中所存在的障礙,該文中在金融業數據治理之“術”的開篇就提到了要做好頂層設計。數字化轉型前的金融科技部門,有應用(APP)開發者、系統管理員、數據庫管理員……這些職能和角色都是基于“顯性”IT資產——應用軟件、硬件設備、系統軟件而設立的。這些“前數字化”職能如何面對數字化時代的企業數據資產——生產和交易信息、客戶與合作伙伴信息、資產和位置信息、代碼、知識、算法、模型……離開了數據企業無法生存,就是說,數字化時代的金融科技公司的頂層設計應該轉向以數據為中心。
數據資產 “邏輯集中”的誤區
既然數字化轉型需要把數據管理職能從業務單元中抽離出來,那么數據的管理范疇也需要從業務范疇中抽離出來。數據中臺和大數據都不是數據資產平臺,屬于典型的業務范疇,但是很容易成為認知誤區,而這樣的誤區往往會直接導致數據治理走上彎路。
現實中被誤導的例子時有發生,比如自從阿里提出數據中臺的概念,一些金融企業跟風向往。如果說,數據中臺更偏重流程型業務,大數據更偏重分析型業務,那么,它們整合數據的業務目的顯然大于資產管理目的。大數據平臺和數據倉庫都是以決策支持為目的建造的,通過應用數學模型和算法,揭示數據在更大時空、更多維度、更廣泛主題所呈現的規律,用于輔助決策;基于算力和方法,高速處理海量數據,直接驅動流程和業務。總之,大數據是面向復雜決策支持的數據業務平臺,為了適應業務模型和運算的方便,數據可能會變形或轉換,從而失去了原生性,導致數據的資產屬性喪失。
就是說在整個數據管理中,中臺不是萬能的,數據中臺的核心思想是將業務數據整合到一個分布式的數據服務平臺快速支撐業務創新、業務交叉和業務彈性。金融IT是典型的雙態IT架構(穩態和敏態),顯然,如果將決定生死存續成熟穩定的核心業務平臺拆掉,單靠裝入靈活的中臺是與銀行初衷與風控原則相悖的。中臺是典型的敏態架構,是金融企業的業務平臺之一。對一個敏捷業務平臺賦予數據資產管理職能顯然是小馬拉大車,而數字技術已提供了既能夠堅守銀行風險管理底線又同時支持靈活創新的兩全可能。
數據治理與數據保護的協同性
那么,我們有怎樣的數據治理工具呢?泛企業的數據資產發現和數據治理工具并不缺乏,它們將數據的管理范疇像“虛擬組織”那樣從業務范疇中抽象出來。可是我們知道企業的數據每年以50%的速度增長,數據發現、分類、分級、變遷、使用等,會遇到諸多技術和管理問題。況且業務系統中的數據是動態變化的,治理一個變化中的對象需要對它進行持續的管控,管理和控制的邏輯疊加在業務系統上有時并不合適。于是,從業務系統中抽離數據資產自然而然成為科技部門的一個任務。抽離就是從業務系統中把數據復制出來,建立一個生產數據的“孿生數據”,一個處理業務邏輯和業務壓力,另一個處理管理邏輯和管理壓力。數據復制如同印刷術在IT的發展史上已經存在了很多年。
根據IDC統計,一個中型企業內出于各種目的產生的復制數據有8-10份之多,常見的有:備份、容災、歸檔、分析、審計、開發測試等。復制手段和工具多,復制下來的數據多,存放方式和地點多,已然成為一個管理難題。復制數據管理在數字化轉型的當口既是管理問題又是技術問題。復制數據有些是無條件、不得不做的,有些是有一定選擇性的。所以復制數據管理就從不得不做的領域發端,并成長起來。
數據保護是IT運維的日常業務,也就是數據備份。金融行業對數據備份有著嚴格的規矩與監管,金融系統的原生數據,包括數據發生邏輯變化的時間變量,全都被忠實地記錄在數據備份系統。最近發生刪庫事件的互聯公司居然沒有備份,這在金融企業是難以想象的。然而,備份系統的情況并不妙。據IDC 2018年的一項報告,全球70%的CIO對現有數據備份系統不滿意。現行的備份技術20年沒有升級,導致海量備份數據只在災難恢復時用一用,平時這份可以救命的數據淪為 “暗數據”。一方面,人們想要從業務系統抽離數據用于管理目的,另一方面,“暗數據”濫觴,這是一對巨大的矛盾。
為應對數字化轉型,全球知名的IT研究咨詢機構Gartner在2016年定義了一種 “復制數據管理”或“副本數據管理”的新技術——Copy Data Management,簡稱CDM。CDM首先是一種備份新技術,以“原格式”獲取生產數據各個時間序列的副本;其次,CDM是一個副本數據管理平臺,備份數據能夠被管理和使用,不再是暗數據。CDM統一了復制數據的過程,統一了副本數據的管理,統一了副本數據的流轉和使用。CDM管理著生產數據的新鮮副本的總集,并且是“原生的”,具備天然的資產屬性。在多個國家,備份數據的這個屬性被用來作為客觀證據。這使得CDM成為一個從業務系統中抽離的數據資產集散地,一個副本數據資源中心。
副本數據成為管理范疇的焦點也僅僅是數據治理得到重視之后,那么,數據保護和數據治理究竟是怎樣的關系?數據保護是傳統IT運維的范疇,數據治理然是資產與合規管理的范疇。數字化轉型就是要打破部門之間的藩籬,讓數據成為最活躍的生產要素,副本數據管理自然上升為推動數字化轉型的跨界“生物”。
副本數據的價值和運用
盤活數據資產的前提條件是健全治理體系。人民銀行提出了三點:一是做好數據資產管理,二是做好數據分級管理,三是做好數據共享管理。
金融業的數據治理是一個動、靜結合的體系,靜態能力包括數據資產的建檔、分級、分類、關聯、確權、定價,等等;動態能力包括數據檢索、審計,數據流通、共享、交換管理,去標簽化(脫敏),加密,等等。數據治理平臺做完三件事可以建立消費數據的基礎,首先建立元數據管理,也就是描述數據的數據;其次提供便捷的數據資產檢索、定位;然后建立數據輸出到企業內部、外部的標準。
副本數據是數據保護的結果,繼而成為了數據治理的對象,治理之后又返身進入數據消費的環節。剛才提到IDC統計過企業內部基于各種目的產生多份副本數據(復制數據),有了副本數據資源中心之后,既可以減少復制的動作,數據消費的出口也可以很方便地扎口管理。隨機舉幾個業務場景的例子:一是CDM可以成為數據倉庫之前的ODS,大數據之前的數據湖,CDM即數據湖;二是固化數據用于審計目的;三是CDM給DevOps(開發運維一體化)賦能。
三位一體的數據“底盤”
副本數據管理誕生于運維,因資產屬性成為治理對象,因為是活躍的生產要素直接進入驅動數字化業務的環節,運維、治理和流通環環相扣,既是一個完整的跨界循環,又是一個有機的整體。下圖描繪了副本數據管理的三位一體特征,已經大大超出了Gartner早期的定義。
三位一體的數據底盤
數據管理固然是金融業數字化轉型的重大課題,不過眼下數據保護、數據治理和數據流通還存在不少相互制約現象,導致創新和轉型步履維艱。比如:互聯企業既有支付創新也有刪庫事件,共享經濟隱含著隱私數據外泄等違法隱患……科技進步使得數據這一生產要素變得更加活躍也更加危險,創新必須在風險可以管控的前提下,這就給風險管理提出了新的課題。副本數據平臺是一個理想的抓手,副本數據是企業可管理、可操作的資產對象,圍繞副本數據平臺可以把數據保護、數據治理和數據流通放在一個整體的框架內統一考慮。聚焦副本數據建立數字化底盤,不斷豐富和完善相關的技術體系、管理規范和行業生態,可以加速各項數字化舉措的落地。
副本數據管理的三位一體架構除了應用于企業內部,監管單位、分支機構和外部合作伙伴的數據上收或共享也變得更簡便、可靠。隨著5G的建設,多云數據管理可以加速金融云的構建,符合行業標準的跨企業的數據共享、交換也變得更加可行。當然,有了這個“底座”,還需要行業數據治理規范、數據主權立法、數據流通的相應標準制訂等等的同時跟進,才能真正建立起數據治理的生態環境,完成金融業的數字化轉型,從而才能真正成為推動數字化經濟的主要力量。