大数据与区块链结合能否提升金融风控有效性?探讨风险控制新趋势
简介:风控是金融领域不可或缺的一部分。近年来,为了实现更精准、更高效的风险控制,金融机构纷纷引入大数据技术。然而,大数据风控并不完善,仍然存在数据孤岛、数据质量低下、数据泄露等有效性不足等问题,导致风险事件层出不穷。区块链技术的出现为大数据风控带来了一些曙光。那么,大数据+区块链真的能在风控领域擦出不一样的火花吗?
金融行业的核心在于风控(以下简称风控)。随着金融业的快速发展,其风险问题也越来越严重。传统的基于个人经验预测风险的风险控制模型已不能完全满足新时代风险管理的需求。随着大数据技术的日益普及和风险管理中对数据资产的重视,大数据风控应运而生。然而,大数据风控真的有效吗?
大数据风控是美中不足
众所周知,大数据风控是指利用大数据技术,对交易过程中的海量数据进行定量分析,从而更好地识别风险和管理风险。大数据风控的核心原则是小而分散,即防止资本利益相关者过度集中。小量的设计原则主要是针对由海量数据组成的统计样本,尽量避免统计中的“小样本偏差”。去中心化设计原则主要是通过分析借款人的人口属性、业务属性、行为属性和社会属性来建立大数据风控模型。
基于大数据的风险控制突破了传统风控模型的局限性,在使用更充足的数据的同时减少了人为偏见,是金融机构创新传统金融风控模型的有力工具。大数据技术的应用不仅可以提高风控效率,还可以节省风控过程中的管理成本。但是,大数据风控并不完美,首先,大数据风控技术无法解决数据孤岛的问题,即数据开放和共享的问题。目前,政府、银行、证券公司、互联网公司和第三方征信公司所持有的信息很难在短时间内实现互联互通,从而形成信息孤岛。当不同金融机构之间进行交易时,数据孤岛导致信息不对称和不透明,带来大量的长期债务风险和欺诈风险。金融信贷行业要想利用大数据风控技术来提高风控水平,必须打破数据孤岛,解决信息不对称、信息获取不及时等问题。
其次,数据质量低的问题也在一定程度上影响了大数据风控的质量,尤其是来自互联网的半结构化和非结构化数据,其真实性和利用价值较低。例如,在美国,俱乐部和公司合作捕获和使用社交数据;在中国,宜信还不遗余力地收集借款人的社交数据,以实现对借款人信用度的全面评估。但是,两者得出的结论是相同的,由于社交网络中数据具有很强的主观随意性,从互联网中提取的社交数据根本没有使用价值或使用价值很低,错误率高达50%。电商平台上的交易数据也因一些刷单现象而出现失真。这些信息的收集和使用就像垃圾的进出,几乎没有任何意义。基于这些低质量数据进行风控的效果也会大大降低。
最后,在大数据风控过程中存在数据泄露问题。近年来,数据泄露风险事件频发。2015 年 2 月 12 日,汇丰银行大量秘密银行账户文件被曝光,揭露其瑞士分行曾帮助富裕客户逃税,隐藏数百万美元资产,提取难以追踪的现金,并为客户提供如何在本国避税的建议。这些文件涵盖 2005 年至 2007 年期间,涉及约 30,000 个账户,总资产约为 1200 亿美元,是历史上最大的银行违规行为。根据全球研究报告《数据 2015》,2015 年共发生 79,790 起网络安全事件,确认了超过 2,000 (2,122) 起数据泄露事件。这些都降低了大数据风控的有效性和应用价值。
区块链可以省去大数据风控吗?
2008 年 11 月,一位名叫中本聪 ( ) 的加密爱好者首次提出了区块链的概念。区块链本质上是一个去中心化的分布式数据库,这种去中心化、开放、自主、匿名和防篡改的数据结构使其一出现就迅速获得了很多关注。区块链的出现,也在一定程度上解决了大数据风控效果不足的问题。
区块链诞生于比特币系统,比特币是一种数字货币,区块链是记录这种货币的发行和交易的“账本”。为了不牵拢到受信任的第三方,这个“账本”需要确保交易双方都能互信,并确保所有交易信息都是公开透明的,并自动传达给交易双方。因此,这个 “账本” 必须是共享的、自主的和不可更改的。从专业角度来说,它应该具有去中心化、开放自治和匿名不变的特点。区块链的四大核心技术实现了这些特点:(1)分布式记账、分布式传播、分布式存储,保证了系统内的数据存储、交易验证、信息传输都是去中心化的;(2)通过时间戳(区块(完整历史)+链(全验证)=时间戳)进行记账,形成一个不可篡改、不可伪造的数据库;(3)所有权的信任是“算法信任”,非对称加密算法保证了交易数据的可信度;(4) 实现了可编程的智能合约,使系统能够处理一些不可预见的交易模式。
区块链的去中心化、开放自治、匿名和防篡改的特点迅速扩展了其应用场景,从最初的数字货币,到证券交易结算、会计审计等涉及合同审核的金融领域,再到政府、医疗等公共领域,区块链技术解决了现实世界中的许多技术壁垒。具体来说,近两年来,京东百条构建了被称为“四大发明”的大数据模型系统:司南——风险管理模型系统、火药——量化运营模型系统、可移动型用户画像系统、造纸——大数据信用模型系统。毫无疑问,与传统的风控系统相比,依托大数据技术“四大发明”的风险管控系统能够更精准地识别和遏制套利行为,目前已完成 1 亿用户的信用评价。然而,大数据风控系统仍然无法解决其数据源中存在的问题。无独有偶,区块链技术应用于大数据风控系统,可以有效解决大数据风控的数据孤岛、数据质量低下、数据泄露等数据源问题。
影响大数据风控效果的关键因素是数据库的维护成本和信息传输效率。从数据的角度来看,区块链是一个数据库,其中信息由所有参与者(而不是单独由一个中心化机构记录),并由参与记录的所有节点存储(而不是存储在中心化机构中),不能随意篡改。在这个区块链数据库中,每个用户节点都有整个数据库的完整副本,当用户节点想要将数据写入数据库时,它需要将此数据广播到区块链网络,以便其余用户节点可以验证和审计数据。只有全网共同验证认可后,数据才能写入区块链,一旦数据写入区块链,就不能随意修改或删除。这样一个利用区块链技术构建的数据库,对于提高大数据风控的有效性具有重要意义。
首先,区块链的去中心化、开放性和自治性可以有效解决大数据风控的数据孤岛问题,使信息能够公开透明地传递给所有金融市场参与者。想象一下以下场景:客户向银行 A 和银行 B 申请了各 1 USD 的抵押贷款,但他们的房屋价值只有 100 万美元。如果两家银行加入同一个区块链,将能够即时识别客户的交易行为和风险,避免贷款总额超过抵押价值。除了交易实体,监管机构还可以作为用户节点加入区块链,实时监控其他用户节点的交易信息,防止风险事件的发生,而无需等待事后报告。通过使用区块链中的所有数据链进行预测和分析,监管机构可以及时发现和预防可能出现的系统性风险,从而更好地维护金融市场的秩序,提高金融市场的效率。由此可见,区块链的去中心化可以消除大数据风控中的信息孤岛,通过信息共享提升风控水平。
其次,区块链的分布式数据库可以改善大数据风控数据质量差的问题。解决了数据格式多样化、数据形式碎片化、缺乏有效数据、数据内容不完整等问题。在区块链中,数据由每个交易节点记录和存储,每个节点都可以参与数据检查并共同对数据作证,从而提高了数据的真实性。由于没有中央权威,单个节点不能随意增减或更改数据,从而降低了单个节点制作错误数据的可能性。例如,在银行或交易平台内建立私有链,由客户构成节点,可以避免大量数据被单个信息中心集中录入和存储,降低运营风险。另一方面,可以通过买方的核查来遏制卖方的单方刷单行为,从而保证数据的真实性和有效性。伪造的数据想要通过区块链网络的验证,必须掌握私有链 50% 以上的算力,当节点足够时,私有链的控制成本急剧上升。此外,区块链中的每个节点都有一份完整的数据副本,只有当整个区块链系统宕机时,数据才会丢失,数据记录一旦写入就无法修改。因此,区块链具有公开、透明、安全的特点,可以从源头上提高数据质量,增强数据验证能力。
最后,区块链可以防止数据泄露问题。由于区块链数据库是一个去中心化的数据库,任何节点对数据的作都会被其他节点发现,从而增强对数据泄露的监控。此外,区块链中节点的关键身份信息以私钥的形式存在,用于交易时的签名确认。私钥只有信息的所有者知道,即使其他信息泄露,只要私钥没有泄露,泄露的信息就无法与节点的身份相匹配,从而失去其使用价值。对于来自数据库外部的攻击,黑客必须掌握 50% 以上的算力才能确保区块链被攻破,节点越多,需要的算力就越大。因此,在大数据风控中,通过区块链对信息存储进行加密,确保数据安全,防止数据泄露,是区块链的重要应用之一。大数据风控 + 区块链,未来在哪里?
在最近发布的一份行业报告中,BI 预测区块链的采用和采用将是 2016 年金融行业的最大趋势。那么,区块链会成为大数据风控的助推器吗?笔者认为,“区块链+大数据风控”的发展前景广阔,但并非一蹴而就。随着金融科技的发展和资本、人力的不断投入,区块链将与大数据技术相结合,为风控领域存在的问题提出更合理、更高效的解决方案。
区块链认证和加密技术也将在大数据风控中发挥作用。区块链采用非对称加密,在信息传输过程中,交易信息使用公钥(全网公开可见)进行加密,加密信息只能由拥有相应私钥的人解密(只有交易发起者知道);在鉴权时,使用私有密钥对信息进行签名,并使用公有密钥验证签名者的身份(公有密钥无法解密私有密钥,但可以验证私有密钥)。同时,利用大数据技术从数据端对客户特征进行认证和筛选,从而提高防现金、防欺诈、防作弊的准确性。
在过去的几年里,在金融活动的合同审核和执行过程中,人为作风险和道德风险一直是大数据风控中难以解决的问题之一。大数据风控主要针对客户,针对金融机构的员工作风险和道德风险,大数据风控技术超负荷工作。2009 年初,区块链技术的出现使智能合约系统成为可能。基于区块链的可编程性,可以将合约指令嵌入到区块链中,有效削弱了中心系统在数据监控和验证中的作用,消除了人为作因素可能带来的风险。金融机构逐渐开始利用区块链技术构建智能合约系统,以实现合同合规性检查的自动化。
区块链技术作为一种特定的数据库技术,将与大数据风控技术相辅相成,进而构建一种新的数据组织方式。笔者相信,在不久的将来,两种技术的跨界融合将上升到公司层面和国家层面的治理层面,从而引领我们进入具有强烈信任和背书的大数据时代。