
近年来,随着互联网金融的异军突起和新兴技术的驱动,越来越多的商业银行选择在战略层面开启企业级数字化转型之路,利用数据来赋能业务,利用新技术提升效率和管理精细化。对数据本身而言,业务发展加快了数据膨胀的速度,也带来了数据不一致等问题,业务部门的频繁增加和剥离同样会对数据治理提出挑战。这些日益复杂的内外因决定了我国银行业对数据治理的超高标准要求,而目前对应的经验能力却稍显薄弱。
佩企科技经过多年发展,深刻理解数据治理不是一个临时性的运动,从银行业务发展、数据治理意识形成、数据治理体系运行的角度,需要一个长效机制来进行保证。
· 2003-2010年:银行与通信业开始关注数据治理,特别是在互联网巨头业务域数据规模快速增长的背景下。中国数据管理领域在这一时期经历了早期的实践探索。
· 2011年:Gartner研究公司将数据治理列为IT前十大趋势之一,微软成立了数据治理办公室,开始推行全面的数据治理改革。
· 2015年:国家层面开始陆续发布关于数据治理的政策文件,如《关于加快推进国有企业数字化转型工作的通知》等。
· 2018年:中国国家市场监督管理总局和中国国家标准化管理委员会联合发布了国家标准《数据管理能力成熟度评估方法》(GB/T42129-2022),并于2023年7月1日起正式实施。同年,中国建设银行启动企业级数据仓库建设,整合全行数据资源,厘清数据源头。
· 2020年:国家层面发布了《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》,数据管理工作进入新阶段。
· 2022年:国家数据局正式发布了《数字中国建设2024年工作要点清单》,进一步明确并建立了数据管理相关的8个领域、5个等级的能力模型。
佩企观点:中国数据治理从2003年起步,经历早期实践探索,到2015年后国家政策推动,2018年国家标准实施,至2023年理论标准不断创新,展现了从业务域数据规模增长到国家战略层面的全面布局和快速发展。
01
数据模型
02
元数据管理
元数据分为业务元数据、技术元数据和操作元数据,三者之间关系紧密。业务元数据指导技术元数据,技术元数据以业务元数据为参考进行设计,操作元数据为两者的管理提供支撑。
业务元数据:业务元数据是定义和业务相关数据的信息,用于辅助定位、理解及访问业务信息。业务元数据的范围主要包括:业务指标、业务规则、数据质量规则、专业术语、数据标准、概念数据模型、实体/属性、逻辑数据模型等。
技术元数据:它可以分成结构性技术元数据和关联性技术元数据。结构性技术元数据提供了在信息技术的基础架构中对数据的说明,如数据的存放位置、数据的存储类型、数据的血缘关系等。关联性技术元数据描述了数据之间的关联和数据在信息技术环境之中的流转情况。
操作元数据:操作元数据主要指与元数据管理相关的组织、岗位、职责、流程,以及系统日常运行产生的操作数据。
03
数据标准
数据标准是银行建立的一套符合自身实际,涵盖定义、操作、应用多层次数据的标准化体系。它包括基础标准和指标标准(或称应用标准)。与数据治理其他核心领域具有一定的交叉,比如元数据标准、数据交换和传输标准、数据质量标准等。
商业银行的数据标准一般以业界的标准为基础,如国家标准、监管机构(如国家统计局、中国人民银行、工信部)制定的标准,结合商业银行本身的实际情况对数据进行规范化,一般会包括格式、编码规则、字典值等内容。
良好的数据标准体系有助于商业银行数据的共享、交互和应用,可以减少不同系统间数据转换的工作。数据标准的主要由业务定义、技术定义和管理信息三部分构成。
04
数据质量管理
数据质量管理已经成为银行数据治理的有机组成部分。高质量的数据是商业银行进行分析决策、业务发展规划的重要基础。只有建立完整的数据质量体系,才能有效提升银行数据整体质量,从而更好地为客户服务,提供更为精准的决策分析数据。
05
数据生命周期管理
任何事物都具有一定的生命周期,数据也不例外。从数据的产生、加工、使用乃至消亡都应该有一个科学的管理办法,将极少或者不再使用的数据从系统中剥离出来,并通过核实的存储设备进行保留,不仅能够提高系统的运行效率,更好的服务客户,还能大幅度减少因为数据长期保存带来的储存成本。
数据生命周期一般包含在线阶段、归档阶段(有时还会进一步划分为在线归档阶段和离线归档阶段)、销毁阶段三大阶段,管理内容包括建立合理的数据类别,针对不同类别的数据制定各个阶段的保留时间、存储介质、清理规则和方式、注意事项等。
06
数据分布和存储
数据分布和存储主要涵盖了数据如何划分和存储,总行系统以及总分行数据如何分布,主数据及参考数据(也称为副本数据或者辅数据)如何管理。只有对数据进行合理的分布和存储,才能有效的提高数据的共享程度,才能尽可能的减少数据冗余带来的存储成本。
通常情况下,综合数据规模、使用频率、使用特性、服务时效等因素,从存储体系角度,可以将商业银行的数据存储划分为四类存储区域,即交易型数据区、集成型数据区、分析型数据区、历史型数据区。
07
数据交换
08
数据安全
09
数据服务
数据的管理和治理是为了更好地利用数据,是数据应用的基础。银行应该以数据为根本,以业务为导向,通过对大数据的集中、整合、挖掘和共享,实现对多样化、海量数据的快速处理及价值挖掘。利用大数据技术支持产品快速创新,提升以客户为中心的精准营销和差异化客户服务能力,增强风险防控实时性、前瞻性和系统性,推动业务管理向信息化、精细化转型,全面支持信息化银行的建设。
佩企观点:银行数据治理的核心在于构建高效的数据模型、强化元数据和数据质量管理、统一数据标准、保障数据安全、优化数据生命周期管理、合理分布存储数据、促进数据交换与集成、深化数据服务应用,并在组织文化中根植数据意识,以确保数据驱动的业务创新和风险控制。
随着数字化转型的不断深入,银行数据治理已成为金融创新和风险控制的关键。银行必须认识到数据治理不仅仅是一项技术活动,更是一种战略投资。通过合理配置资源,银行能够在保障数据安全和合规性的同时,促进业务创新和提升客户体验。这种平衡需要银行高层的重视和全行员工的共同参与。此外,银行在数据治理过程中应采取灵活的管理策略。通过敏捷开发和精益管理,银行能够快速响应市场变化,优化数据流程,减少冗余和浪费。同时,持续改进的文化能够激发员工的创新精神,为银行带来长期的竞争优势。技术创新是实现战略平衡的关键驱动力。银行应积极拥抱大数据、人工智能、区块链等新兴技术,以提高数据处理的效率和准确性。同时,银行需要建立强大的技术平台,以支持数据的集成、分析和应用。
当然,组织文化和人才发展对于数据治理的成功也至关重要。银行需要培养一种以数据为中心的企业文化,鼓励员工利用数据进行决策和创新。同时,通过专业培训和职业发展机会,银行能够吸引和保留数据治理领域的顶尖人才。
佩企观点:展望未来,银行数据治理将继续面临新的挑战和机遇。随着监管环境的变化和技术的演进,银行需要不断调整和优化其数据治理策略。通过持续的技术创新、灵活的管理策略、积极的人才培养和前瞻性的战略规划,银行将能够在数字化时代中实现可持续的发展,为股东、客户和社会创造更大的价值。
阅读 10