一次深度解构“数据治理”的对谈:跳出“治理”看“治理”


2023年1月4日,为进一步赋能数据要素价值释放,加强数据资产行业交流合作,由中国信息通信研究院、中国通信标准化协会指导,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)主办的第五届数据资产管理大会在线上召开


本届大会设置圆桌论坛环节,以“跳出‘治理’看‘治理’”为主题,由中国信息通信研究院云计算与大数据研究所副所长魏凯主持,中国移动信息技术中心技术创新学部主任首席大数据架构师尚晶、建设银行数据管理部资深副经理谢坤、北控水务总裁助理兼数字化研究院院长贾丕星、Datablau(数语科技)创始人兼CEO王琤共同展开精彩研讨。


Q1:如何理解“跳出‘治理’看‘治理’”?





尚晶



第一,跳出治理看“本质”。数据治理的根本是改善数据生产关系,提升数据生产力,从而能够释放数据的能量。数据生产关系包括数据提供者、使用者、惠及者、开发者、应用者、运维者、管理者等多种角色,他们之间要协同配合。数据生产力是数据要素的能量在内外部的业务生产过程中和各个要素进行作用,然后释放出来。体现在数据治理上就是通过数据标准、数据质量等工作,结合数据工具,提升数据全链路生产效率。所以数据治理的本质目标就是在不断变化的数字化转型的新趋势下,形成一种动态平衡,最适应数据要素生产的生产关系,支撑强大的数据生产力。第二,跳出治理看“价值”。数据价值越高,治理的价值就越高;治理做得越好,数据价值就能够发挥得越好。在数据成为一种重要生产要素,数字经济成为经济高质量发展新引擎的情况下,业务的发展离不开数据,关注业务就会关注价值,就必须离不开数据治理。第三,跳出治理看“变化”。数据治理这些年已经从幕后走向台前,治理已经不是企业内部的规定,伴随着生态的发展和生态之间各方的连接,成为行业共识、标准和规范的操作流程,成为行业新的连接点。数据治理已经不是在后台运行的一项工作、一个工具,它更加成为一种服务能力,一种技术需求,还有一种理论体系。





谢坤



第一,想要数据真正发挥价值的作用,从业务角度来看,数据首先要可用数据质量是非常关键的如何做到可用?就需对它进行治理,推动数据走向有序治理。第二,数据在可用的基础上,数据能用用数据要合规合法。这涉及到企业的法务和合规部门的审查,更需要得到数据主体的授权,保护好数据主体的合法利益。第三,怎么保证它发挥价值数据最核心的是让它产生价值,能对我们的业务有所推动。这就是让数据回归到业务中,支撑业务为企业、为数据主体、为社会创造价值,让企业、数据主体、社会都从数据中受益。这是企业文化,大家没有这个意识、没有这个文化,要让它发挥价值也是会大打折扣的。跳出治理看治理,首先是顶层,一定要坚决有力推动。二是要有推动落实的机制,保证数据管理、数据治理的责任能落地。三是要有一些监测或者评价的技术方法,或者是指标,来去保证数据能发挥作用。





贾丕星



我觉得从数据治理的角度来讲,核心解决好两方面的问题,一方面是标准,另一方面最终我们要解决的问题是经由数据治理创造价值。标准是依托什么?其实所有的数据标准就是业务标准,如果一个企业,没有系统间的衔接,没有流程侧的打通,它就没有必要去制定数据标准。标准的核心就是回归业务。举一个例子,比如我们说要管好设备的主数据标准,其实我们从产品设计的战略寻源,到整个产品实施过程中的交付采购集成,这个设备安装好,包括它后面的维护、保养、维修、大修、重置等等,其实都是基于这个设备开展的。但是以前就是各自为政。当所有部门基于企业的战略协同下,需要做业务流程再造的情况下,需要部门之间打通部门墙、打破部门壁垒,去业务协同的情况下,大家就意识到我们原来从战略寻源到集成供应、到后面的维修保养,全流程需要拉通看问题,因此大家就可以把标准制定出来,达成共识,然后在系统里面再应用。治理是干什么?如果数据不需要释放价值,无论是它的内部价值还是外部价值,实际上我们就不用治理,治理的前提是数据要创造价值。还是举刚才的例子,我们说到企业要降本增效,我们关注设备的时候,关注到的是设备的全生命周期管理,要从它的采购成本、安装成本到它的运行成本和维修保养成本,total cost去关注设备成本的时候,我们就知道原来制定了设备的标准,然后所有作业过程中沉淀的有效数据,这些有效数据不好的经由治理把它变成好的,就能算出来total cost,基于total cost去量化价值,关注到员工绩效的诉求,因此我们就有了治理的目标。前置性关注标准、后置性关注治理,前置性锚定业务、后置性锚定价值。跳出治理看治理,我们先得理顺它的业务和价值逻辑,我们就能做好数据治理。





王琤



我们现在正在做年底总结,统计了一下今年整体的情况。我们大概接触了300家客户,国内企业对数据治理的认知、发展其实是挺不均衡的,各个发展阶段的企业都有。我想从各个发展阶段的这些企业的角度谈谈“跳出治理看治理”。最狭义或者最原始的数据治理,现在常常被认为是“洗”数据这样的工作,我们先跳出“洗”数据。这个事不是头痛医头、脚痛医脚的事,其实是一个体系性的工作,跟做项目管理其实是一样的,有风险、成本,做DCMM有相应的KA知识域,体系性的方式构建起来,我觉得这个最狭义、最原始的是数据治理往体系性发展的阶段。从体系性的阶段再往后就涉及到企业的文化、人才的培养,包括数据决策的文化。管理层其实更多关注经营结果,同时关注经营结果的影响因素,利用这种像PDC、平衡积分卡这样的一些工具进行科学决策,从运营层面就是从统计分析、预测、流程优化,包括数据挖掘、数据应用的场景,我觉得最终从“洗”数据到数据治理的这种体系性的建设,再到数据治理的文化,是我对“跳出数据看治理”路径的理解


Q2.1:基于业务价值引导数据治理建设的观点,建行有哪些经验分享?





谢坤



跟大家分享两个例子,第一个是我们在发展普惠金融业务的时候,如何把数据治理跟业务发展结合。自十八大以来,建行积极响应中央号召,提出普惠金融战略。普惠金融的特点是小、散、灵,管理比较困难,而且金额比较小,数据、财务报表等都不是很健全,实施有难点。我们结合数据治理实践,内部和外部数据相结合:一方面通过制定小微企业数据的相关数据标准,在我们的系统里面落地,确定关键数据的可信数据源,并将散落在各个业务系统里面的资金结算、交易流水、存款投资等等各类数据整合汇聚在一起。另一方面,对接政府、外部的相关数据平台,利用人民银行的征信数据,还有税务、工商、海关等等政府公共数据补充数据的缺失和提升数据质量,研发更完整、更真实的数据评分模型,更全面地了解小微企业的信用情况、风险管控情况。为小微企业提供以融资为中心的全方位金融服务,成功地开拓了普惠金融业务的新天地。第二个是我们解决业务痛点当中的数据治理的情况。人民银行要求商业银行在开展经营活动中,要开展尽职调查,对企事业客户要求提供相应要素,并加大对数据缺失的处罚。为了配合人民银行的监管要求,我们开展了针对这些客户要素不完整的治理工作,来提升要素的准确性和完整性。刚开始要素的准确率80%都达不到,现在经过治理以后,基本上达到99%以上,这也是数据治理带给我们业务发展非常好的经验。数据是业务处理当中产生的,肯定是满足了当时局部业务处理的需要,而现在需要治理,也因为从企业的另一个视角来使用数据的时候,出现了一些问题。在引导数据治理的过程当中一定要坚持从企业级的全局视角出发,来查找问题的根源,从根源进行治理,避免头痛医头、脚痛医脚的局面。


Q2.2:企业在做数据治理的时候,数据标准或者说以业务视角切入的业务标准,能发挥什么样的作用?我们怎么在企业里贯彻标准化驱动的数据治理理念?





贾丕星



第一,认知很重要。数据回归到业务和价值角度看问题,首先是战略层面的认知,让业务部门有认知其实是企业的战略共识。所有人都认为这件事情重要,才能够系统性地开展工作。第二,回归到数据治理是数据团队为业务提供服务的机制上去探讨。在这个机制上,其实我们只有打造了有效的机制,才能更好地服务于业务,这个机制是什么?如果它符合服务化的本质的话,我觉得还是看三个词,一个是服务化,一个是流程化,一个是工具化。数据治理团队尽量要打造这三方面的东西,然后才能更好地服务于业务,让业务能够使用到数据团队提供的数据治理服务。第三,我们要唤醒的是业务自身做好数据标准,坚持落实数据标准,以及愿意持续不断配合做数据治理的主观意识。在这个主观意识里面,其实他并不了解这个领域所谓的方法或者工具,所以最好是把它工具化、流程化、标准化,然后赋能、服务、配合业务做这件事情。简单来说就是,意识唤醒是企业级的责任,能不能打造服务化能力是数据团队的责任,持续输出服务是服务于业务,让业务把数据治理变成自主意识的过程。


Q2.3:数据治理有很多技术性工作,所谓的“下水道”工程非常多,数据标准是,可能更重要的还有数据模型。类似数据建模这样的基础性工作,如何让大家的意识能够觉醒,更好地推进?





王琤



归根结底,我觉得数据治理、模型管控工作其实背后是有一个工程文化,就跟咱们做建筑工程一样,我们做建筑工程都是先找建筑规划院,设计完了以后再施工,且越复杂的建筑越需要重视它的设计。数据其实也一样,把数据架构、数据模型设计好肯定是最重要的。现在的企业业务架构、业务流程、业务对象、业务属性复杂,把数据模型设计做到标准化、规范化,要看当前数据模型的业务的合理性,跟企业架构能形成一个整体,最终把业务架构和数据架构打通,形成企业数字化转型的基座。在各个行业里面的头部企业基本都已经落地了,要具体到一个术的层面上,还有一些更具体的,比如说跟DataOps业务开发、系统开发要做一个打通,跟它的CICD持续集成,这些东西其实都要做一个打通,形成比较好的效果。从宏观上来讲,关键还是基础性工作怎么在全行业落地的问题。最近大家讨论比较热的就是“数据二十条”的提出,相信数据基础性的工作肯定会得到越来越多的重视。


Q2.4:新兴技术如何帮助我们更好的完成数据治理工作?技术在数据治理中将发挥什么样的作用,有什么样的趋势?





尚晶



关于技术和数据治理的关系,我从两个方面讲。第一,技术之于数据治理不一定是完全正向的,现有数据治理手段不能很好的支持新技术,就会带来比较大的后治理成本。比如说数据湖能够存储、转换,还有集成结构化和非结构化的数据,更好融合不同种类数据,而且面向更多的用户开放,使数据开发更加民主化,这是它好的一方面。但也对数据治理框架的健壮性提出了更高要求,需要考虑海量非结构化数据以流、批式等方式贯入系统时治理效率和处理效率如何兼顾,如推进湖仓一体技术演进,以及需要考虑多方参与开发下的模型管理,以避免数据湖成为数据沼泽,尽量减少由于技术发展带来新的一些数据问题。第二新技术为数据治理带来新手段,推动数据治理提质提效,数据治理的自动驾驶将会成为一种新的现实。企业数据环境复杂的今天,数据治理的课题变得非常庞大。数万、数十万的数据实体可能大量存在。前面提到,各行业、各企业治理差别非常大,很难有统一规则去管理,这些复杂性导致原来传统人工数据治理方式不再有效,所以需要用知识图谱、机器学习等自动化、智能化的方式,以技术的同步升级应对。总体来说,制度化技术和数据治理实际上可以众生和融合的,也是互相促进的,从“人”治到“智”治,是数据治理的大势所趋。


Q3:随着中共中央、国务院《关于构建数据基础制度更好发挥数据要素作用的意见》、财政部《企业数据资源相关会计处理暂行规定(征求意见稿)》等重要文件的印发,社会空前重视数据治理工作,数据治理在数字经济发展中的地位越来越高。在这样的背景下,2023年,所有从事数据治理行业的专家应该关注什么样的趋势?





谢坤



2023年对数据治理界也是非常重要的一年,可以称为元年。“数据二十条”发布,提出了根据数据来源和数据生成的特征,分别界定数据生产流通使用过程当中参与方享有的合法权利,建立数据资源持有权,数据加工使用权和数据产品经营权三权分治的数据产权模式框架。从顶层设计制度产权、核算、价值评估等方面,为我们在数据治理、数据耕耘里面提供了一个制度、政策性依据。在这个框架下,政府、企业和个人在内的多元主体参与到数据要素治理当中,因此数据治理工作会从组织机构内部拓展到外部,内外联合协同治理,在这一协同过程中,如何明确各方主体责任和义务,规范数据要素市场发展的秩序,也将会成为摆在政府、企业、社会面前的新挑战。





尚晶



数据要素会进一步解放生产力,通过数据治理工作,推动组织形式和协作方式的变革,使得生产力和生产关系不断优化。一是组织结构和专业岗位会有一些层级划分。从社会上来看,大数据局、大数据中心、交易市场将逐步成为政府社会一些常设机构。企业内部,像数据治理委员会、数据部门,也会更加发挥在数据生产和价值赋能方面的主导作用。一些专业的数据岗位会围绕着数据要素专业应运而生,比如数据架构的首席架构师、数据科学家、治理工程师。新的组织和岗位如何融入到现有组织结构中去?怎么提升整个数据治理效能,可能是企业建好大数据、管好大数据、用好大数据的一个重要课题。二是虚拟化工作方式会出现,代替传统的工作方式。随着数据治理的深入,它更加网格化,覆盖性非常强。就像人体的毛细血管一样去存在,形成一种纵深、全面共治的特点。这个过程中,生产关系也从原来以管理为主、管理驱动,会存在无隶属的混搭风格,业务、技术、管理、规划、服务多重人员会以数据生产单元的组织方式建立一种新的虚拟化的工作方式。但这种工作方式一定是常态化的,才能保证治理工作的敏捷和灵活化。在虚拟化组织里面,各方权利如何明确,如何驱动创新和成长,如何兼顾公平、效益和激励,建立一些可量化的、可标准化的统一愿景、使命,也是数据治理工作开展中新的课题。





贾丕星



我认为政策的出台,第一,重要,因为是基于数字经济在未来国民经济发展的重要性,凸现了数据作为要素的重要性。第二,就绪,既然出台一系列的制度,叫资产,想量化它的价值,前提是先确权,我认为核心关键词是有序。大家在数据领域都是老兵,数据市场经历了从泛滥到治理,治理的后续就是有序可持续发展的目标。基于这样的政策导向,在我的实践来看,这个领域里面技术在不断迭代进步,但是从数据治理的根儿上来讲还是属于“下水道”工程,特别辛苦的在做底层治理工作。这个工作长远来看非常创造价值,但是短期来看,大家对它的价值量还是有限的。谁愿意投入做基础性、长远性的工作,还是愿意做短期的工作,大家心里都有杆称。在这种政策导向下和基于数据治理工作基础性现状情况下,无论从企业级治理,还是社会级,要形成对要素认知和有效运作机制的话,脱离不了组织责任的落实和制度流程的建设。企业内部还好一些,如果想打通边界,有效协同,把数据作为要素在市场里面真正盘活,我们缺了太多组织责任在里面,比如说在公共领域,产业行业治理领域,在区域领域,在国家有效政策出台的情况下,下一步还是构建有效的机制。落实主体责任和机制过程中千万要注意一点,前面泛滥阶段不要特别市场化为导向,数据如何创造市场价值,要回归到治理领域发挥很多基础优势。我的理解就是建议政策非常向好的导向性情况下,关注它未来长效市场化的价值,更要关注所谓治理责任的落实,它是一种偏政策、行政和公益属性的落实。落实组织责任才能保障有效政策体系的往下传达,让数据市场、要素市场逐步回归正常。





王琤



数据治理本身还是回归到工程性的工作,不管是刚才谈数据要素的价值评估,还是数据安全的合规,这些工作都是基于元数据,有了数据标准,把数据认责,做了数据盘点、数据分类分级基础上,基础要打扎实,空间还是挺大的。我个人还是更看好一些新型数据架构,像主动元数据,相对来说和被动元数据有很大的差异,像传统元数据采集之后,更多的是被搜索、查询,其实本身元数据可以再进行深度挖掘的。基于这些关联度线索的价值推荐,提高数据可信度,进一步支撑数据开发、数据编排,可能是比较扎实的方式。同时像DataMesh最近也比较热,这个更多的是业务部门驱动,这也是咨询公司提出的,更接近方法论。这样各个部门自行做数据治理,之后发布数据产品,以数据产品在企业部门之间做共享。但我觉得国内当前大多数企业离DataMesh这路还挺长。尤其业务部门对数据重要性认知程度、数据价值的认知程度,都比较弱,让他真正拿出预算做数据治理还是很难的,被动配合或者主动配合已经是很不错的状态了。更贴合国内建设的思路,基于强管控、大集中,把关联关系梳理清楚,把被动元数据转换成主动元数据,进而在基础扎实情况下去做相应的数据资产价值评估,这可能是我当前觉得从数据治理作为工程的角度上更可期的一个目标和方向。


Q4:请提出一个数据治理的趋势性关键词。





尚晶



数据民主化。数据民主化是让一个组织中所有人都可以无障碍访问所需要的数据,使每个人都能够随时随地基于数据做决策,而不会受到限制。在这个过程中,不管今天所讨论的技术也好,该是管理也好,都不应该是阻碍和壁垒,都需要和我们同向而行。放眼未来,数据要素一定会像水电一样,融入大家的生产和生活中,能成为随用随取,发挥价值的模式。每个人如果能够随意使用数据,就意味着数据价值更大规模、无限释放,带来更大的数据价值。同步会带着数据治理概念外延不断延伸。

    




谢坤



治理服务。我们在数据服务过程当中,把数据治理好,能让数据管理责任、数据治理责任、职责落地,能落到实处,让数据在业务管理和业务发展当中真正起到驱动作用,这样也是让数据管理部门和业务发展部门成为合作伙伴。实际上就是我们在服务过程当中,通过治理把桥梁、纽带连接起来,真正发挥数据治理的作用。

    




贾丕星



数据治理可持续发展。我们看到很多宏观领域的治理,无论是全球气候、生物多样性,最终回归到一个词就是可持续发展。将数据作为一个市场看待,也是任重道远,希望它可持续发展。在这个领域,我们看到它融合理念,融合国家的方针政策和制度,融合组织在里面的责任,融合工具与技术,是一个非常完整的有机体。基于可持续发展,任何一个可持续发展的领域都应该有一套非常完整的框架理论,我们要强化这个框架理论不断做迭代升级,要强化DCMM在企业或者行业里面的含金量,这样企业才会重视,才有产业政策能够推动实体端真正展开有效的数据治理,构建可持续发展的机制。





王琤



数据服务的SLA,即数据服务的水平协议体系。我认为数据部门考虑发布一个SLA的承诺,给数据需求对应的业务部门。像华为,提了“三个一”,针对数据服务的SLA,已经发布的数据服务场景,从数据消费者提出这个需求,到获取到这个数据服务,承诺一天,进到中台底座,当前还没有发布数据服务的场景,承诺一周。对于已经结构化了,但还没有进到底座的数据,把数据服务满足是一个月内。一天、一周、一个月,所以提了“三个一”。数据治理工程价值最终还是一个核心:应该从数据服务的效率,数据可信的角度,最终进行体现。

来源:CCSA TC601


最近更新于 2023-04-16 孜孜不倦2023-03-12 发布, 已阅 659 次。