读透数据治理:DGI框架全解

数据智能相依偎 2024-01-27 14:58:20

数据治理的重要性不言而喻,但许多人却难以区分数据治理与数据管理的区别。这是一个严重的问题,因为这两者的使命和价值截然不同。

尽管像DAMA、DCMM和《华为数据之道》这类读物都对数据治理有所论述,但客观来讲,它们在系统化方面仍显不足,更多的是关于数据管理的内容。

以DAMA的经典车轮图为例,数据治理仅占其中一个章节,DAMA的中文翻译也叫数据管理框架,不少人会误将数据治理视为数据管理的一部分。

《华为数据之道》的核心内容位于第二章《建立企业级数据综合治理体系》,专注于数据治理,但该书的其他章节主要讨论的还是数据管理。

我们认为数据治理之所以重要,是因为它涉及数据工作的“道”,相对于数据管理这一“术”的层面。许多公司在数据方面表现不佳,根本问题不在于“术”,而是“道”的层面出现了问题。

例如,自己曾长期负责数据仓库的管理,但常深陷于数据质量的泥潭,通常仓库内的数据质量问题总是可以解决的,但一旦涉及业务源头就很头痛,因为沟通成本太高了。我能做的就是在下游拼命修复和维持。那个时候的我不懂数据治理,也无从谈起用数据治理的手段来解决这种跨部门的问题。

值得注意的是,很多人在日常工作中实际上已经在进行数据治理,却可能并未意识到,这可能会阻碍其做进一步的提升,因为不知其所以然。

例如,公司很早就有负责数据安全的专职部门,但我从未意识到他们做的就是数据治理的工作,导致在建章立制的时候忽视了其参与的重要性。

当我初次接触到DAMA(数据管理协会)时,其关于数据治理的定义让我印象深刻,却又不明觉厉,“数据治理指的是对数据资产进行管理的权力行使、控制和共享决策(包括规划、监测和执行)的活动。”

这种定义比较抽象,对许多人来说晦涩难懂。例如,定义中的“行使权力”、“控制”、“规划”和“执行”等词其实每个都意味深长,如果不进行系统化的阐述,很难让人理解其真实的内涵。

最近几年,我在数据治理方面进行了一些实践,才对数据治理有了进一步的认识。

去年,我撰写了两篇文章《数据治理VS数据管理,ChatGPT用通俗的类比和案例终于讲清楚了本质区别!》和《数据治理的 “独孤九剑”》,分享了我对数据治理的理解。

我还写过两页PPT材料,来向老板解释数据治理到底是什么,如下所示:

但我还是不太满意,因为觉得数据治理这么重要的概念和方法,一定是要系统化阐述的,如果大家对数据治理的概念分辨不清,就无法有效地进行数据治理的交流、切入、改进和变革。

近期偶然的一次机会,我翻了翻DGI(国际数据治理研究所)的数据治理框架,这让我大吃一惊。

尽管DGI早在2004年就已发布,我也略有耳闻,但从未深入研究。也许是因为DAMA影响力大了,DGI被掩盖了,也许是DGI没有中文资料,影响了其普及,又或者是DGI数据治理比较抽象,劝退了很多人,更可能的是,国内真正做数据治理的还不多,DGI无用武之地。

可以这么说,DGI是当前唯一一个系统化诠释数据治理的框架,它用词严谨,内容纯粹。我也看过一些其他介绍DGI数据治理框架的文章,但无论在翻译的严谨度、通俗化、实践性方面都有不足,掩盖了DGI本应有的光芒。

因此我准备写一个系列,向大家全面介绍DGI数据治理框架,除了能地道的翻译出DGI数据治理框架的精髓,我还将结合自己的实践和案例来进一步诠释其内涵。打个比方,DGI现在已经有了骨骼,我要做的就是将血肉补全,让大家读懂DGI。

DGI开篇提出了关于数据治理的六个核心问题,并自问自答,分别是:谁(WHO)、什么(WHAT)、何时(WHEN)、何地(WHERE)、为什么(WHY)和如何(HOW)。我特别喜欢这种开篇方式,因为它能迅速给读者留下关于数据治理的印象。

我将DGI对这些问题的回答和我的解读作为这个系列的首篇文章,希望大家能跟我一起学习。

1、WHO:数据治理与谁有关?

所有对数据的创建、收集、处理、操作、存储、使用和退役感兴趣的个人或团体都应该关注数据治理。这些人被称为数据利益相关者。

通常情况下,数据利益相关者会委托各种IT管理和数据管理团队来执行上述任务。然而,有时这些活动需要通过利益相关者团体按照既定决策过程来决定,这正是数据治理发挥其作用的时刻。

这种决策(及其他相关活动)通常由中央资源来促进和协调。在DGI的数据治理框架中,我们介绍了数据治理办公室(DGO)以及数据管理员在组织中的角色和职责。

接下来,我根据在数据治理过程中的职责和影响范围,对相关的利益相关者进行分类和罗列:

高层管理者

首席数据官(CDO): 负责制定整体数据治理战略和政策。高级管理人员: 如CEO、CIO等,从组织高层的视角监督数据治理。

数据管理类

数据治理办公室(DGO)成员: 负责协调和管理日常数据治理活动。数据管理员: 负责技术管理和维护数据。数据分析师: 利用数据进行分析,支持决策过程。

业务部门类

业务部门领导: 确定业务部门在数据治理中的需求和目标。业务分析师: 理解业务需求,将业务目标转化为数据治理的具体要求。

数据使用者类

数据用户: 日常数据的使用者,例如员工和管理人员等。客户: 作为外部利益相关者,使用组织提供的数据服务。

监管和合规类

合规和风险管理人员: 确保数据治理遵守相关法律、政策和标准。安全专家: 负责维护数据安全性和防止数据泄露。

技术支持类

IT支持人员: 提供技术支持和维护数据系统。

数据质量和元数据管理类

数据质量管理人员: 监控和提升数据质量。元数据管理人员: 管理数据的元数据,确保一致性和可理解性。

举例:

假设一家医院需要决定如何使用和分享其患者的健康数据。这个决策过程就不仅仅是技术问题,还涉及到隐私、合规性、患者权益和数据安全等方面。在这种情况下,数据治理的作用就体现在协调和引导医院管理层、IT部门、医生、护士以及患者代表等多方利益相关者,共同参与决策过程。他们需要一起讨论并决定哪些数据可以被共享,共享的条件是什么,以及如何确保数据的安全和隐私。在这个过程中,每个相关方都可以表达他们的观点和担忧,而最终的决策则是基于共同商定的规则和流程。

2、WHAT:数据治理是什么?

数据治理意味着“对数据相关事务的决策权和权威行使。”更具体地说,数据治理是“一个决策权和信息相关过程的责任制度,根据商定的模型执行,这些模型描述谁可以在何时、在什么情况下、使用什么方法对哪些信息采取什么行动。”

基于这个定义,数据治理的内涵包括五个方面:

建立组织架构明确决策权和责任制定/收集/协调规则监控/执行合规性解决问题

“决策权和责任”的举例:

假设一个公司要决定是否将客户数据共享给第三方广告公司。这个决策涉及到数据的隐私和商业利用。在这里,“决策权”意味着确定谁有权做出这个决定。在数据治理框架中,可能是一个特定的委员会(如数据治理委员会)或特定的高级管理人员(如首席数据官)负责这个决策。他们会评估与数据共享相关的风险、收益和合规性问题,然后做出是否共享数据的决定。

如果公司决定共享数据,那么数据保护和合规性的责任就是一个重要议题。在这种情况下,数据治理团队可能需要确保数据共享过程符合数据保护法规(如欧盟的一般数据保护条例GDPR)。这可能包括确保数据在传输前得到适当的加密,以及确保与第三方签订的合同中包含数据保护的条款。

“制定/收集/协调规则”的举例:

为了保护用户数据,某银行制定了一系列内部数据管理规则。这包括数据加密标准、对敏感信息的访问控制政策、数据存储和备份程序等。例如,它可能规定所有客户数据都必须加密存储,并且只有授权员工才能访问;其次,由于银行在不同国家运营,它需要收集并理解这些国家的数据保护法律,银行需要确保它的操作符合所有这些不同的法律要求,最后,银行需要确保其内部规则与外部法规保持一致。这可能涉及修改内部政策以符合最严格的国际标准,确保全球操作的统一性。例如,如果《数据安全法》要求的数据隐私保护措施比其他国家的法律要求更为严格,银行可能会选择将《数据安全法》的标准作为其全球操作的基准。

“监控/执行合规性”举例:

假设金融服务公司处理大量的个人和交易数据,为了确保遵守《数据安全法》,其需要实施一个数据监控系统,这个系统定期自动检查和分析数据处理活动,以确保所有的数据收集、存储和处理活动都符合《数据安全法》要求,在监控到可能的合规问题时,比如发现某些个人数据没有得到适当的处理,金融服务公司会采取必要的执行措施,这可能包括调查违规情况的原因,采取纠正措施来解决问题,以及必要时向监管机构报告违规情况。此外,公司可能还会定期对员工进行数据保护和合规性培训,确保回到合规状态。

3、WHEN:什么时候组织需要正式的数据治理?

DGI谈到,当以下四种情况之一发生时,组织需要从非正式治理转向正式数据治理:

组织变得如此庞大以至于传统管理无法解决数据相关的跨职能活动。组织的数据系统变得如此复杂以至于传统管理无法解决数据相关的跨职能活动。组织的数据架构师、SOA团队或其他横向聚焦的团队需要跨职能项目的支持,这些项目采用企业(而非孤立)视角来考虑数据关注点和选择。法规、合规性或合同要求正式数据治理。

“组织过于庞大”需要数据治理的举例:

想象一家国际银行,它在全球有数百家分支机构。随着业务扩展到不同国家和地区,它需要处理来自不同分支的各种客户数据、交易数据和合规数据。由于规模庞大,数据在不同部门和地区间的协调变得复杂。因此,银行实施正式的数据治理框架,建立了一个集中的数据管理团队和统一的数据标准,以确保全球范围内的数据一致性和准确性。

“数据系统过于复杂”需要数据治理的举例:

考虑一家拥有多种业务线(如在线零售、数字内容和云计算服务)的大型科技公司。随着业务的发展,公司内部使用了多种不同的数据存储和处理系统。这些系统之间的数据整合变得日益困难,影响了运营效率和客户体验。为此,公司建立了一个统一的数据平台,通过正式的数据治理程序来协调不同系统间的数据流和数据标准。

“跨职能项目”需要数据治理的举例:

一个制造企业正试图通过实施全新的供应链管理系统来提升效率。这个项目需要集成来自财务、采购、生产和物流等多个部门的数据。由于这些部门之前在数据管理上各自为政,导致数据不一致和流程断裂。因此,公司成立了一个由数据架构师和业务分析师组成的跨职能团队,通过正式的数据治理流程确保项目的顺利实施。

“合规性”需要数据治理的举例:

一家全球性制药公司,因为其产品在不同国家销售,需要遵守各地的药品安全和患者隐私相关法规。为了合规,公司不仅需要对患者数据进行安全管理,还必须确保在全球范围内对这些数据的处理遵循严格的标准。因此,公司实施了一个正式的数据治理框架,包括数据加密、访问审计和定期的合规性评估。

因此,如果企业的规模不大,或者复杂度不够高,那么做数据治理的必要性就不会很大。但即使满足了以上所有条件,也不代表企业就能够启动数据治理,因为除了业务需求驱动因素,数据治理还受限于企业一把手的认知、数据文化等诸多因素。

4、WHERE:数据治理由组织中的哪个部门负责?

数据治理职责可能设在业务运营、IT部门、合规与隐私保护部门,或是数据管理部门。关键在于这些部门能否获得领导层的充分支持和数据相关方的配合。

需要指出,将数据治理职责置于应用开发部门,通常会降低成功率。其原因在于开发团队在满足其他利益相关者需求时通常需要做出妥协,难以同时扮演运动员和裁判员的角色。

同样地,归属于项目管理办公室的数据治理项目可能也会受影响。这是因为,负责确保项目按时、预算内完成的项目经理可能会回避揭露需要治理关注的数据问题。

另一方面,若将数据治理职责安置于非开发部门,例如让一个缺乏实际操作经验的纯管理部门负责,可能会因其能力限制导致项目难以实际落地,导致过多的PPT式数据治理。

一种可行的方法是,在开发部门内新增一个二级管理中心,利用原部门的力量实现快速推进。或者更激进地,可以考虑成立一个融合开发和管理人员的新组织。

5、WHY:为何采用正式的数据治理框架?

数据治理框架是指组织中管理数据资产的一系列政策、程序、标准和指标。

框架有助于我们整理和表达复杂或不明确的概念。通过实施正式的数据治理框架,业务、IT、数据管理和合规等各个领域的相关方能够更有效地集思广益,并明确共同的思路和目标。

此外,数据治理框架可帮助管理层和员工做出合适且具有长期影响的决策。它有助于就“决策的决策方式”达成共识,使得规则的制定更高效,确保规则的遵守,并有效处理违规行为、模糊事项和各种问题。

举例:

一家跨国零售企业在全球范围内运营,拥有庞大的客户数据和复杂的供应链管理系统。企业面临的挑战包括数据孤岛、数据质量不一以及跨国合规性问题。该企业成立了一个包括业务、IT、数据管理、法务和合规等部门代表的数据治理委员会。该委员会负责制定统一的数据治理策略和标准;委员会确定了共同的目标,即提高数据的可用性、质量和合规性。为此,他们制定了一系列数据标准和管理流程。委员会还制定了“决策的决策方式”,即如何处理数据相关的决策,包括谁来做决策、如何评估决策的影响,以及如何监控和执行这些决策。

依据此数据治理框架,企业通过跨部门协作,不同领域的专家能够集思广益,形成了统一的数据治理视角;有了清晰的决策框架,管理层和员工在数据相关的问题上做出了更加恰当且具有长远影响的决策。通过有效的规则制定和执行,企业不仅提高了操作效率,还确保了在不同国家的业务符合当地的数据保护法规。

6、HOW:组织如何实施数据治理?

首先,数据治理应由业务需求驱动,以明确工作的重点和方向。

接着,进行价值声明,以界定工作范围并设定具体、可衡量、可实现、相关、时限明确(SMART)的目标,以及成功评估标准和度量指标。

然后,制定一个行动路线图,以便通过该图获得利益相关方的支持。

一旦获得支持,即可开始设计和部署数据治理项目,处理各项数据治理流程,并监控、测量和报告数据、项目及其状态。

数据治理项目通常最初专注于特定问题,之后逐渐扩展范围以涵盖更多关注点。因此,建立数据治理通常是逐步迭代的过程。新的关注领域可能经历上述所有步骤,而已稳定运行的数据治理领域则继续运作。

举例:

这里以一家金融机构为例说明其如何实施数据治理。该机构首先确定数据治理的关键点是提升数据保护水平和确保符合行业法规。接着,他们制定了一份价值声明,比如“通过保证数据安全和合规性来增强客户信任”。然后,他们设定了具体的SMART目标,如在一年内对所有客户数据实现全面加密,并围绕这些目标建立成功评估标准和度量指标。

随后,他们制定了一个行动计划,涉及升级安全系统、定期进行数据审计和对员工进行合规培训等方面。为了获得内部支持,他们向管理层和员工展示计划的好处。在得到支持之后,他们开始部署数据治理项目,这包括加强数据加密措施和监控数据处理流程。项目的最后阶段,他们会定期检查数据的安全性和合规性,以确保达成项目目标。

7、HOW:我们如何评估是否准备好进行数据治理?

这个问题其实是问题3的另一种问法,可以让我们从更多的角度思考当前是否是启动数据治理的合适时机。

即在从当前状态过渡到更正式的数据治理和管理之前,评估组织是否已做好数据治理的准备是非常重要的。为何如此?

因为可能存在合理的理由来解释当前模式的适用性,即存在即合理。同样,也可能有充分的理由表明,变更可能对企业、特定项目或个人的职业生涯产生负面影响,一些警示信号包括:

业务部门拒绝参与数据治理领导层不支持数据治理工作在必须由组织高层决策和制定规则的情况下,选择实施自下而上的程序授权一个团队(外包商、合作伙伴或团队)负责数据相关工作的数据决策,而这个团队在以下情况下可能不会受益:考虑到整个企业的视角。让数据利益相关者参与其中。纠正数据问题。承认数据问题存在。

大量的数据治理项目由于业务部门不配合、数据治理团队未主动争取获得领导层支持或者利益问题而导致失败,下面是两个典型失败案例:

案例1:

某公司采购物资在入库的时候靠人工录入物资信息,错漏录入的情况时有发生,公司数据治理团队认为这会导致严重的账实不一致,从而带来经营风险。因此数据治理团队试图实施一个数据治理项目,希望通过优化物资录入流程来解决问题,比如采取扫码等形式提高物资信息的录入质量,然而,业务团队视数据治理为额外的负担,并认为它会干扰他们的日常工作,拒绝参与项目的规划和实施阶段,也不愿意适应新的数据处理规则和流程,最终该项目因为缺乏跨部门协作和支持而失败。

案例2:

一家制造企业将数据治理项目委托给其IT部门,目标是提升数据质量和运营效率。IT部门实施了更新数据存储系统和优化数据处理流程等措施。但在项目执行中,出现了数据不一致和错误的问题。

在这种情况下,IT部门可能不愿承认存在数据问题,因为这可能意味着他们的工作存在缺陷或项目管理不当。他们可能会选择忽略这些问题,或把问题归咎于用户输入错误或过时的硬件等外部因素。由于没有及时识别和处理这些数据问题,这些问题最终影响了整个公司的数据质量和决策效率。

该案例中,体现了做数据治理的团队既做治理又做运营的风险,可能的情况下,还是要把运动员和裁判员的职责分开。

8、加分问题:数据治理中最常被忽视的方面是什么?

数据治理工作中最容易被忽视的方面是直接处理数据相关问题和决策的员工的沟通能力。这些员工需要能够清晰地表达各方利益相关者的需求和担忧,并通过多种沟通方式和媒介有效地传达信息。

由于这些员工往往缺乏写作或公共演讲经验,他们需要掌握针对数据领域的特定沟通技巧,制定沟通计划,并创建电子邮件模板,确保所有利益相关者及时、有序地接收必要信息,以避免潜在的政治问题。

DGI强调沟通能力的重要性,这一点我非常认同:

首先,数据治理的定义是“对数据相关事务的决策权和权威行使”,这本身就蕴含强烈的沟通特质。如果你的日常工作不涉及沟通,那么它可能与决策和权威行使无关,也就不属于治理工作。

其次,启动数据治理的动因常在于“组织规模庞大到使得传统管理无法解决数据相关的跨职能活动”。横向协调工作越多,就越需要清晰有效的沟通。数据治理团队尤其需要像“外交部长”这样的人物。

第三,根据我的经验,数据治理的前期约80%的时间花在沟通和汇报上。但值得注意的是,不仅员工需要具备沟通能力和意识,管理者自身更需以身作则,身体力行。

关于这八个问题的回答就好比是学习DGI数据治理的开胃菜,在下一篇中,我将解读DGI数据治理框架涉及的基本概念,这不仅是理解DGI数据治理框架的前提,也是深入理解数据治理的关键。

0 阅读:0

数据智能相依偎

简介:感谢大家的关注