每个组织都应收藏的数据价值创造方法论

行至第九个年头,德拓将继续充当着数据创新者的角色,在“让数据更具价值”的成公司战略和使命指引下,通过众多行业的实践和落地,不断积极探索“数据价值”创造方法论。

德拓,让数据更具价值

作为数据创新领导者,在2019的“数据创新在中国大会hello Data”上 ,德拓就协同众多数据智能领域创新企业和组织,分享了大量数据创新实践,让有志于数据价值创造的客户可以辨明方向、掌握方法、精准投入。

陈春花说到,在一切转换为数据时,数据就是洞察,数据的洞察使整个商业环节完全改变,数据在驱动整个价值传递。

张弓说,大数据在农业领域大有可为,通过大数据,可以使得各级政府心中有数,做到知数而管”

季昕华表示,让数据产生价值,让数据在同一个组织,在不同公司,在不同省份,不同国家流通起来,就是安全屋的梦想和希望。

汪冠春说,人工智能正在做的,是指引企业主如何重构组织,真人员工如何在组织中实现个人不可替代的价值。

桑文锋认为,数据的价值核心就是两个方面,一个方面是用量支持业务决策,另外一个就是让产品更加智能。

今年,突如其来的疫情导致2020年的“Hello Data”盛会暂停举办,但分享不应暂停。因为过去的一年,全市场对于大数据、人工智能的关注度持续攀升,数字化、数据化能力成为了每个组织增长及提效的必然路径,而德拓信息越来越大范围的跨行业落地实践,无疑为此做了注脚。同时,我们也注意到,除了技术本身的发展演进外,市场上对于融合数据价值有了全新的认识,不再是简单的数据归集和展示,而是向着数据分析挖掘、数据业务流程再造、数据中台能力提升的多个方向进化,涌现出了一大批帮助客户实践数据智能的创业团队。特别是,所有的数据领域从业者都在思考,我们的数据价值创新能否有一套行之有效的标准路径可以借鉴,从而降低创新成本,更高效的建立组织数据化能力。德拓也是其中一员,我们愿意将我们所参与的、感受的和思考的进行总结和分享,让更多人和组织能够体验到数据之美,进而有动力去实现“让数据更具价值”!

德拓信息(DATA+ATOM=DATATOM)一向认为数据是信息社会最小粒度单元,正如原子是物理世界的基础单元一样,我们要理解数据对信息社会的解构,可以把目光转向物理世界的组成,两者是同样的道理。大千世界之所以广阔无限、无所不奇、引人入胜,正是源自原子的多样性,各样的元素通过原子级别的组合,成了这个世界的万物。难以想像一元原子的世界如何承载我们多元的社会,更无法实现社会进步的多元价值。数据价值也要回归到多元价值的融合上来,大数据最早的四个V定义中就有Variety(多样化)。在实践中我们特别强调融合更多数据,这种更多数据并非单纯指数据体量,而是指数据的维度。所以,数据维度的几许决定了价值的多寡,而数据体量的大小决定了价值的深浅。

如果已经拥有了多元数据,又需要通过什么样的路径和方法能把数据和价值加上等号?

我们认为同样可以从物理世界中的规律中找到答案。在物理反应中,核聚变和核裂变过程,会有大量能量瞬间被释放出来,这种能量的聚合、释放和数据价值的创造过程有着非常奇妙的一致。我们将数据工程看成一次“聚变”过程,而业务创新看成一次“裂变”过程,其不断的往复就形成数据驱动下的业务创新,其价值也就没有边界。

数据工程的聚变——生成高质量数据资产

广义的“数据工程”是指面向不同计算平台和应用环境,使用信息系统设计、开发和评价的工程化技术和方法。我们这里指的是狭义上的“数据工程”,将多元数据从分散的各个来源进行归集、治理、建模的技术和方法。

信息化的大发展,导致了信息系统产生的数据爆炸式增长,分散在各个信息化系统、感知终端,这些数据,就算我们及时、有效的归集在一起,也只能算作组织的数据资源,“数据质量低下”、“数据组织混乱”的现状,使得我们必须将其经过有效的治理,才能发挥真正的价值;必须通过「工具平台」+「范式流程」来持续有效的将数据聚合、治理,形成组织可用的数据资产,这也是当前行业内流行的“数据中台”的主要能力。

成本领先的工具平台

生产工具的先进性必须贴合生产要素本身的场景需求,数据工具的先进性也必须来源于数据本身建设场景的需求,而非单一的技术能力体现。

数据作为全新生产要素,其生产工具也必须脱离单一的技术属性和组件化属性,需要回归到目前实际的数据场景提供一体化的工具能力,唯一的评估标准只有是否能用、好用和成本领先。市面上的数据工具两级分化,一类过度重视技术的优化而忽略了便捷、高效的工具本身属性,另一类过度产品化,只为客户买单增加了许多不必要的功能,往往固化了解决问题的能力广度。

经过这么多年的实践,德拓推出的平台工具Dana Family从项目中来到项目中去,已经演进到V4.6的版本,每次版本的规划和迭代都向着如何让数据工程更有效率的方向进展,内置智能和高性能的技术,又可以面向多变的交付场景提供通用的工具化能力。我们会时刻关注在做标准数据工程中所要花费的人力投入,包括让更低水平的工程师可用、让交付周期变得更短。

到今天,利用DanaStudio来完成数据工程已经成为了一件简单的事情,不仅可以按照工具指导的方式进行多元数据的归集(离线、实时)、治理工作及任务调度、形成资产并开放使用,还可以通过工具可以让更多人在一套体系架构下完成整体的数据工程工作,从而大大压缩了交付时间、量化了交付质量、升华了数据资产,在综合成本上已经大幅领先传统数据工程工具。

我们认为,综合成本将是未来工具平台的核心竞争力。

行业特征的范式流程

一旦我们有了良好的工具平台辅助,启动数据工程后,标准化的就变得异常重要。在公安、政务、金融、教育、商业、媒体,不同的领域都有相应的规范,包括元数据标准、数据治理规范、主题专题模型规范等等。而能够将其沉淀为组织知识,并赋能给数据工程实施人员将是数据工程能力优劣的重要评估依据。

在德拓,基于参与的众多数据工程项目,我们不仅完成了多个行业规范的治理流程,也不断实践着地区标准规范和企业规范标准的落地,这是因为在很多领域国家及行业并没有明确的标准规范,那么就需要根据每个组织特点来制定标准体系。例如,在政务大数据领域因为涉及的委办局非常多,数据标准也多,跨行业的标准规范在国家层面并没有明确的定义,只是针对对于全国均有应用的数据提出了部分标准(例如疫情码)。所以,德拓参与的上海大数据中心数据工程,就必须与客户一起,参与标准规范的定义,帮助上海提出一套行之有效的跨领域的数据治理标准,帮助到所有参与者能够统一思想、统一要求、统一动作,最终得到有质量的数据资产。

基于这样的标准,还必须要形成标准的流程规范,才能指导每步工作最精准的实施,这就是数据工程的范式流程,因为它可以指导我们对标标准不走样,而这样的能力只能在实践中通过组织沉淀来打造。

形成有效的数据资产

当我们通过“工具平台”和“范式流程”完成了组织的数据工程工作,那么就形成了组织的数据资产,数据资源到数据资产是一个量变到质变的过程,提升了数据质量、摒弃了数据垃圾、提升了数据价值。如果没有有效的数据资产,空谈数据驱动的业务创新就只是一句口号,也很难将创新持续化。

数据资产管理理论在业界已经非常成熟,无论是DAMA还是Gartner都提出了相应的数据资产管理架构,简单来说,数据资产就是能够被随时找到并使用的有效数据资源。如何评估组织是否已经拥有了数据资产,可以从以下几个维度来看:

1)是否建立了数据地图,可以实现全景数据的展现和跟踪;

2)是否实现数据自动化治理的能力,可以保证数据生产的持续化和智能化;

3)是否提供了数据安全架构,可以保证数据在生产、管理、使用不同场景都做到安全管控;

4)是否完成了元数据统一管理中心,可以从根本上对数据进行全生命周期管理;

5)是否确立了质量管理体系,可以确保数据鲜活及高质量;

6)是否形成了编目信息管理,可以针对数据资产进行有效的共享和交换。

如果组织已经拥有了数据资产,那么在业务创新上就有了基石。

业务创新的裂变——数据为核心驱动价值

虽然,我们已经拥有了数据资产,但是很多时候,我们的数据资产是否有效,必须通过业务使用来证明和优化。除了传统意义上数据对组织业务的支撑外,不断通过数据实现业务创新才是对数据价值的展现,也是组织通过云计算、大数据、人工智能的投入和实践成为数字化组织的根本目的。利用数据资产实现业务创新就只有不断“试错”,通过试错找到真正的价值点,推动组织变革。

有价值的“试错迭代”

人类达到目的地有两种方法:“地图模式”和“指南针模式”,地图模式依靠明确的指引,按图索骥;指南针模式依靠线索和大方向,试错前行。去往旧大陆靠地图,抵达新大陆靠指南针,千百年以来都是达到的范式方法。而从当下开始,未来世界不可避免进入不确定的常态,再也没有旧大陆,所有目的地都成了新大陆。组织要对抗当下不确定性的VUKA时代(Volatile不稳定、Uncertain不确定、Complex复杂和Ambiguous模糊),就必须依据环境进行有效创新,组织战略意图就是指南针、数据资产则是创新的新武器。

对于试错来说,通常我们会认为有个“334”法则,也就是说,30%的创新来自于德拓原有实践成果上的再创新,这是一种微迭代;30%的创新来自于客户的思考,把想做但没有实现的业务通过试错来落地;最后40%的创新是双方之前都没有实践和想到的,而是通过战略牵引不断试错迭代的结果,当然,所有的业务创新不能偏离指引,也就是客户战略目的。同时,我们也特别在意“业务专家”的参与,只有通过业务专家评估实践成果的价值,才能确保创新的有效性,业务专家价值评估不过关就需要再迭代,知道价值真正落地。

通过试错迭代,我们就会有两个价值得到,“新洞察”和“新场景”。

用“新洞察”提升组织能力

“数据即洞察”,陈春花老师在“2019数据创新在中国大会”上说的这句话,正是数据的核心价值。数据是真实世界的映射,通过大量数据的分析计算,可以得出过去历史的规律、当下运行的现状和未来发展的趋势。数据在洞察上的价值很早就在BI(商业智能)上落地实现了,到今天我们所提出的新洞察是基于更大规模的数据融合计算,通过AI等新的模型算法去发现更准确的洞察、更深度的洞察。

正如我们为某省12345提供的智能分析,利用市民热线数据资产,结合NLP技术和机器学习,能够从数千万民意中找到“热点问题”、“集中问题”、“重点问题”,形成数据支撑的专报汇报,供省领导及相关部门第一时间掌握并推动问题及时解决,再也不是依靠人工去低效发现,而是依靠机器高效洞察。还有在某金融客户的数据中台项目中,不断在已有的数据资产上提供新的模型及可视化决策,今天客户单位70%的人员每天都在使用这些数据模型的洞察来掌控业务,发现新的机会点和风险点。

这些组织能力,在没有数据驱动业务创新之前都并不被掌握,所以数据新洞察是否有效,标准就是“是否完成了从未知到已知”的能力建设。

用“新场景”实现业务创新

另外一个得到是新场景,和新洞察的区别在于洞察是业务结论,场景是业务结果。新场景不会单纯停留在分析和认知上,而是将数据赋能业务,改造现有业务流程,实现新的业务场景。传统的组织流程再造通常利用累积经验、顾问辅导,这种模式往往要花费数年的时间来确认,无误才能行动,而数据驱动的流程再造只需要通过快速的数据分析和模拟,就可以精准的预测结果,并可以通过数据不断修、改进,取得业务流程综合效率最大化,这无疑是一种革命。

用“疫情码”的一码通行落地更多的便民服务、用“数据装备”武装警务人员和派出所、用“AI分析”来帮助海关降低关税风险、用“外部数据”来帮助产业经济分析和政策决策、用“效能评估”帮助轨道交通人员工作效能的提升……。这些都是新时代我们在数据驱动下的新场景,真正帮助了各个行业在更高效率、更好质量、更小成本、更低风险下实现的业务增长,及时的应对社会需求的变化。

我们看到,新场景是没有数量限制的,同样的数据在不同的战略意图、不同的服务对象下可以有不同应用场景,也就意味着数据驱动下的创新也是没有尽头的。

无限循环的数据驱动

             ——持续让数据更具价值

数据从业务中来,回到业务中去,利用业务创新,我们可以得到新数据,这些数据虽然散落在洞察和场景之中,但再次使用数据工程的逻辑就可以将新数据加工为新的数据资产,叠加原有资产,就又可以再次进行业务创新。就如同太极的两个部分,数据工程与业务创新,相互促进,不断循环,彼此生长,形成了无限循环的数据驱动能力。

这种无限循环的数据驱动能力就是组织数字化转型的价值基础和核心竞争力。