当前,大数据作为未来新能源的定位,已经上升至到国家战略,习大大更是提出了『运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生等五项工作部署』,从企业试点到行业布局,再到今天城市级大数据的工作陆续开展,大数据的时代进入到了一个新的价值层次和建设难度——城市治理。
大数据能否在城市治理中提供切实有效的价值?
能否在城市升级改造中作为核心能源驱动城市发展新模式?
数据能否有效归集和治理?
是为关键。
标准先行,难以落地
传统企业数据治理强调标准先行。先梳理起数据中心建设的主题规范和明细标准,这些从企业的规模和业务协作程度上,都很好实现。但在城市大数据的当前阶段,整个城市的数据标准、建设标准很难像这样理想化的去百分百梳理清楚并推动。
原因在于,第一,城市级大数据和企业大数据状况差异化较大,各委办局的业务流程、建设成熟度、数据实时性、数据质量、对接方式等维度都不尽而同;第二,另一方面来讲各业务都有自己一套相关的数据建模、工程建设标准,都已经运用多年并形成一定的业务沉淀。
但作为城市级的大数据中心,所形成的的数据标准必将是站在城市治理角度一套新的标准,是面向城市治理和发展的一套有效指导标准和建设规范。很多委办的标准是无法直接参考使用的,只有一些基本的数据编目是可以参考业务属性,进行简单标准化。
而面向城市数据中心的大数据标准是需要不断迭代和试错的过程。在大数据的初期阶段,这个过程是难以省略的,所以如何建设一套可面向版本管理、持续优化的数据标准体系,是城市大数据革旧出新,可持续建设下去的关键。
在无法梳理完善的标准体系前提下,数据简单归集后的数据治理显得尤为重要,也是当前大数据治理的主要阶段。
数据在归集在数据湖之后,目前依靠大部分的人力来处理数据的清洗和编目工作,暴露了一些问题:如何兼顾数据的业务属性和数据中心的资产属性进行智能标注;如何照顾原业务系统的数据标准对应行业标准的智能映射;如何对数据湖的基础数据进行基本的归类等…其中各种繁杂事宜,用人海战术解决基本是国人的一贯思维。
但作为一个城市持续性的数据建设项目,运用AI技术进行技术降维,是大数据的关键趋势。
我们可以结合AI技术在文字特征识别领域的成熟技术,对处于数据湖阶段的数据进行特征提取,利用机器学习算法进行智能分类、智能映射等工作,极大提高治理的质量同时,也大大提高了整体工作效率,便于后期的运维和升级改造。
未来大数据的治理,不管是从数据安全流程角度,还是从协同效率的角度,都需要不断脱离对人力的依赖,脱离对人为识别的依赖,进入数据AI治理的智能时代。
工具赋能,边缘协同
城市大数据治理的需求起于终端,也服务于终端。作为提供数据的部门,了解数据最初的状态和实际状况,也应该建立起基本的数据治理能力,协同数据中心一起进行数据治理。
区别于传统企业数据中心独立治理的建设模式,应该建立起中心主导、边缘参与的「云治理」模式,这样才能更好的从数据诞生之初就进入标准化的规范流程。数据从边缘系统进入中心系统整个链路中,单方面的数据治理永远是一种极端,所以如何让业务终端具体数据治理的能力,响应数据中心的统一建设需求,是城市大数据治理提升数据质量的一个关键。
在Gartner发布的2020年十大战略科技发展趋势的白皮书中也提到了『专业知识民主化』和『边缘赋能』两点,而各种复杂的大数据技术很难直接被业务终端直接消化使用,所以需要更低技术门槛的大数据工具类产品来赋能终端,打造『边缘-中心』一体化的城市级大数据治理新模式。
从治理到管理,知识与价值同行
从之前简单的数据资产管理,到现在提出对数据提前进行严格治理的要求,背后逻辑是高质量数据带来的业务赋能和知识的产出。
知识需要高质量的基础数据作为支撑,也需要统一标准的业务终端来体现价值。在各城市委办的信息化完善基础上,数据量和维度也不断累积,所能产生更多成熟的业务模型和知识体系。但其价值不仅仅在单个委办系统内。「如何通过数据的交换,来驱动城市各委办间基础数据和知识的共享,更高的体现城市数十年来沉淀的知识与价值,激发城市内在的活力和能量」,是大数据对城市建设带来的其他技术或业务改造所无法达到的效果。
城市级大数据治理的方向是服务整个城市的升级改造,最终服务到每个人息息相关的周边生活,医疗、教育、环保、交通等多个领域。
特别要提及的是,此前,德拓大数据产品家族中的DanaStudio数智开发平台和PandaBI数智决策平台在城市级大数据治理方面都有亮眼的表现,例如在第二届进博会中,基于PandaBI的上海地铁进博会保障专题大屏为上海地铁指挥中心提供了数据的高效采集、分析洞察以及直观展示等,为进博会提供了有力保障。还有在上海大数据中心项目中,DanaStudio通过统一的数据治理逻辑,为该项目提供一套高效率、低技术成本的工具支撑。
期待新的城市大数据建设架构,带来城市建设的真正驱动效果,赋能城市建设新模式!