11月9日-10日,科技智库甲子光年「甲子引力」大会在北京举行,产业领袖、科技公司创始人、投资机构决策者等众多嘉宾集聚一堂,共同探讨科技行业突围之路。
德拓信息创始人、董事长谢赟谢总在甲子引力大会「科技·变量-认出风暴-数据智能专场」中同现场嘉宾分享了德拓在数据价值洞察上的实践与认知。
谢赟认为,数据与价值之间,需要技术赋能与工程落地共同来链接,才能体现数据价值。
数据的本身在于洞察,而洞察的核心是风险与监测。数字化时代不仅仅是把原来在纸上的工作流程搬到信息系统上、存留很多数据,更是要解决信息孤岛问题,才能通过数据创造更多价值,进而走到智能化时代。
以下是谢总在「甲子引力」大会上的演讲实录:
非常感谢今天有这个机会,在甲子光年一年一度的盛会里,向各位分享一下德拓这8年时间里在数据领域一些认知。
数据到底具有什么价值?
德拓一直在考虑一件事,数据到底具有什么价值?数据和价值之间有非常大的鸿沟。而这个鸿沟需要先进的技术以及相应的工程来弥补。
德拓是一个小的微观体,实践工作中做过一些非常有意义的数据项目。比如海关总署的风险洞察,项目落地后,我们可以通过已完成的数据平台来进行数据分析与监测,例如那些报关单中,哪些红酒报关是有异常的等等;同样,德拓在2015年首创实践并落地的贵阳数据铁笼项目,目前已经成为整个中国数字政务标杆性的案例;当然还有我们在上海公安完成的智慧公安数据化能力,去年进博会期间,我们就在青浦公安用大数据方式辅助公安工作,共抓捕在逃人员达7人。今年进博会,上海城运指挥中心也将其升级到了「一屏观天下,一网管全城」的更宏大的项目;再比如说,曾经我也有幸参与到一个重大案件的侦破,通过大数据去挖掘要犯。
更重要的是,大家能够看到,德拓在过去参与过非常非常多的数据化项目,他们分布在很多领域,包括教育科研、媒体文娱、轨道交通,金融证券、数字政府、军事工业、先进制造、商业企业、医疗卫生等等。
这些都说明什么?
说明数据已经成为这个时代的一个主旋律,或者成为为这个时代创造更新的价值的一个核心要素。
数据为何能为时代创造更大价值?
为什么这样说呢?
第一,首先我们认为这是业务进化一个必然。整个IT的发展随着数字化、数据化到智能化。数字化时代把原来工作流程上的纸质工作流程搬到信息化系统上,存留很多数据,但这些数据全部都是割裂的,是一个一个的信息化孤岛;当我们拥有数据化的能力的时候,就可以把所有的数据连通起来,通过数据创造更多价值;当然,有了数据化的数据融合汇聚我们才能走到下一个时代,也就是智能化时代:在我们所参与的很多数据智能创造过程中,我们发现数据是产生智能化可能的一个必然基础。
第二是数据爆炸的必然。我们这个行业非常有意思,数据自古就有,结绳记事、算天象,都是数据的应用,而且数据规模是不断变大的。仅从近十年来看,信息化时代是每个服务器在产生数据;而互联网、移动互联网是每个人在产生数据,它的载体会更多,产生数据也会更多;而到今天物联网时代,是每个设备设施都在产生数据,量级是更大的。
而感知能力提升又使得我们能够获取到更多的信息。例如原来一个视频只知道在什么地方拍的,现在可以知道穿什么衣服的人,什么年纪的人,会知道他是谁,知道他的情感,也就是数据量更多。
5G时代到来的时候,把这些连接在一起,我们的数据资源、数据规模、数据能力就变得非常大。
这是不可逆的趋势。
第三点是产业升级的力量。大数据领域需要有基础,现在计算、存储资源已经很丰富了,每个行业都有自己的行业云,没有行业云在公有云上也随时可以买得到。此外,我们的算法发展到了AlphaGo可以击败人类的程度,我们在TO C领域证明了大数据洞察的这种可能性。
最后一点是政策导向。今天国家的农业除了主粮在保护以外,好像其他的经济作物都是进口占比较大,因为我们的竞争力不足。同时,在当下复杂的国际形势下,工业想要拥有更强大的智能制造能力,引进新技术,已经比较困难了。但是只有大数据、人工智能是跟人口规模、跟社会的复杂程度以及民众隐私的容忍度是相关的,这个中国是有机会的,国家正在不懈余力的推进这些技术的落地和发展。
数据价值三个领域
我认为数据价值分为三个不同的领域。
● To C 、To B、 To G
在To C中,我们的价值是效益 。我们看到信息行业里面不管抖音、头条用数据怎么做,仍是两个核心算法:一个是推荐算法,一个是画像体系。任何To C的领域都是这样做的。京东为了转化率提高0.1%,甚至不惜投入非常大额的资金。所以整个行业基本上是赢家通吃天下,在这里,数据化是为了面对消费者的个性化。
第二个我们认为是To B,它其实数据规模要更多一点。但To B会更复杂,因为是面向一个组织,所以他们希望价值变成效率,会比刚才的价值更多一些。比如我们银行风险控制,商业的业务创新,还有组织流程效率;例如,神策数据是面向营销大数据、昆仑数据面向工业自动化等等,是每一个细分领域的点垂直下去,无法统一天下,但垂直是有规律的,有大市场,在这里,数据化是为了面对产业的生态化。
但是真正数据最多的领域其实是To G。在政府领域我们认为价值即效果,效果这个词非常艺术,怎么理解都可以,所以它的复杂度更高。因为政府需要解决的问题非常复杂,数据资源、面向的要求和外部环境都是不断变化的,也就是说它面向的其实是环境无常化。
而这三点其实在今天都是叠加态,因此我们要做数据化就必须面对非常大的一个挑战,“数据价值不确定”。所以数据规模越大数据价值越难确定,因为实际上它能够做的事情越多。
● 成本-价值象限
我们在实践中发现,不管是刚才讲的75天完成的数据铁笼也好,还是8周落地的海关也好。你会发现用户对于数据价值创造要求越来越多,因为环境就是这么急促,而且他们希望成本越来越低,因为数据价值的确定性变低。
所以,我们把大数据的要素做了四个象限分类,我们可以看到在这里面按照成本和价值来分,有不同的成本象限和价值象限。但实际上每次我们面对每个用户的时候用户关注度都会有一个排序,有一个优先级,可以看到优先级是这样的:为什么客户在筹备大数据项目的时候先去考虑存储计算,选择开源还是商业版的Hadoop系统,还有自己有哪些数据资源?而不是先关心价值相关的创新应用、数据治理和分析挖掘?这是因为数据创新成本太高,而且数据价值不确定。
成本降低,价值创新的德拓方法
所以德拓的方法论就是,如何能够把数据价值创造这件事成本趋于降低,价值趋于稳定?
● 数据智能
这就是德拓既定的一个战略规划,“数据智能,更佳洞察,助力数字中国”的使命。我们把「数据智能」称之为「STEMA」。
S是研究真实世界和数据之间关联关系,这是科学-Science。所以我们不断拓展不同的行业,去探索每一个行业数据在哪?是什么信息化存储的?了解数据有什么价值?
T是技术-Technology,研究数据收集、存储、分类、挖掘、连接、可视的具体实现手段。
E是工程-Engineering,利用数据化与智能化技术,结合不同需求,实现数据化业务落地。如果没有很好的工程落地方法的话,就没有办法面对这么大不确定性的用户需求。
M是数学-Mathematics,编写规则、算法,挖掘数据价值,构建世界规律洞察模型。沉淀下来的是算法模型,不管是统计类还是机器学习类的。
最后我们要展现数据之美-Art艺术,尝试数据与生活、工作完美融合,向个体、组织、社会呈现数据之美。
● 更佳洞察
更佳洞察的解读在于如何让未知变为已知,而数据核心价值在于洞察,但是洞察有两个核心的洞察,一个是风险,一个是监测。所以我们会非常关心的是有哪些行业是非常注重风险,也非常注重监测。在我们来看有两条,一个是金融行业,一个是公安行业。
● 三种能力
所以到今天,为了实现成本降低、价值创新,我们做了三件事:
第一,德拓有相应的平台工具,德拓的三大研发中心(上海人工智能研发中心、南京大数据研发中心、成都云计算研发中心)不断研究如何通过平台工具使数据的汇聚、存储、治理、可视及应用变得越来越简单,同时工程效率能不断提升。
第二,在我们不断落地的过程中,我们沉淀了一千多个算法模型。我们知道算法是开放的,但是模型一定是基于特定的数据、基于特定的需求,最终由特定的算法调参得到的。其中大约有100多个核心的洞察算法,这才是数据价值的体现。
最后,还有一个重要的——解决方案;光有刚才这两点,那我们的规模做不大,因为你每个落地项目都自己做是无法实现规模的。所以依靠解决方案,我们才能有更大规模。目前为止我们完成了20多个行业80多种落地的方案,使得我们知道什么样的行业能够更精准地去做柔性数据化服务。
● 四类合作伙伴
所以在企业经营过程中,德拓一直在积累这三样能力,使得我们到今天可以用这些能力去连接四类合作伙伴。
第一类合作伙伴称之为业务性合作伙伴。比如说CETC、中国电信集成,他们承担了大部分数字中国的建设。
第二个是平台型合作伙伴,如同和阿里在上海公安、和腾讯在海关总署、和华为在山东市场合作一样。它们作为平台厂家,做的是底座基础,但上面长出的数据价值的庄稼是由德拓来完成的。
第三种是各个行业的合作伙伴,这样的行业伙伴有长期的行业认知,但是没有数据化能力。德拓将数据化能力赋能于该行业,使得它们在这个行业里进展非常快。举个例子,比如我们今天能够媒体上做的非常好,在全球市场进行销售,类似美国的波士顿体育,但其实看到的都是索尼牌的产品,而我们是做是技术输出,但是对外的品牌是索尼。
第四种是自主型合作伙伴,我们可以通过资本方式去连接,可以和一些团队共同在细分领域去做数据智能探索,比如我们北京爻拓,去年8月份成立,到今天拿下北京地铁、上海地铁等一系列的轨道交通数据化项目。
这是我们讲的,「当核心能力具备,就能把数据能力赋能到各个行业中去,建立行业的数据中台能力,降低该行业数据创新成本,提升数据价值的确定性」
● 数据价值六个方向
具体来看我们认为数据价值六个方向:
第一个数据实现态势感知,知道此时此刻环境正在发生什么变化。例如我们做过的公安、司法、轨道交通项目等等。
第二个数据驱动合成作业,可以把原来壁垒森严的地方打通,例如北京朝阳的智慧朝阳就整个了各个委办局的数据,打通成为一体化流程。
第三个数据助力精准决策,不管是对医疗水平诊断,还是对商机的把握,还是对案情的分析,都可以通过这个来完成。
第四个数据完成深度洞察,我们通过数据去完成投资人画像、看到每个人的画像,发现商业骗保项目、营销了解客户的情况等等。
第五个数据提供无界服务,今天上海大数据中心我们实现所有委办局的数据汇聚,去做数据融合分析。那这些数据已经变为一种资产,可以给更多的部门所使用。
最后是数据提升流程效能,比如工业自动化,数据如何提升监测设备设施的故障情况、上海城市信号灯配时方案如何选择。
德拓希望通过这样的方式能够实现数据价值的创造,而这些创造的竞争力来源于我们对于不断降低的成本和数据价值确定性的提升。
再次感谢大家的聆听。