“大佬”访谈录,数据智能的未来

日前,上海德拓信息技术股份有限公司CEO谢赟接受了大数据行业知名媒体的专访,在专访中谢总描述了他眼中国内外大数据行业的技术对比和发展现状,介绍了DATATOM的创新历程和未来方向,也对大数据的未来趋势进行了展望。

大量干货和前沿观点,本期小拓整理奉献给大家。
1   聊聊大数据行业
  
Q:如今大数据越来越成为香饽饽,于此而生的大数据企业也雨后春笋般成长起来。在您看来,目前国内外的大数据技术发展到哪一步?国内和国外相比,有哪些区别和差距?
A:“大数据”这个词之所以会变得非常热门,是因为它已经从技术概念变成了成熟技术。人类对数据的探索从未停止,从结绳记事、算盘、数据库技术的延续性来讲,大数据自然是当下最好的数据探索技术,因为它可以把我们多年建设信息化所产生的已有数据更大范围、更深度的聚合起来,产生新的价值和运营模式,让我们对世界的认知更准确。基于我们十几年信息化建设的沉淀,产生了太多的应用数据,必然就有将这些数据融合、分析和应用的市场需求,沉淀数据有多大市场也就有多大,自然会有更多的从业者进入大数据领域。
在我看,现在的世界越来越扁平,随着开源生态的兴起,已经没有封闭的技术,在互联网上技术原理非常公开,国内外的大数据技术的掌握本身差别已经不大。任何团队只要更多的实践,就可以达到业界一流水平。甚至因为中国人口基数的巨大和应用场景的复杂,催生了不少技术的优势,因为大数据的先进性是需要更大规模的数据支撑、验证和升华的。
当然,我认为国内外在大数据应用领域还是有较大差距的,技术不等于落地应用,相对而言应用的广度和深度还是有一定差距的。要用好大数据,首先要有聚合数据,但是国内有行业壁垒,不会轻易开放自身数据,就很难真正达到多元数据聚合实现新运营模式的方案。往往数据也代表了管理权力,将权利轻易交出来难度和阻力很大。这也正是国家在倡导数据开放和共享战略的意义,我相信随着数据的壁垒被不断打破,我们有望在大数据应用领域比国外更具备竞争力,建立一个国家战略级别的大数据产业规划,那么未来数据资源竞争我们就有规模优势。
 
Q:大数据、物联网、“互联网+”、VR等都成为热词。结合您的经历,谈谈大数据能给我们人类社会及个人生活带来哪些变化?举例说一下。
A:从03年个人创业起,我就在数据领域,从数据的存储、数据的备份容灾再到今天的数据智能平台,我觉得大数据的确能让我们的社会及个人生活进入到价值发现阶段。
什么是价值发现阶段?就是“问题在哪里、数据在哪里和办法在哪里”,通过研究我们自身工作和生活的痛点来定义我们要解决的问题,而这些问题在我们已有信息化中的数据是否能够支撑解决?不能解决需要再融合哪些系统、社会的多元数据来解决?那么最终就是通过大数据的建设落地来推动问题的解决。具体我们可以举几个例子:
■  德拓信息所参与建设的贵阳市交管“数据铁笼”项目就是为了制约权利,把分散在交管局三十多个系统的数据整合在一起,按照人、事的分类组织、归类数据,现在每个人工作已不再单纯靠领导评价,而是数据说话;现在每个工作风险点不是靠人力核查,而是数据分析。
■  德拓信息近期所交付的哈密医院大数据融合平台聚合了几十亿条数据,现在正在按照地区卫计委要求聚合全地区的所有医疗数据。目的就是解决三大问题,提升内部效益管理、掌握疾病流行趋势、发现医生及处方的诊疗效果。这些聚合的数据反过来对药企定价、民众诊疗又推送数据过去,便捷了整个医疗体系参与方的融合。
■  贵阳交通大数据孵化器也是德拓信息交付的一个很有意思的项目,在上面有很多企业在利用共享的数据进行创业创新,“车来了”公司在平台数据的支持下,现已对贵阳市民众展开出行服务,短短时间服务了100万的用户,等车时间变得更直观,服务了广大民众,也节省了社会资源。后台的数据也反馈给了孵化器平台,对贵阳的拥堵、公交线路优化、出行分析提供进一步的支撑。
当然,我们也很荣幸去年能够用大数据分析技术参与了公安部督办的花溪杀人案,当犯人在广州被抓获的时候,所有参与的同事都觉得之前所有熬夜、加班都变成了一件幸福的事情。
大数据真的很有意思,我自己感觉非常有成就感,因为它真的可以改变现状、挖掘价值,从未知走向已知。
 
2  DATATOM的创新历程和未来方向
 
Q:德拓信息长期致力于大数据解决方案领域技术与产品的研究与实践,能否介绍下德拓大数据解决方案的产品?
A:因为我们是一家技术公司,研究的是“数据智能”。怎么来看这个Slogan呢,我们有三个不同受众的解读。对于我们自己来说,我们研究的是客观世界数据化的科学,当前最佳的技术就是“大数据”;对于我们的伙伴来说,将数据的集成、存储、建模和分析赋能给合作伙伴,最佳的方式是技术平台化;对于广大的用户来说,数据智能是人工智能的先导,首先将自身的数据和外部数据融更多元的融合起来,才有可能带来新变革和走向人工智能的路径。
所以,如何让大数据技术难度降维就是我们唯一的使命了,数据智能就是实现了降维的技术变成标准化的平台,可以让合作伙伴和用户将精力更多的放在行业大数据落地上,而不是技术本身。这样可以快速落地、快速实践,也有利于强强联合,我们称之为“DANA Inside”(DANA是德拓信息的智能大数据开发平台)。
DANA智能大数据开发平中包含了众多的开发框架和服务引擎,让大数据在各个引擎处理下实现统一的资源控制、管理、协调调度。合作伙伴和用户可以借助DANA智能大数据开发平台将数据基础架构和数据管理服务都变成API调用,快速、高效的实现任何大数据的应用。先进的DAAS层真正的围绕数据作为核心建设大数据应用,改变原来大数据项目仅仅是离线数据分析的现状,实现丰富的在线大数据应用场景。DANA智能大数据开发平台支持采用分布式超融合(Hyper-Converged)架构,可以将具备计算、网络、存储、虚拟化和其他软件服务资源及技术的超融合节点通过网络聚合起来,实现模块化的无缝横向扩展,形成统一的资源及服务。
例如我们赋能媒体行业的伙伴共同打造了融合媒体云平台,将数据的收集、存储、分析、处理工具引擎通过API给到合作伙伴自行开发,并集成在我们统一提供的超融合硬件上,反而降低了用户和伙伴的成本,和传统信息化相比更具竞争力。一经推出,立刻成为媒体行业现象级产品。在CCTV、各级省台、海外市场到处热卖,帮助伙伴成为第一,颠覆了媒体行业。
我们希望在各个行业都找到那些有志于大数据DT时代保持竞争力,愿意帮助行业用户变革的伙伴,共同努力,让用户信息化建设向大数据方式演进。
 
Q:德拓信息已经主持了政务、交通、媒体、医疗等多行业大数据应用方案的落地。能否就其中一个谈一谈我们如何运用大数据技术,帮助用户处理数据,提高数据使用效率?
A:在北京朝阳区的智慧物业试点工程中,我们和旋极股份一起为用户建立了“三六三”大数据中心平台,围绕物业为抓手将各个委办局数据进行汇聚,再收集互联网上对应的数据资源,通过大数据的自动分析、比对,发现各种异常。结合各个委办局、街道、社区、物业管理及工作,完成最后一公里的政务管理,对于人口疏解、金融风险控制、安全生产隐患、淘汰落后产能、常住人口动态更新等政府最为关注的事项带来了全新的管理模式。
为什么大数据技术可以做到这么多能力?就是因为数据一旦聚合可以产生奇妙的化学反应,告诉我们很多以前靠人和单一系统无法知道的事情,再结合互联网的快速处理能力,大大降低了管理成本,提升了管理精准度。而这么多来源的数据就需要有一个优质平台,随时随地对数据进行收集、聚合和分析,随着智慧物业工程的深入展开,我们的智能大数据平台一定可以发挥更大的效用。
 
Q:未来的大数据解决方案中,德拓信息将有哪些新的拓展和创新?
A:在我们去年拿到B轮亿元融资的时候,我写了一封内部公开信,说过 “数据的边界才是我们的疆域”。
既然大数据是各个行业信息化升级的必然,从需求为中心升华为数据为中心的建设思路,这是市场需求是极其广大的,那么我们要做的就是快速的将我们的能力落地在各个行业,我们做行业的广度,智能数据赋能给各个行业的合作伙伴,伙伴来做行业的深度。
接下来的五年,我们需要联合100家开发者,支撑1000个大数据项目,这是我们拓展的目标。为了达到这样的目标,更多的是依靠产业链,所以我们希望通过以下的几点不一样的产业创新来做到这一点:
■  建立2亿以上规模大数据产业基金,投向行业合作伙伴的大数据落地,帮助合作伙伴在行业上更大的投入、更快速的行动去变革自己的行业;
■  对于我们自己落地的行业应用,所有源代码都开放给合作伙伴,降低伙伴开发成本,加速合作伙伴自己的大数据应用落地;
■  超融合架构部署的小型项目,我们不再收取大数据平台的费用,进一步降低合作伙伴的交付成本;
■  建立hellodata.club平台提供互联网及其他行业数据聚合服务,让合作伙伴不仅仅可以拿到用户的私有数据,还可以进一步聚合其他行业及互联网数据,提升大数据应用高度;
■  展开Hello Data开发者大会、开放德拓大学,帮助合作伙伴培养、提升大数据人才。
 
3   未来大数据的发展趋势
 
Q目前在城市中,交通、医疗等不少领域已经运用大数据技术让管理更加便捷有效,但是很多领域由于信息孤岛,还处于传统的管理中。在您看来,如何打破这些信息孤岛?
A:确实,大数据要实现威力,一定要能够融合更多元的数据,而这些数据往往分散在各个系统之中,很难集成。我认为打破孤岛取决于两个方面的力量。
第一个是技术的力量,如果要低成本、高效率的不断聚合孤岛数据,就需要有一个成熟的数据集成平台,可以自动化的收集需要的数据,处理成标准的大数据结构,就如何我们DANA平台的Crab、Phoenix、Dodo、Stork等引擎一样。
第二个是制度的力量,没有更高层面的制度要求,是很难推动数据开放的,也就打破不了信息孤岛的现状。很多地方把数据做成execl供大众下载,实际上是一种公开,而非鲜活数据的开放,这需要各级管理层可以制定相关的制度保证数据的开放。
当然,我还是觉得大数据应该是个持久战,不是一蹴而就的,可以先建立一个大数据平台,不断收集可以收集的数据,再通过大数据落地成效反过来推动更多数据的聚合,最终实现信息孤岛的全面打破。
 
Q:对于大数据企业发展来说,最核心的是什么?需要政府提供哪些支持?
A:大数据的产业很长,分为数据资源、基础架构、平台工具和行业应用四个领域,每家企业都可以在其中找到自己的定位,因为定位的不同其发展的核心要素也肯定不同,对政府支持的诉求更不一样,就我们德拓信息来说,所处的领域是基础架构和平台工具,那么我们的核心要素就是如何向下连接更多的数据,向上连接更多的行业应用开发者,一旦我们能够更大范围的连接资源和应用就可以在整个行业内发展的更好,随着大数据产业的发展而成长。同样的,我们对于政府的希望也来源于数据资源的获取和大数据应用落地的支持,在数据上能够更多的开放和共享,在大数据应用上给予更多的规划和机会,给大数据产业以源头和场景。
 
Q:未来大数据将向着哪些方面发展?有没有风险?
A:就如同硬币的两面,有好就有坏,大数据的确将数据的价值聚合提升,但一样会带来一个现实的风险——数据安全。数据安全指的两方面,一方面是数据集中后被攻击、破坏的影响更大,因为数据更集中了;另一方面是数据隐私的安全,被拖库、泄密的事情时有发生。所以我认为,在大数据安全上相对其他方向的发展有很大的空缺,也是确保整个产业更好发展的一环。德拓信息自身今年在西雅图设立研发中心正式瞄准解决大数据安全所设立的,当然,技术也不是万能的,国家立法也是大数据安全非常重要的基础。