他们敲出的行行代码见证着城市交通脉络的生长

谁不想做改变世界的那个人呢?可没有盖世武功,没有天才基因,没有显赫家世,就不能改变世界了吗?

2019年11月5号,第二届上海进口博览会全面开启,当所有的聚光灯都聚集在「四叶草」的时候,我想记录下那些背后的人—— 轨道交通大数据的践行者。

在数据智能的时代里,一个算法、一个模型,都能对整个行业起到巨大的影响力。当智慧交通、智慧公安、智慧交警、智慧物业…不断的深入我们的生活,我们也应当看看所谓「智慧」背后的人。

毛哥是整个项目的承接者和负责人,他忙碌的程度可以用一句话来概述:我在客户这边,晚点可以么?…(无论何时call 毛哥得到的统一回复)

振华是那个项目组里的大暖男,总爱“偷偷”跑回办公室加班,声称要以一己之力,突破「数据」的枷锁!

波是团队中的「金牌设计师」,数据大屏上那些看起来似乎“花花哨哨”的页面都是他的手笔。

后来…我问小月,你压力大吗?他出于对项目和工作的本能,压力真的大,而这一切都回归于生活,生活中的一句伪名言:「钱不是万能的,没有钱是万万不能的」。

亦然是毛哥特地从北京团队调过来的,他在轨道交通数据处理和分析的方面经验丰富,可谓“资深”。

他们最为“志得意满”的事情就是使这件事完美落地。

城市路网调度指挥中心大厅内,数据大屏上的数字实时变动着,展示着客流、行车、客运组织的情况,确保地铁运行的有条不紊。

几天前的凌晨,同样是在这个大厅,有那么一群人正在加班加点进行着地铁进博会保障专题大屏最后的调试部署,他们已经“连轴转”了三天…为的就是确保项目如期上线运行。

“润物细无声”式的改变

上班通勤、出门购物…地铁作为交通工具已经与我们生活息息相关,但大部分日常搭乘地铁的人并不会意识到大数据是如何给地铁的运营带来改变。

那大数据技术是如何优化地铁运营的呢?

在某市地铁的十余条线路中,有一条线路的历史数据与其他线路有所不同——5号线。5号线每天行驶的路程约为800公里,远远超过其他线路地铁的行驶里程。

我们可以做一个估算:该城市的地铁运行期内的行驶上限大约是300万公里,若按使用时长来计算,大约为30年,也就是说每年行驶里程数约为10万公里,每天大致是300公里,但5号线每天行驶800多公里,使用寿命就会缩短…进一步的数据分析发现,5号线列车每一班次只服务100余人,而有的地铁环线,每一班次能服务2000余人,服务效率差距非常之大。通过这样的分析,地铁运营方面即可以进行相应的调整改进,提升运营效率。

这样的案例不胜枚举,我们可以在其中一窥大数据技术的应用为地铁运营带来的改变。这些改变,最终都会以「润物细无声」的方式融入到服务乘客的点点滴滴中:实时拥堵信息获取、紧急情况能够得到及时响应、车辆运行状况及时反映…

在进博会这样的大型活动上,大数据技术之于地铁运营,更是有着重要独特的价值。

告别“头痛医头,脚痛医脚”式的设计

进博会的举办,巨大的人流量、更为复杂的情况要求高水平的地铁管理,细致充分的前期准备,要能够做到对地铁运行实时状态做到全面感知,对发生的各种异常情况快速响应和处理。

在地铁管理运营方的规划中,这个项目是地铁调度指挥最核心的大脑,是整个城市地铁最核心的生态系统之一,能够把每条线路、每个车站、每一列车、所有的设备的实时状态数据、每个乘客的数据都采集过来,也就是说要具备非常强的对最前端、最单元的感知能力

其次,系统应该可以基于这些感知能力以及对数据综合的分析,做出有效的应对。这种应对,是整个路网协调地来做应对,全路网动态地调整指挥,而非“蹩脚郎中”式的“头痛医头,脚痛医脚”。

德拓在这个项目中,主要承担的一是把数量繁多的系统、乘客、设备、行车等数据接入到系统,实现标准化、数据的治理、数据的建模、数据的采集发布共享;二是整个体系会运行在一整套的地铁的云平台上,而德拓提供了云平台的产品、解决方案并进行实施。

接到了任务后,德拓第一时间从各个项目组抽调负责设计、数据处理、数据建模分析、数据可视化等工作同事组成了项目建设团队,包括优秀的数据可视化设计师波,擅长轨道交通数据处理和分析 亦然等。

9月初,6个人的团队开始了最初的方案设计。此时,距离进博会正式开幕仅有约2个月的时间,而此后方案的设计确定,就用去2-3周的时间。

8版方案最终敲定

由于数据可视化的大屏由4*20,共80块大屏组成,在10米左右的距离观看,这需要在设计时考虑到数据的直观性。此外,数据的全面支撑,数据的可视化界面,数据的交互方式等,需要考虑的问题非常多。

项目团队同客户前前后后共设计出8版方案才选定最终一版:

一是将为进博会准备的行车的、客流的、保障的、组织体系、指挥体系的相关信息,做了可视化的设计,直观可见;二是对进博会的全面态势感知:进博会主要涉及到三站三线:徐泾东、诸光路和上海火车站;2号线,10号线,17号线。全面的态势感知意味着我们不光是了解乘客从哪里来,还要和历史同期数据做比对,哪些人是专门为进博会来的,通过视频分析的手段得知一个人在车站中是在何处聚集,从哪里出发,途中会经过哪些换乘车站…这些都是系统实时地去感知,实时地去展示。

客户、产品、项目团队的鼎力合作

方案确定后,留给项目实施的时间已经十分紧张。

最后方案确定之后,项目组的小伙伴们就进入了一个「996」的工作模式,所有同事基本上每天都是在会议室里集中办公,不同岗位的同事——前端、后端、数据分析等聚集在一起配合完成这个项目。

短短的三周左右的时间就完成了70-80个数据可视化应用界面包括前后端的数据调控,全部开发完毕:通过对乘客来向的分析,对于体量繁杂庞大的OD数据,进行了脏数据处理、容错处理,以及程序可行性分析;采用分布式架构,对数据进行分布式挖掘,做出了实时可交互的大屏路网图;OD飞线乘客来源一目了然,重点车站、武警值守信息清晰可见,数据及时可靠;通过已有的结构化、半结构化和非结构化数据,分析计算出了客流预测、五分钟晚点指标、列车晚点情况、客流强度等指标等等。

时间如此紧张,这些是如何快速实现的?

那个时候,项目开发的同事们想到了德拓自有产品——PandaBI,当时的PandaBI更多的是一个数据可视化的工具,并没有在数据大屏,尤其是在地铁这么大规模的大屏上真正应用落地过,在整个团队及客户共同对产品进行了一系列的评估后,一致认为就功能本身来说,PandaBI是非常契合该设计方案的。

随后,便是需要两个团队(PandaBI研发团队、地铁数据大屏项目组)高默契、高效率的配合了。在项目开发过程中,遇到过各种各样的问题,例如新的需求、功能定制等…都会在第一时间整理并反馈给PandaBI研发团队的小伙伴们,他们会进一步的分析处理,把这些需求当成数据可视化大屏的通用需求,快速地帮助项目组实现。

项目实施的过程中,客户也有较深程度的参与。像“Tab页切换、数据的表单自动翻页、界面美观性”等要求都是客户提出的想法,他们甚至对每一个翻页的速度、自上而下顺序的展示效果提出更为精细化的意见,对整个项目“精益求精”。

是客户的高要求、是两个团队的通力合作,数据大屏可视化应用才得以如此完善并快速落地。

困难与成长并行

完整的数据大屏建设后,他们又将面临更加严峻的挑战——现场部署产品。

与开发数据大屏不同,客户要求整个系统要能够「准确」的对实时的客流、行车、设备等历史数据进行采集、分析、计算、展示。所以当数据大屏真正部署并对接到了地铁的系统上,就将面临一个非常富有挑战性的任务:保证将数据的准确性、时效性调到非常高的程度。

为何在开发好数据大屏的模型部署到现场后,结果会出现一定程度的偏差呢?毛哥在与我们交流的时候说道:“造成这种结果的原因有很多,例如地铁线路实时调整、部分生产系统报送的数据有经过特殊处理等…现场情况永远比预计的还要复杂,这种情况,其实我们也都有一定的心里准备的”。但说完有心理准备后,他又想了想说道:“当近60%数据都是存在问题的现象发生后,我们的心理准备还是有点崩啊…”

现场部署的第一天从清晨的7点开始,一直调试到了凌晨4点多,在小有成果后,大家决定先去吃个宵夜,再回旁边的酒店休息一会。但其余几人没有想到的是,负责数据处理的后端同学——振华,在大家走了之后,又偷偷地返回C3大厅,继续做调试工作,累的时候就在大厅的椅子上趴一会,等第二天早上大家过去时,他还是保持旺盛精力调试数据脚本。

在经过3天「连轴转」的数据矫正、调整后,他们如期的在进博会开幕前确保上海地铁进博会保障专题数据大屏运行工作。

进博会地铁专题保障数据大屏成功保障了进博会期间的交通运行。并且,德拓所做的数据可视化突破了很多传统的方法,不同于传统的数据可视化的柱状图、曲线图、散点图等,在这个项目中我们结合了大量的轨道交通行业的特点,用户可以通过一张图去了解整个轨道交通、全网当中的态势,不管是客流、行车,还是客运组织、设备的状况都清晰直观;也可以基于场景进行变化,基于关注重点进行灵活的变化切换…起到了非常好的效果。

「地铁进博会保障专题大屏」总结出了一套完整的数据治理流程与综合应用模型,在数字化地铁领域的探索和成效有了更进一步的突破。

在进博会结束之后,德拓收到了来自各方的感谢信,表达对德拓在进博会期间的保障工作的认可和赞许,包括德拓在青浦公安所做的社会面智能安防、上海公安市局数据治理、智慧公安综合服务平台长宁分平台、上海市大数据中心的数据保障、上海市城市运行管理平台系统以及此次的地铁进博会保障专题大屏。传送门:数字政府 | 德拓助力第二届进博会,推进数字政府管理新模式

进博会结束了,但对轨道交通的服务保障仍是一场持久的“战役”,在能被乘客感知到的地方和乘客感知不到的地方,改变仍然在发生…