近年来,随着城市规模以及人口的不断增加,对城市公共交通系统的要求也越来越高。城市轨道交通作为一类重要的城市交通工具,具有运量大、快速、安全的优点,使其成为有效缓解城市交通压力的一种手段。
在城市轨道交通在日常运营和维修维护过程中,也积累了海量的数据规模,这些数据具有体量大、类型繁多、时效性高、多源异构等大数据特点。
如何在管理中挖掘和发挥大数据的创新价值,如何利用大数据挖掘、大数据预测、大数据可视化等技术分析轨道交通大数据,有助于发现轨道交通中潜在的数据规律,分析决策需求,优化数据采集和处理,并将更好的服务于城市轨道交通的规划设计、工程施工、运营维护、乘客服务、决策支持等各个方面。
今天,我们就结合德拓在轨道交通行业的实践,来和大家解读,轨道交通如何应对大数据时代。
1. 城市轨道交通大数据是什么?
城市轨道交通大数据按照运营关联情况可以分为内部数据和外部数据。
01.内部数据由静态数据和动态数据组成,静态数据包含基础地理数据、公共行业数据、属性数据、标准、规章、计划及指标数据;动态数据包含专业数据(车务、车辆、工务、电务、机电、通号等)、客流数据、环境数据、安全数据、财务数据、资源配置信息、客运服务信息。
02.外部数据由气象数据、大型活动数据、公共交通数据、社会媒体数据构成。
城市轨道交通大数据具有多源、异构、动态、时空的特点。不同来源的轨道交通数据以自动、主动或被动的形式产生,通过传感器等设备进行采集和存储,地理上分散的轨道交通数据通过网络进行汇聚,经过数据集成、数据清洗等处理手段后存储在统一的数据中心,按照上层的业务需求对存储的数据进行处理和分析,最后将结果进行可视化,以服务不同的应用。
2. 轨道交通大数据应用面临挑战
目前,轨道交通大数据分析和处理有着丰富的应用及解决方案,但也仍面临着各类挑战:
01
数据管理的挑战
轨道交通大数据来源广泛、种类繁多、产生速度快,具有多源、异构、自组织的特点,这使其在管理上面临着“汇聚难、集成难、存储难、检索难”的挑战。
轨道交通数据在地理上分散,并通过不同的数据模型和元数据来进行自组织管理,如何连接不同类型的数据源,定时、自动化地汇聚多源的轨道交通大数据是一个挑战。
轨道交通数据的体量大,对于已经汇聚、集成的数据,一方面,如何去设计适用于分布式环境下的数据存储模型,以满足高可扩展、高可用、高吞吐的需求;另一方面,如何结合轨道交通数据的时空特性,构建包含时空索引、全文检索在内的多类型索引模型,减少查询的搜索空间,加快查询的过程,也是一个关键的挑战。
02
数据存储的挑战
目前,大数据的数据量已经从TB级跃升到PB级,数据存储容量的增长速度远远落后于数据增长速度。特别是在轨道交通运维中,每天都会从各种传感器产生海量数据。传统数据存储基础设施和数据库工具已经无法应对日益庞大和复杂的海量数据。因此,设计最合理的数据存储体系结构已经成为一个关键的挑战。
03
数据处理的挑战
轨道交通数据的体量大,产生速度快,既包括了实时产生的动态数据,又包括了归档的静态数据,使传统的单机处理难以满足轨道交通应用实时处理的需求,如交通数据预处理、交通状态识别、实时交通控制、动态路径引导和实时交通调度等应用;轨道交通数据包含大量的来自不同数据源的异构数据,同时必须与历史数据进行比较,并在短时间内进行处理,数据处理系统必须能够处理更复杂和日益扩大的数据。
04
数据分析的挑战
数据分析的目的旨在挖掘、提取海量轨道交通数据背后隐藏的规律及知识。对于轨道交通大数据分析而言,其核心问题在于如何对轨道交通大数据进行有效的表达、解释和学习。
对于轨道交通大数据的分析需要轨道交通运营管理相关业务的深度融合,根据不同业务需要建立统计、分析、预测、决策等模型,开展模型验证与训练,并在此基础上搭建以各类业务应用场景为主题的大数据创新应用开发。
05
安全性的挑战
具体而言,针对轨道交通大数据的安全性包含以下几方面:
01.用户隐私保护:如何保证在数据的传输、处理、应用过程中,用户的隐私数据不会被非法用户及非授权应用访问;
02. 数据的可信度:由于轨道交通大数据来源广泛,数据质量参差不齐,如何为上层应用或用户提供可靠的数据;
03.大数据访问控制:如何通过用户鉴权和访问控制避免非法用户和非授权用户对轨道交通大数据的访问。
3. 德拓助力轨道交通应对大数据时代
01
大数据平台建设
基于德拓大数据相关产品以及轨交行业领域知识,通过采用通用存储服务器设备的超融合基础架构,为上层数据处理提供存储、计算、网络、虚拟化等基础资源;采用国内成熟先进的分布式开发套件,为系统集成、数据采集、数据存储、数据挖掘、数据治理、以及数据应用可视化提供开发框架和服务引擎。
对全路网的基础信息、行车、设备、客流、清分清算、票卡、运营维护等数据进行治理汇聚,建立数据资源分类及数据资源库,为智能应用、数据交换等提供数据支撑,并且根据业务需求构建一套完整的业务指标体系,分析、挖掘数据潜在价值,并将数据分专题地展现到路网结构中,以支持指挥中心和运营企业提高网络化运营管理水平、服务水平,为网络化运营中突发事件提供应急辅助决策支持、对政府科学决策提供基础信息支持。
通过图形化的配置界面实现分布的、异构的、跨各部门信息资源的交换共享,实现统一平台与各部门数据资源的共享交换;同时,为整个业务应用层提供支撑,主要提供统一权限、统一身份认证、统一授权、统一门户等功能。
02
典型应用开发
| 路网客流预测分析
网络化运营环境下分线与跨线组织的“客流”与“车流”相互作用,若不能准确把握运能供给与客运需求相互匹配的动态规律,在某些情况下往往会加剧运力与运量的矛盾,增加了运营风险,突出表现为车站通行能力不足、新线开通后路网运输能力不足等方面,难以有针对性地进行科学高效的运营组织。
因此,要充分发挥城市轨道交通网络的整体效能,不仅要大幅度提升路网设施的技术装备水平,还要不断优化线网规划设计和运营组织方案。
为了保障线网规划设计和运营组织方案的科学性,通过大数据技术手段对不同阶段(包括实时客流预测、突发事件客流预测、大客流预测、日常短期客流预测、新线开通路网客流预测)的客流进行有效分析、预测,在充分考虑影响城市轨道交通网络客流分配的主要因素,以及城市轨道交通网络的特有属性的基础上,对城市轨道交通网络的客流预测问题进行理论建模,并设计求解算法,通过实际运行数据,对模型及算法进行验证与优化,为轨道交通列车运行组织和车站客运组织提供重要依据,为政府运营管理部门和政府决策部门提供决策参考。
| 路网风险隐患分析
随着站内客流量不断增加,易造成乘客在车站大量滞留或行走缓慢。路网风险隐患分析对站内乘客出行特征进行实地观测和分析,运用大数据客流分析模型验证的方式,来评估客流组织方案的绩效,实时预测站内风险隐患位置,并通过对站内风险点位客流的预警设计,得出不同的客流量对风险等级的影响程度,按照不同的影响程度进行不同的预警等级划分,从而提前发布相关预告,使各级相关部门提前做好预防措施,进而有效的化解突发客流的风险或者降低事故发生带来的损失。
| 人员效能管理分析
随着快速发展和高负荷的运营线网,管理维护人员工作负荷及压力与日俱增,如何高效、科学的配置及评价有限的人力资源,保障和提升线网维保水平和运营安全,是地铁公司所面临的严峻考验。
通过人员效能管理分析,利用大数据融合分析技术,采集各业务系统中的人、事、物及其关联数据和信息,运用大数据的技术实现对数据的整合分析,并基于整合分析的结果来构建、丰富和完善公司不同岗位工作人员的个人工作效能画像,以支撑实现基于客观、量化个人工作表现的透明奖惩激励制度,从而提升整体工作生产效率;也可以基于数据分析技术洞察发现目前公司各专业管理风险盲点,实现高效业务监测和管控。
在轨道交通行业的飞速发展过程中,积累了大量的优质数据,德拓的大数据工具可以帮助轨道交通行业更好的应用数据资产,创造数据价值,优化轨道交通运营,助力其提升服务水平,让每一次出行更安全、高效和舒适。