主要作者:
张宇,北京市城市规划设计研究院,教授级高级工程师;
王建光,百度地图高级研发工程师;
郑猛,北京市城市规划设计研究院交通所副所长,教授级高级工程师;
阚长城,百度地图资深研发工程师。
《大数据与AI驱动的交通规划方法创新》是响应国家新一代人工智能发展规划的号召,由北京市城市规划设计研究院交通规划所联合百度地图慧眼、中国科学院自动化研究所、智慧足迹科技有限公司、等研究机构共同开展的,基于大数据结合人工智能算法在城市交通规划领域的应用方法探索。希望借助大数据和人工智能算法的融合为城市交通规划行业带来新空气,甚至革命性变革。进而为城市规划注入新活力。
北京上班族,自称“世界最奔波”的上班族群,其真实的生活状态、出行状态如何一直都是重要的城市话题,也是城市规划需要解决好的核心问题之一。北京市城市规划设计研究院与百度地图慧眼联合课题组使用慧眼常住人口、岗位、通勤职住和出行OD大数据识别出北京上班族,并挖掘他们的生活与出行状态,总结出北京上班族的空间分布与出行特征的七大特点。为未来的规划中给北京上班族提供更好的服务打下基础。(注:相关数据处理各环节均匿名化,各环节及输出均不涉及个体隐私)
据百度慧眼大数据识别统计,北京上班族平均通勤距离为13.0公里。5公里以内的上班族占到1/3(这1/3的上班族应该是非机动化出行方式应该努力争取的通勤人群),10公里以内的上班族占到一半,15公里以内的上班族则占到70%(通勤距离15公里以上的近1/3的上班族应是轨道交通优势范围服务人群),20公里以内的上班族则占到80%,40公里以上的上班族已经算小概率事件了(<5%),然而的确还有近1%的上班族通勤距离超过了70公里,相当于单程绕北京四环路一圈还多一点。
北京上班族通勤距离(公里)分布曲线图
对比国际大都市,上海平均通勤距离8.2公里(2013年),东京平均通勤距离11.0公里(2000年),伦敦平均通勤距离9.1公里(2001年)。北京13公里的通勤距离 “名列前茅”。与旁边的邻居天津市对比也高出近30%(天津中心城区2017年平均通勤距离10.2公里)。对比可见,北京的职住分布及城市功能布局还有很大的优化空间。
不同年龄段上班族的平均通勤距离比较可见,25-34岁的上班族平均通勤距离最长,达到14公里以上。比55岁以上的上班族长了1/4。按年龄段推断这些人群大多是“有娃在上学”一族,“以娃上学为中心”的居住地选择依据可能是导致他们通勤距离较长的一个主要原因。而即使对于55岁以上的高龄上班族,其平均通勤距离依然达到11公里,比北京二环路的直径还要长,可见北京高龄上班族的“体格子”还是不错的。
为了可以更好的描述北京上班族的空间分布特征,我们将北京“最奔波”上班族和上班族“最扎堆”聚集地,按职住位置进行识别,洞见其空间分布特征。
为反映“最奔波”上班族就业地,我们首先将上班族就业地聚集到交通小区尺度,并对一定就业规模交通小区(2000人以上)的上班族平均通勤距离进行统计,得出北京“最奔波”就业地主要为:海淀区的上地、北京城市副中心的北京行政办公区、房山区的大学城、顺义区的首都机场临空经济区、昌平区的乐多港与八达岭奥莱地区等区域,几个区域的平均通勤距离均在20公里以上,大多超过25公里。
细分可见,乐多港与八达岭奥莱地区属于近几年打造的文化旅游区、房山大学城、北京行政办公区等属于近几年功能疏解的功能承接地,目前处于刚刚搬迁后的“调整”期,随着今后功能配套的完善,长距离通勤有望得到缓解。而上地和首都机场临空经济区则成为相对稳定的“最奔波”上班族就业地。
根据识别的上班族就业所在地,进行就业岗位强度统计可见,最集中的办公地,主要为海淀区的中关村、西城区的金融街、东城区的王府井和东单地区、朝阳区的CBD等区域。就业岗位密度均在5万个/平方公里以上。此外,如海淀区的上地、丰台区的丰台科技园、朝阳区的望京等地就业岗位密度也已达到2万个/平方公里以上,已形成了部分就业次中心。
就业中心的总体分布上,城市北部就业中心明显高于南部。沿东西长安街两侧形成了相对明显的就业中心轴带。
与上面“最奔波”就业地叠加来看,只有作为次就业中心的上地地区属于就业强度较大同时通勤距离较长的地区,看来“码农们”在完成了一天长长的代码编写后,还有漫长的回家路等着他们。建议在后续的规划中给予他们“特别关照”。
“最奔波”上班族居住地同样将上班族居住地聚集到交通小区尺度,并将2000人以上的一定居住规模交通小区的上班族平均通勤距离进行统计,得出北京“最奔波”居住地。整体来看,随着居住地与市中心距离的增长,其通勤距离也随之增长。仅有北部部分外围圈层的新城(如延庆新城等),目前还呈现相对独立的新城内近距离通勤状态。
因此,“最奔波”的上班族集中居住地主要分布在近郊新城内。平均通勤距离前三甲的代表性居住地分别为:房山新城的良乡地区(平均通勤距离26.9公里)、昌平新城的南邵地区(平均通勤距离25.7公里)、大兴新城的天宫院地区(平均通勤距离22.2公里)。
根据识别的上班族居住所在地,进行就业人口居住地强度统计可见,最集中的居住地,主要集中在城市南部地区,分布为丰台区的马连道、马家堡、成寿寺、朝阳区的潘家园,以及北部昌平区的天通苑地区。居住的就业人口密度均在2万人/平方公里以上。
就业人口的居住地总体分布与就业中心正好相反,呈现南部高、北部低。东南三环沿线分布较为集中的特点。
在周边新城中,虽然未形成2万人/平方公里以上的强就业人口聚集区,但通州新城、通州马驹桥、门头沟新城等新城均有1.5-2万人/平方公里的较强就业人口聚集区。其他新城也均有1.0-1.5万人/平方公里的中等强度就业人口聚集区。
与上面“最奔波”上班族集中居住地叠加来看,房山新城、大兴新城、昌平新城的部分区域均属于聚集度与通勤距离均较大的区域,应该在后续的规划中予以重视。
通过对北京通勤人群出行目的的识别与统计发现,通勤出行在早晚高峰的出行比例最高,在早高峰时段(6点到9点)三个小时发生的上班出行占比近50%,其中高峰小时发生的上班出行占比近20%。下班回家的晚高峰时段(16点至19点)发生的下班回家出行占比也近50%,其中晚高峰小时发生的下班出行占比为19%。与其他出行目的对比,通勤出行的早晚高峰集中度明显大于其他几类出行。
上班族各类出行绝对量在时间轴上的累计分布可见,早7点至8点和晚17点至18点为上班族出行总量的双峰值,均接近270万人次,一小时出行量占上班族全日出行总量的近9%。
虽然前面几个特点显示了北京上班族的辛苦,但数据显示年轻的上班族还是北京夜间经济时间最活跃的群体,可见他们“苦中作乐”的特质还是很明显的。
根据不同年龄段全日非通勤出行时间分布对比可见,夜生活阶段,越年轻的上班族晚上活动越活跃。显示了他们才是北京夜间经济当之无愧的“主力军”。
而随着上班族的年龄增大,在日间平峰的活动比例越高。
相较而言,45-54岁群体整体的非通勤活动强度相对较低。
本研究使用的职住数据和出行OD数据由百度地图慧眼提供。百度地图慧眼依托百度地图开放平台,具备位置大数据采集存储、挖掘分析、可视化输出等完整闭环能力。截止目前,百度地图开放平台每日响应超过1200亿次位置请求,覆盖智能设备月活数超过11亿台,数据覆盖全国。
通勤是交通规划的重要场景,而职住分布和出行OD是探究通勤场景的重要基础数据。百度地图慧眼利用海量位置数据完成了职住挖掘模型和出行OD挖掘模型,对人群的通勤规律进行探究。(注:研究数据均经过脱敏处理,不涉及个人隐私问题)
基于位置大数据的职住挖掘
职住挖掘基于人群长期的位置信息,通过聚簇方法得到人群经常停留的地点,然后根据停留时长、定位点时间分布、停留地用地类型等特征判定停留地为家、工作地或其他类型,进一步就得到城市各区域通勤人群的职住分布。结合用户画像数据,可以进一步分析通勤人群的各维度属性,如年龄分布、行业分布等。
出行OD挖掘的主要工作是根据用户位置的时空信息捕捉其出行行为,包括出发地、目的地、出发时间,出行耗时等。挖掘算法的处理流程如下图。
出行OD挖掘算法流程
首先对数据进行脱敏处理,后续对数据的处理均不涉及个体隐私。将定位点按时间排序,去除轨迹中的异常定位点;使用密度聚类算法,将定位轨迹在空间上聚成若干簇;根据定位信息、时间和空间范围,计算每个空间簇的状态,将停留状态的簇标识为O或D,此处辅助常访地和场景化信息判定;停留状态的簇在时间上的切换构成出行OD。
经过北京市城市规划设计研究院与百度地图慧眼课题组人员的反复核验,最终选用上述出行识别算法中出行生成约束的中尺度方法作为北京出行生成的判断标准方法。由此得到的有出行样本人群日均出行次数约3.0次/日。与传统调查数据及其他口径大数据对比,结论基本一致。
在此基础上,将通勤人群与北京的人口普查年龄分段数据进行对比分段扩样。有出行不同年龄分段通勤人群扩样见下图。
不同年龄阶段百度有出行人口数据与普查有出行人口数据对比及扩样系数
上图可见,19-44岁的几个年龄段人口百度数据的整体分布与普查数据较为吻合,扩样系数基本稳定在2-3之间。45-54岁段扩样系数则在4.5左右,55-64岁扩样系数则达到20以上。分年龄段扩样后,保证了上述分析更好的代表性。
通过扩样和校核,课题组认为百度地图慧眼的通勤人群分布特征与出行特征比较符合对城市的认知与判断,可以辅助城市决策分析,尤其对城市通勤人群的认知再现较为理想。因此,课题组将百度地图慧眼的通勤人群的职住地分布及相关出行分布与北京市域战略交通模型(BJTM-V2.0)进行融合,使用百度地图慧眼的通勤人群出行特征代替部分传统模型的演算结果,提高了模型对复杂城市的出行行为的整体模拟精度。具体流程见下图。
使用百度地图慧眼大数据进行四阶段模型混合预测流程图
鸣谢上海市城市规划设计研究院张天然、天津市城市规划设计研究院万涛提供相关城市通勤对比数据。