不明白
是因为困在雨中
才会如此思念
还是因为
如此思念
所以被困在雨中
一览众山小 | 可持续城市与交通
韧性城市专刊 《WE THE RESILIENT》
We the Resilient
2020年 7月23日期
原文/ Muhamad Azfar Ramli、Christopher Pineda Monterola
翻译/ 陈俊兰 林漉丰
编辑/ 众山小 校核/ 于萌
文献/ 米亚 排版/ 王天实
微博 | weibo.com/
一览众山小
团队成员
滑动查看更多本文工作团队脸萌
一览导读
流行病又一次近在咫尺,研究高密度城市环境里的如何传播尤其重要,那么规划师是如何考虑的呢?在本篇文章中,分析了典型城市的公交联系网结构,旨在确定减轻流行病传播的有效策略,通过模拟感染传播,并且纳入治愈率(SIR)作为考量,以便更真实地估计网络中潜在的最大感染人数,评估各种节点去除策略后的感染传播动力学影响以测得的强力流感的传播率。
摘要|ABSTRACT
本文分析了通勤客流在城市公交网络中呈现的结构与弹性。利用新加坡公交卡的刷卡信息获取通勤者在普通工作日当日使用公交系统的数据,依此建立通勤网络。研究发现,该网络结构并非任一尺度而是与小环境呈指数关系模式。99.97%的通勤者在一天中都可与其他人在7步范围内连接并相遇。我们通过调整关键参数-持续相遇时间(TE)来展现该网络的结构变化。在这之中当持续相遇时间(TE)的阀值设定为15分钟时,能连接到的通勤者总数随即减少了50%。随后,我们通过比对感染的动态传播趋势来评估对通勤客流有无采取针对性阻断策略的效果。在假设公交网络特征一致的前提下,我们的模拟结果表明,在不对交通节点采取阻断的情况下,在发生感染后的7天之内,将有99%的通勤客流被传染。尽管研究已证明有针对性的阻断策略会延迟感染峰值的到来,但不能根本上有效阻止通勤者最终不被感染。
一
导读
全球都市人口在过去数十年间快速增长。据预测,人口增长趋势将持续至本世纪末。这意味着全球范围的流行病,比如禽流感、SARS、埃博拉会离我们更近。因此,研究传染病在高密度城市环境里的传播机制是全球规划师都关心的问题。
研究表明,网络结构特征是影响流行病传播的重要机制。值得注意的是,自由尺度网络与传统的随机网络相比有显著的特征,尤其是在缺少传染病传播阀值的情况下。由于一手数据难以获得,既有研究运用合成网络的方法突出显示不同的传播特性。
正是因为数据更易于挖掘,人们通常分析线上社交网络的传播动态。这些研究也在一些有趣的领域得到应用,例如遏制计算机病毒的传播和互联网上信息的传播。社交网络通常具有自由尺度特性及长尾分布特征,因为线上连接的总数没有上限约束。然而现实中,人们能够互相遇到和接触到的范围是有限的,因此物理上的相遇网络与在线系统相比具有不同的结构特性。
通过运用实际数据,城市内部迁移率及远程城市之间的迁移率对疾病传播的影响已有不少研究。但是,这些方法中罕有足够精细到可以分析人与人之间的个体互动。其中最值得注意的是Sun et al对于新加坡公共巴士系统通勤者创建的联系网络。同时还有易受感染模型(SEI)的方法,其采用模拟的方法对流行病传播的敏感性进行调查。调查结果推荐了一种可早期发现重大疫情的方法,即将与他人联系最多的个体作为检测指标。
在本文中,我们分析了典型的都市公交通勤网络结构,旨在识别减轻流行病传播的有效策略。我们将高度依赖于网络结构的网络弹性作为研究手段, 通过模拟感染的传播以及对治愈率(SIR)的考量,更真实地估计网络中潜在的最大感染人数。最后,我们评估通过实施各种阻断、去除节点的策略,对感染的动态传播影响用来检测病毒性流感的传播率。
二
建立大规模都市公交系统通勤客流相遇网
我们以新加坡的公共交通网络为例,研究通勤客流之间相遇的性质和动态变化。在新加坡,公共巴士系统以及快速公交(MRT)和轻轨交通(LRT)系统构成了公交系统的主体。MRT是新加坡跨岛通勤的主要方式,公交巴士也提供长途出行和社区间的交通服务。在新加坡,整个公交系统由全岛4600个车站和340条覆盖长途、短途的公交线路组成。由于缺少高精度数据,研究MRT 和LRT内的通勤很难,但较易通过公交刷卡数据识别发生在公共巴士系统中的相遇相连。
图一、通勤客流相遇网络可视化图a)单程客流网络图b)由同一公交车串起的多程连接网络图。节点尺寸与节点连接强度成比例,统一颜色节点按行程时间来分组。一些通勤者又各自连接着不同集聚子集,他们合在一起了形成了整个网络的全连接。网络可视化由开源软件Gephi制作。
为构建一个代表每个通勤者和多种出行方式之间各种相遇的网络模型,我们采用了新加坡交通部门提供的2012年3月某天约340万条匿名历史出行数据。这一天有150万的乘客使用了公共巴士服务。当通勤者刷卡上公交车时,我能采集到存储智能卡的ID、巴士ID和上车时间、以及上车站点信息。下车时通过刷卡记录下车时间信息。通过综合同一时间在同一公交上的不同乘客的信息,我们可以辨别出哪些乘客在他们的旅途中相遇。网络中的每节点都代表一个公交乘客。当一个新乘客上车时,该乘客和每个在车上与其相遇的其他乘客之间会在网络中增加一条相遇“边”。当该乘客下车时,其与各个乘客的相遇时长被记录在相遇边的属性中。文中我们将此时长称为持续相遇时间(TE)。如同一天中,两个乘客之间产生多个边,我们只记录他们相遇时间的总和。
然后,我们将当天3617辆活动巴士的所有行程数据组合在一起,形成一个庞大的全国性网络数据集。值得注意的是,选定的乘客在同一天内在各条线路间换乘时,会在不经意间将不同的网络连接在一起(请参阅图1(b))。我们还注意到,数据集显示每个乘客的平均通勤次数是2.27次。这个数字与每个通勤者每次出行的行程平均数一致,通常包括早晨上班/上学的通勤和晚上回家的通勤。
表一、客流相遇网络数据汇总
网络数据统计
统计量
总节点数(N)
1,490,565
被阻断的节点数
294
总节点数(E)
75,670,986
网络密度(2E/N(N-1))
6.81x10-5
节点相邻边的数量,即平均度Kn
101.55
平均持续相遇时间(TE)
9.64分钟
集聚系数
0.56
GC体量(相对于N的百分比)
1,490,140(99.97%)
GC直径(近似值)
7
三
大型通勤客流相遇网的特征
我们首先对该网络用到的一些统计数据进行定义来表示接触网络的特征。N表示网络规模,是网络中的节点总数(n),即所记录的刷卡乘车的乘客数。E表示相遇边的总数,即任何两个乘客之间发生的相遇次数。任一节点相邻边的数量表示为相邻度kn。持续相遇时间TE定义为两个通勤者一天内相遇的总时间。
网络的可连接部分代表网络节点通过有限距离可相互连接的任何子集。巨型互连体(GC)是网络中可形成的相互连接的最大维度,可以衡量任何感染源的潜在传播范围。在不限时间的情况下,GC内出现的已感染节点可以传染其内部的所有节点。另一个指标是网络直径,即两节点间最短路径的最大值。该指标表示网络的传播能力或触及范围,较小直径表示两节点间更快的传播。
表1总结了通勤客流相遇网络的基本特征和乘客相遇的统计数据。我们观察到这个庞大的网络呈现出高度集聚(具备相似规模的随机Erdos-Renyi网络的聚类系数为6.78×10-5,此处为0.56),平均集聚度显著高达100。我们还注意到,这个数字确实与新加坡公交系统中采用的公交车载客量相一致。新加坡单层公交车为90座,双层为133座。由于构建了乘客之间所有可能的相遇边,通勤客流相遇网络的确理应具有高度集聚的特征。
值得注意的是,我们发现客流相遇网呈指数分布(请参阅图2a)而并非自由随意分布。这是因为对于乘客而言,车载容量限制了一辆车内相遇的人数范围所以不可能呈指数型增加。这一结果对我们试图表达网络的弹性有重大指引作用。经证明自由尺度网络和指数型网络的弹性会对不同的(传染)攻击机制做出截然不同的反应。第5节将更详细地讨论此问题。
我们还发现通勤相遇网络中的GC(巨星互联体)占据了节点总数的99.97%。此外,该具有150万个节点的相遇网其直径仅为7,这表明该网络具有小环境属性。这个结果对于高度连接的随机网络来说是意料之中的,但仍然令人担忧。因从理论上讲这意味着一个具有高度传染性的乘客能够在7步之内感染该市几乎所有150万个通勤者。
四
接触时间的阈值对于网络的影响
靠接触传播的传染病其传播能力取决于接触/相遇时间的长短,图2展示了基于相遇时间阈值TE的影响:
随着TE增加至25分钟,指数b逐渐降低然后趋于稳定,当TE大于35分钟时,b又再次降低。这个平坦区域很有趣,在这个区域里网络结构与TE是不变的,因此这个区域代表的是动态传播的过程。由于许多TE低于阈值的相遇边都被去除了,网络则逐渐断开,当阈值达到15分钟后,GC的大小迅速减小到最初体量的一半。这是因为随着GC断开的节点数目的增加,这些断开节点的总数也相应地增加(参考图3)。尽管GC的体量在减小,但其节点间最短直径的最大值在50分钟时从7逐渐增大,到最大为41。GC的平均体量在TE=1时迅速下降到约为1,这表明大多数节点基本上彼此阻隔了,未再形成较小的聚集(即许多节点并没有新增加相遇边)。
总体上,我们观察到当我们将阈值提高到15-20分钟左右时由于大多数通勤者相互不能再相遇到了,网络已不能继续感染全部人口。然而我们也发现,即使设置高阈值,GC也会持续存在,并不会突然分割成较小的集聚,这与在随机网络中观察到的类似于过滤式的突变行为有所不同。
五
结构化攻击和相遇网络的结构性随机失效
我们通过逐步去除一定百分比的节点和与之相关联的边来分析公交客流相遇网络的整体恢复能力。并对三种策略进行对比:a)随机去除一定百分比的节点;b)有针对性地去除最高度的节点;c)去除最高度节点之间的中心点,其中,中心点根据下述公式来定义:
σ(s→t)是节点s和t之间的最短路径数量之和,而σ(s→t|v)是通过节点v的s和t之间的最短路径数量之和。我们用第三种策略作为攻击该网络的替代方法,因为来自子集网络可视化的证据表明,几个低度节点在不同的行程网络之间形成桥梁(参见图1(b))。因此我们推测这些节点实际上可以通过高度节点之间的中心点来识别。
由于网络呈现出与随机网络具备一定相似度的结构特征,我们推测,与自由尺度网络中节点的去除相比,有针对性地去除最高连接度的节点并不能有效的破坏掉整个网络的结构。而模拟的结果也支持这一观点,尽管有针对性的去除节点从而使去掉的边的总数大于随机去除的总数。但去除方法不影响GC体量或GC成分数量的变化率(见图4)。同时,结果的确表明,与随机去除相比,定向去除的确显著增加了GC的直径。但去除(高度节点)之间的中心点与去除高度节点后两者的差异不显著,且由于中心点的计算比节点度的计算代成本更高,因此排除了策略b),即在网络中有针对性的去除节点。
图二、相邻度的分布和平均相遇时间分布曲线(a)相遇网络的度分布与指数分布f(kn)≈aexp(bkn)非常相似,在连续阈值从0到50分钟的情况下都满足。(b) 横轴数字表示应用于网络的阈值(以分钟为单位)。插图 (a) 显示线性拟合后相邻度分布曲线指数b的变化。箭头突出显示了b保持相对不变的的范围。(b)相遇时间分布也类似于指数分布,尽管当与插图中的度数进行比较时,它显示出两个量之间的相关性很小
图三、随着相遇时间的阈值增加,网络属性也不同。通过绘制这些值和最大值的比值,它们可呈现在同一轴上。我们还提供了最大值作为参考:最大平均组成尺寸(△)在 TE=0min时为2.26,在TE=1min时迅速降至1,在TE=50mins时获得的最大直径(■)和最大成分构成数量(□)分别为41和1434580
图四、不同网络属性随节点数的变化图。节点数从5%到50%,以5%的间隔逐步去除。未填充圆( ○)表示随机去除的节点,填充圆(●)表示有针对性地去除相邻度最高的节点,而方形标记(□)表示去除具有最高中心点节点
六
模拟病毒在客流相遇网络中的传播
最后,我们使用标准的SIR流行病传播模型来测试网络在几个受感染的乘客身上的传播能力。由于我们的网络是基于一天内的相遇,因此在模拟中将一天表示为一个时间段。所有的通勤者都是从易感状态(S)开始时仅少量通勤者处于已感染的状态(I),他们被标记出来,与他们相邻的通勤者在网络中以β感染率在下一个时间段过渡到受感染的状态(I)。在处于已感染状态后,通勤者将以概率γ过渡到最终恢复(R)状态,此时通勤者对上述疾病完成免疫(见图5(a))。
我们在模型中做了几个假设:假设网络在整个模拟过程中保持条件不变,即不考虑周末的影响,因为往往在周末通勤量和通勤模式都会发生变化而产生不同的网络结构;假设传染只通过公交换乘接驳网络发生,而暂不考虑其他接触方式的影响,例如在家中或工作场所发生的接触;假设在被感染后通勤者的出行方式不会改变,因为实际中通勤者被感染后更可能留在家里或去看医生,而不是继续去工作或上学;我们还通过设置使模型里的新被感染的乘客只可能在被感染的第二天传染给其他乘客。因此,从通勤者被感染到他能够感染其他通勤者,该模型提供了一个约为一天的自动潜伏期。
我们基于对学校周围高精度的相遇网络模拟分析所报告的感染率和恢复率,同时也根据流感在商业客机中传播的概率,从而选择了适合的感染率β和恢复率γ,相当于每20秒的感染率为0.003。在我们的模拟中,时间单位为1天,我们通过9分64秒这一平均相遇持续时长来简化计算所有通勤者相遇的日均感染率。从而得到了最终感染率(1day)=1-[1-β(20sec)]^(9.64×60sec/20sec)。在模型中,被感染的通勤者从疾病中恢复所需的时间为正态分布,平均为1/γ=10天,方差为5天,最初的10名感染者随机选择来决定。结果表明,在模拟的7天内,受感染的通勤者数量迅速增加,并呈指数增长,最高可达93.03%。(见图5(b)),受感染的通勤者在大约30天后才从感染中恢复(n(I)=0)。我们将此结果与两种不同的模拟结果进行比较,在这两种模拟中,分别使用目标去除和随机去除来去掉相遇网络的边。结果表明,保留在网络中的节点中,最多约为90%的剩余节点仍会受到感染,这两种策略之间的差别很小。对目标节点进行去除时我们发现感染时间被最大限度的延迟了5天左右。这一证据支持我们先前的陈述,即,虽然通勤相遇网络的连接性对于不同的去除策略而言结果是相似的,但由此产生的GC直径的差异影响了疾病通过网络的传播速度。
七
结论和讨论
综上所述,我们构建了一个典型的大都市搭乘同一公交巴士的通勤者在典型的工作日一天内相遇所产生的网络。该网络因其具有高度的集聚性、高密度和目标节点抗去除的独特结构性质,导致具有巨大的疾病传播能力。该网络中99.97%的通勤者在7步内实现了充分的相遇,模拟结果表明该网络具有在感染发生后7天内传染到整个通勤人群的能力。虽然这些初步结果可能令人震惊,但研究结果进一步表明,当对持续相遇时间设置阈值时,网络则很容易被阻断。换句话说,只有短时间内能够(小于10分钟)传播的高传染性疾病才能够感染整个网络。尽管有针对性地去除基本节点无法阻断网络中最大的互联体中剩余的大部分节点,但依然可以延迟流行病的峰值,可以更容易地实施不同组合的缓解策略。
图五、a)具备三种状态的标准SIR模型示意图:易感(S)、感染(I)和恢复(R)。b)每天感染率β=0.083,恢复率γ=0.1的接触网中受感染通勤者的增长动态。显示了三种测试情况:全网络(○)、随机选择的35%节点被去除的网络(●)和最高等级的35%节点被去除的网络(□)。水平蓝线表示与两个去除方案仍与连接到网络的节点的最大百分比(65%)相关
我们的研究表明,在通勤者使用公共交通系统遇到其他陌生人的过程中,疾病传播的机制至关重要,并且在综合模型中不应被忽视。虽然可以很容易地对共享同一工作场所或同一家庭中的个人进行接触路径追踪,但对于高度动态的网络(如本文中强调的网络)来说,追踪疾病传播途径要困难得多。因此,出行数据(如本研究中使用的数据)的应用应成为未来追踪高传染性疾病传播路径的重要部分。我们的研究也在很大程度上未考虑进公交司机的重要作用,司机肯定会成为这一通勤相遇网络中传播感染的巨大枢纽。如果能够提供公交车司机值班的数据,那么公交司机与通勤者相比的影响可以建模并量化,则可以设计不同的有针对性的节点去除策略。我们的工作也为接下来更详细的分析铺平了道路,希望未来这些分析能够由出行数据集(如本工作中确定的数据集)与可确定的通勤者的家庭和工作场所/学校的数据集相结合而产生。
免费下载
免费下载一览众山小提供的原文资料:
微信公众号 后台留言
或电邮 Daizongliu@qq.com
01
《The Resilience of the Encounter Network of Commuters for a Metropolitan Public Bus System》
~ THE END ~
我们作为独立的专业志愿者团体,秉承专业理想与价值观,不依托任何机构,信守非盈利原则,帮助中国城市可持续发展。我们关注的领域包括但不限于:城市规划与发展战略、城市交通、公共交通与非机动化出行、活力街区、街道与城市设计、量化城市与大数据。至今我们已经拥有遍布全球近430名志愿者网络,并推送3000篇专业微文。作为微信公众号平台最大的线上专业志愿者平台,我们感谢您对我们的关注和支持,并欢迎加入我们!
所遇成文 余生有歌
2014-2020 ? 转载请注明:
转载自公众号“”