“
那个蹲在街角抽烟憋论文的人,
那个公园里寂寞地荡着秋千想文案的人,那个深夜小区门口醉酒呕吐的人,那个公交末班车上突然眼圈红起来的人,
那个办公桌前隔着手机看宝宝吹蜡烛的人,
那个高楼唯一亮着的灯下准备PPT的人,那个独自躺在床上辗转难眠的人,
我们一起翻开那本书好不好。
《Citipedia 城事一览》
我们作为专业志愿者,
秉承共同理想,帮助中国可持续发展...
也帮助奋斗的你。
双十一特惠活动现已开启
点击阅读原文或扫描二维码
”
编 辑 团 队
原文/ 聂宇 美国西北大学 魏雪延 东南大学
解读/ 思予、Tina黄思琪、季钧一、Zephyr
文献/黄飘 编辑&校验/ 众山小 排版/毛丽雅
一
城市
交通
览
导 读
共享自行车的数据分析我们已经看过很多,但是试着把单车理解成正在扩散的新闻或者病毒是不是听起来脑洞大开?事实上,这是University of Northwestern的聂宇教授和他的团队最新论文主要探讨的话题——用扩散理论来研究共享自行车在城市中的移动模式。这是一种从物理演化机理层面去印证和发现社会行为和城市通勤模式的新思路。利用这种研究方式,我们一方面可以总结出人们利用自行车出行的行为规律,以此来改进共享自行车提供的服务,配合人们的出行习惯;另一方面可以发现一些调度和自行车利用率的关系,以研究出更高效的自行车调度方式,为运营商节约成本、提高自行车流通率提供可能性。
图一、数据可视化:社区(左)和Divvy Bike站点(右)的空间分布。(图片来源于论文)。
一、介绍
这篇论文(参考文献1,如需下载请公号后台留言索取)试图从一个独特的角度来理解共享自行车系统的运营。具体来说,我们把有桩共享自行车系统中自行车的移动看作是一种类似于信息(比如,新闻)或病毒的扩散过程。共享自行车系统所运营区域的范围被划分成很多个小区域,我们把它叫做社区。每个自行车可以类比成一则新闻或一个病毒,每个社区可以视作一个人类智能体的类似单元。社区间的自行车交通流代表智能体之间的连接,流率代表连接的强度或信息与病毒从一个智能体向另一个转移的可能性。研究共享自行车的扩散模式,是从物理演化机制的层面实现对系统动态运营过程的量化表达。相较于基于历史运行结果来间接估算未来运行状态的研究方法,基于扩散模式的研究有助于从物理动力学角度实现对系统状态的直接推演。理解自行车扩散行为不仅有趣,而且具有实际意义。我们用从芝加哥共享自行车系统Divvy Bike收集的实际运营数据来描述和分析共享自行车的扩散过程。本研究重点挖掘:(1)在一段时间内,自行车是否能够扩散至系统运营区域的所有社区,并以怎样的速度扩散;(2)影响自行车扩散行为的因素有哪些。值得一提的是,研究结果表明,单个自行车的扩散行为与其所完成的出行次数和所接受的调度(reposition)行为强度密切相关。创建快速且自我调节的扩散模式的意义在于增加自行车的使用,并减少平衡供需所需要的资源。虽然这项研究没有直接解决这样的设计问题,但它为未来的探究奠定了基础。
二、初步分析
2.1 数据描述
Divvy Bike于2013年开始运营共享自行车系统,截至2016年2月,在芝加哥城区每年都有约320万次骑行。芝加哥是北美人口最多的大城市之一,拥有一个充满活力的大型市中心,吸引了大量的上班族和游客。如图一所示,Divvy Bike系统拥有约600个车站,覆盖芝加哥市和两个邻近的郊区。2017年,Divvy Bike在芝加哥地区共运营着6,243辆自行车(Divvy,2018)。
本研究中使用的数据从www.divvybikes.com获得,包括2017年记录的站点数据和匿名自行车出行数据。站点数据包括站点编号和位置(经纬度)。出行数据包括每次出行订单编号、自行车编号、离开时间、出发站点、到达时间和到达站点。依据芝加哥官方发布的的社区GIS数据,将2017年在运营的585个Divvy Bike 站点按照地理位置分配到48个社区内。
2.2 自行车出行距离的实证分布
众所周知,在城市内部,出行距离的衰变服从幂律分布(Gonzalez等人,2008)。具体来说,令P(r)是城市内部出行距离r的概率密度函数,于是,P(r)可以写成:
这里,α和β是参数。简单来说,即不同的出行距离的行程的发生概率,因行程距离的长短而改变。我们开始思考:自行车出行距离是否也具有类似的特征;这个公式在共享自行车出行中的适用性又是如何的呢 —— 以此来展开我们的分析。
原始出行数据不提供实际出行距离的信息。考虑到芝加哥为典型的正南正北、正东正西方向的方格网路网结构,两点之间的骑行距离可以很好地用标准直角坐标系下的绝对轴距之和(即两点之间的曼哈顿距离)来近似。在处理数据方面,我们删除了在同一站点开始和结束的所有行程(大多数情况下,这意味着自行车在被解锁的地方归还,这显然会扭曲出行距离的分布)。
用所有有效出行数据集合计算出的自行车出行距离的实证概率密度函数P(r)在图二(a)中。这张图表明,概率密度峰值在1公里左右,与已有文献(Mobike, 2017b)的观测值一致。与此同时,这个概率密度函数似乎还有两个独特的特征,6公里是这个出行分布的一个拐点。对于出行距离超过6公里的样本,它们服从一个幂律分布;很明显,对于出行距离小于6公里的样本,服从另外一种分布。这个拐点的存在可能表明:(1)大多数居民受限于体能,不会选择超过6公里的出行。(2)在芝加哥超过6公里的通勤需求上,自行车这种出行方式,相比于其他出行方式失去了竞争力。
图二、概率密度函数 (a) 对数坐标系中的共享自行车的单次出行距离分布 (b) 单个共享自行车一年的累计出行距离(参考文献1,如需下载请公号后台留言索取)。
2.3 对幂律分布的验证
为了证明我们在前面章节的观测,我们提出通过下面非线性函数来拟合实证概率密度函数P(r):
这里,αi (i=1, …, 4), β1和β2都是需要标定的参数,r0和是从观测数据中获取的最小和最大出行距离,rc是区分两段区间分界的极限值。我们的Divvy数据表明,最小出行r0距离为200米,这同样与无桩共享单车系统的最小出行距离一致(Mobike, 2017b)。这个下界值很容易理解:没有人愿意为200米以下的出行来动用共享自行车这种出行方式。最大出行距离在本研究中被截断到30公里。
参数估计的结果在表一中。第二个区间的缩放因子β1是1.77。在一个基于钞票扩散(一个追踪纸币钞票在美国各州流通情况的研究,Brockmann, D., L. Hufnagel, and T. Geisel, The scaling laws of human travel. Nature, Vol. 439, No. 7075, 2006, p. 462.)进行人类出行动态的研究中,缩放因子为1.59。在另一个基于手机定位进行个人出行特征的研究中,缩放因子为1.75。这些已有研究中的缩放因子值与我们这里的结果相近。显然,管理人类动态的普遍规律也决定了共享自行车用户的出行模型。我们研究中,β1的值相比于其他文献稍大,可能是由于自行车骑行者对于进行超过他们体能的骑行那有限的意愿和能力,这导致观察到长距离出行的概率衰减得很快。
表一、参数估计结果
图二(b)描述了实证和拟合的一年内共享自行车累计出行距离的概率密度函数,以下表示为d。如我们预期,d服从正态分布,因为它基本上是很多随机变量的综合(每个都成为一个出行距离)。拟合的曲线表明,对于芝加哥的Divvy Bike,概率密度函数在d属于1600公里到1700公里的区间内达到顶峰。因此每辆Divvy Bike平均每天的被骑行距离是4.5公里。相比之下,摩拜单车每天骑行得更多,大约是每天13.3公里(Mobike, 2017a)。
三、社区视角下的分析
3.1 基本特征
本节中,我们从社区的角度,首先分析了共享自行车在研究区域的48个社区中的集计扩散模式,设b是在给定时间段内到达过某个社区的不同自行车总数,B是对应时间段内系统中被使用的自行车(称为“活跃”自行车)的总数,本研究中B≤6,243。
图三(a)针对2017年的12个月绘制了不同社区的b值按降序排列的曲线。例如,任何曲线上x=3的点对应于该曲线对应月份中不同自行车累计访问数量(b值)排名第三高的b值。 就总体趋势而言,图3(a)中的所有十二条曲线都非常相似。 对数视图(图3(b))显示了强大的幂律,表明不同社区中独特的自行车访问次数呈指数级下降。 有趣的是,十二条曲线可以很容易地分为两组:一组由对应于四月到十月的月份的结果组成(红色),另一组由其他几个月组成(蓝色)。 对任何给定的排名(x值),两种情况下b的平均值显著不同。我们容易想到,造成这种差异的原因是,人们是否选择自行车出行与季节非常相关。
我们在图三(c)-(d)中绘制了新的冷季度和暧季度排序曲线,时间跨度从一周到一年。显然,随着时间跨度的增加,社区的累积自行车访问记录数也会增加。 排名最高的社区,观察到的b值超过了6,000。 换句话说,如果观察时间足够长,几乎所有共享自行车都会到达一些“热门地区”。这说明了很少有自行车会被限制在一些特定的社区。
图三、在不同统计时间段内社区等级降序曲线。(a)按月统计。(b)(a)图的y轴对数视图。(c)寒冷季节视图。(d)温暖季节视图。
3.2 统计分析
接下来,我们继续研究哪些因素会影响共享自行车向不同社区传播的速度。首先,在给定的时间段内定义社区的扩散强度pc = b / B (b:在一定时间内到达过该社区的总自行车量;B:在一定时间内总活跃自行车量),为该时间段内访问过该社区的自行车数量占活跃自行车总数的百分比。 上一节的结果表明,扩散强度可能与自行车出行密度有关,因为自行车在夏季明显比冬季扩散得更快。 从图四中可以看到,自行车出行记录总数受到月份的强烈影响:7月和8月达到峰值,且是12月和1月记录的四倍以上。
我们由此猜想自行车所完成的订单数量可能是扩散强度的强预测因子,考虑以各社区内的车站为目的地的出行次数(qc),为了验证这一猜想,我们对每一个社区中,69个不同长度的不同时间段(周、月、季度、半年、年等)获取扩散强度和出行记录次数。
图四、2017年各月的自行车出行记录数
图五绘制了上面产生的样品的扩散强度pc与ln(qc)(qc的自然对数)的关系图。 有趣的是,pc和ln(qc)之间的关系为“S”形状,类似于生物学中广泛使用的S生长曲线,用于描述有限自然环境下种群数量的增长过程,可以使用logistic函数拟合S形曲线。
其中a1和a2是要标定的系数。基于数据样本的基本回归分析得出a1 = 9.51,a2 = 1.08,置信水平为95%。拟合优度度量R2为0.97,拟合水平良好。
图五、出行数量与扩散强度曲线
我们已经知道社区的扩散强度与自行车出行次数非常相关,但其他因素也可能发挥重要作用。值得注意的是,将自行车从一个站点调度到另一个站点(有时在不同的社区)显然有助于系统中自行车的循环流动。
共享自行车调度近年来备受关注,但很少有人考虑过它对自行车扩散的影响。在这项研究中,如果检测到同一车辆一次出行的目的地和下一次出行的起点不相同,就认为该车辆被调度过,如果车辆在调度后至少被使用一次,则该调度行为被认为是“有效的”。我们记录每个社区的有效调度行为的总数,表示为ec,并将其作为第二个解释变量。如果起点和终点在同一社区内的数量较多,则会对扩散强度造成负面影响。显然,如果所有出行的起终点都在同一社区中,那么自行车将被限制在该社区中,不会向其他区域扩散。因此,我们引入第三个解释变量gc,为区内出行的百分比(PIT)。我们的线性回归模型如下:
为了确保所有的数据都是独立的,我们仅使用每个社区中每个月汇总的数据,因为检验表明,一个月的时间足够观察到自行车的显著扩散,同时能够提供相当大的数据样本(48×12=576)用于回归分析。
表二中展示了回归的结果,首先,所有的系数在99%的置信水平下都是显著的,并且它们的符号与预期相同。例如,结果证实,扩散强度与社区内到达的出行总数呈正相关,与区内出行的百分比呈负相关。系数γ1的值表示,终点在社区内部的出行次数加倍会使扩散强度大致增加2.8个百分点。此外,有效的调度行为(ec)的数量也会对扩散强度产生积极影响,但其影响似乎更强烈:若ec加倍,将导致扩散强度增加5.6%。
表二、多元回归模型结果
四、自行车视角下的扩散分析
我们已经分析了社区视角下的车辆扩散,本节将继续从自行车车辆角度研究其扩散过程。为此,将单个自行车的扩散范围pi定义为它在给定时间段内访问的社区的数量。在这里,i代表自行车视角。我们的目标是揭示影响单个自行车的扩散范围即pi的关键因素。
4.1 基本特征
首先,我们将一辆自行车所完成的出行次数表示为qi,所接受的有效调度行为的数量表示为ei。 图6(a)显示了两个变量之间惊人的强线性关系。 简单的线性回归拟合优度度量R2 = 0.71,拟合线的斜率为10.18,Y轴的截距约为109。因此,当没有调度行为时,自行车大约每年使用100次(每三天使用一次),也就是说对于一辆共享自行车,每次调度行为大约增加产生十次订单出行,表明调度行为在促进共享自行车的使用方面发挥了巨大的作用。图六(b)进一步说明了车辆的累计行程d也与ei有很强的线性正相关关系,拟合度表明增加一次调度可以增加大约25公里的车辆行驶距离。
图六、(a)qi和ei间的线性关系。(b)d和ei的线性关系。
在调度行为的影响下,基于车辆被调度的频率,我们将自行车分为三组用于统计分析:低频调度组(LRS)、高频调度组(HRS)、全体自行车组(WHS)。图七展示了三组车辆的平均扩散率pi随时间的变化趋势。
图七、三种车辆类别平均扩散率随时间的变化。
首先,图中显示了在一年的统计时间内系统中自行车的扩散范围并不大。即使是调度最频繁的HRS组,一辆自行车在一年后平均仅可扩散至25个不同的社区。值得注意的是,到年底时,HRS曲线已经趋于平稳,表明它可能接近极限。这一发现表明,从骑车人的角度来看,该地区有一些彼此隔离的子区域,难以通过自行车这种出行方式在其间通行;同时运营商也没有在这些区域之间进行车辆调度。造成这种隔离的原因可能有:路网的物理隔离,区域间不存在自行车出行需求等。
在图七中我们可以明显看到HRS和LRS两组对应曲线的差异。显然,调度行为对自行车的扩散范围仍然会产生显著的积极影响。到年底时,HRS组自行车到达过的社区的数量比LRS组的多70%。该论文仅分析了一年的数据,虽然数据并没有告诉我们两组不同调度频率的自行车在一年后的扩散范围的程度和它们之间的相对变化,但通过现有的趋势,我们几乎可以判断出,更高频率地调度自行车会大大提高自行车的扩散范围。
图八绘制了扩散范围pi与自行车累计行驶距离d的关系,它表明自行车在系统中行驶的距离越长,它可能到达的社区就越多(图八(a))。然而,HRS的趋势不太明显 —— HRS具有相当高且统一的累计行程距离。值得注意的是,低调度频率组LRS中车辆的pi和d之间有最强的相关性,这可能是因为较低调度频率使得扩散过程更依赖于自行车的使用,这与自行车累计的行驶距离直接相关。
图八、三种车辆类别pi和d的关系。
图九绘制了每个类别车辆在冷、暖季节中的pi样本分布。在每个子图中,水平轴表示pi,垂直轴表示在给定时间段内至少达到pi个不同社区的自行车的百分比。可以看出,pi的分布近似于正态分布,与LRS相关的曲线显然存在更大的不规则性,他们的经验概率密度函数具有更低的峰值,表明当自行车分布不平衡时,扩散范围的变化更大。因此,自行车调度有助于减少不同自行车之间扩散范围的差异。值得注意的是,所有图表中的最大扩散范围从未达到35,即流动性最大的自行车也不能超过35个社区。这再次表明,并非研究地区的所有社区都可以通过自行车出行联系起来,并且能够通过自行车出行连接良好的区域最多包括大约35个社区。
图九、三种类别的车辆和不同时段中pi的经验概率密度函数。
4.2 统计分析
我们在本节中提出了一个描述单辆共享单车的扩散范围(pi)分布的统计模型。 由于图九显示对于相对长的观察期(大于等于一个月),分布近似正态分布。从图九中我们还注意到:(1)分布的均值μ随着观察时间的增加而增加; (2)在温暖的季节,当出行次数增多时,均值增长得更快; (3)均值μ与车辆调度行为正相关;以上三种影响彼此密切相关。一方面,我们从图六中看到,自行车的出行次数与有效调度次数线性正相关。而且,这两个数量都随着时间的推移而增长,我们假设分布的均值μ和随机变量的标准差σ为平均调度次数es的函数。
我们将函数μ(es)表示为:
其中b0,b1和b2是系数。估计结果表明,在95%置信水下,b0 = 29.75,b1 = 425.7,b2 = 16.73,Adj.R2= 0.95。这表明μ(es)的上限接近30,下限接近b0-b1/b2?4。这些系数描述了自行车共享系统所在区域的“特征”。在某种程度上,它反映了该地区通过自行车出行相连接的程度。
从图十(b)可知,pi的标准偏差大多数情况下不受es的影响,仅当es非常小(小于15)时除外。 我们还发现该区域(其中σ的范围在4到6之间)的异常值都来自ei值最低的两组样本。 这并不奇怪,因为当自行车很少被调度时,它们的扩散很大程度上取决于它们的实际出行特征和使用方式。
图十、(a)es与pi平均值的关系。(b)es与pi标准差的关系。
为检验模型,我们将其应用于预测上一节中的三种车辆类别(WHS,LRS和HRS)的扩散模式,分析时间段长度为一年。图十一中的左侧一列子图将pi的经验概率密度函数与的预测概率密度函数进行比较,右侧一栏显示了Kolmogorov-Smirnov检验的结果。结果表明所提出的模型可以估计平均值和标准差,并且合理地拟合经验概率密度函数。
图十一、三种自行车类别实际观测得到的扩散范围分布和预测的扩散范围分布。
五、结论
本文从自行车扩散行为的角度研究了共享自行车系统的运营,对系统中自行车的扩散和新闻消息的传播或流行病的传播之间进行了类比。研究中相对简单的数据挖掘工作和分析已经帮助我们 发现了很多有趣的内容,甚至有一些非常惊喜的发现:
(1)超过6公里的自行车出行距离服从幂律分布,低于6公里的自行车出行距离的概率密度分布峰值出现在1公里,可以近似看成是两个幂律函数的叠加。
(2)扩散强度与社区到达的自行车出行次数之间的关系遵循S型生长曲线,与有限自然环境下的人口增长过程非常相似。此外,社区的扩散强度也受到自行车区内出行比例的负面影响,并且受到自行车所接受调度次数的正面影响。调度次数对扩散强度的影响程度约为出行次数影响程度的两倍。
(3) 自行车所接受的调度次数是自行车使用率的强预测因子。当没有调度行为的时候,一辆自行车大概每年被使用100次。对于每次额外的调度行为,自行车将会被多使用10次。因此,我们发现调度次数也与自行车扩散范围强烈正相关。
(4)基于平均调度次数,我们建立并标定了一个模型来预测一组自行车扩散范围的分布。我们发现,在芝加哥Divvy Bike系统中,扩散范围有一个上限值,独立于调度行为,这远低于系统中社区的总数。该发现表明,该地区可能包括自行车可达性较弱的子区域。这表明,研究自行车出行的扩散模式有助于我们理解自行车系统的基本结构。
本研究迈出了分析和理解共享自行车扩散模式的第一步。这个研究只是一个开始。本研究缺乏可能决定扩散行为的潜在过程的物理表示。对过程进行建模和模拟,并将分析和模拟结果与经验观察结果进行比较,这将是下一步工作的重点,可以为这些系统的运维人员提供更好的管理运营意见。另一个研究方向是将分析应用于其他自行车共享系统,特别是无桩共享单车系统,并尝试识别和理解可能影响此处结论的空间、社会和运营特征。
新期刊!正在发行
扫描二维码或点击阅读原文购买
一览众山小●为本文提供
资料
下载
索取请电邮 Daizongliu@qq.com
或微信号 后台留言
1、《有桩共享自行车系统中的扩散行为研究》
免费索取英文原文资料:
联系微信公众号
或电邮 daizongliu@qq.com
我们帮助中国
可持续发展
城市规划|城市交通|非机动交通
|活力街区与公共交通|
|量化城市与大数据|
我们作为专业志愿者团体
秉承理想,帮助中国可持续发展,并为之贡献
? 理念与传播 ?
? 培训与教育 ?
? 实践与孵化 ?
欢迎加入我们
2014-2018 ? 转载请注明:源自公众号“”