俗话说“人多力量大”。在创新能力方面,一定是人口更多的城市就拥有更强的创新能力吗?2019年11月,来自英国和意大利的城市研究学者,根据美国初创公司的相关开放数据,建立了全美第一个大都市区之间的、实时更新的动态劳动力流动网络模型,并用它来预测城市的创新能力(论文链接:
https://arxiv.org/abs/1911.00436)。
研究发现,网络中节点中心性等网络指标对城市创新能力的预测效果,要显著好于人口总量等传统的城市规模指标。
自从人类文明诞生以来,尤其是工业革命之后,城市没有因为人口的不断增长、资源的不断消耗而崩溃,反而集聚了更多人口。一个重要的原因在于科技创新,让人类掌握了更高效使用资源的方法,从而过上了更加便捷、集约、高效的生活。在今天,技术创新、知识积累与创意传播已经成为,提高一国经济生产率、促进经济增长的关键性因素之一。放眼世界级大都市:伦敦、东京、巴黎,都已将创新发展作为城市的重大战略选择(图1)。


图1 世界各主要全球城市都将创新作为自己的发展战略之一
来源:规划中国 深圳产业创新与城市更新之路︱作者:杜雁︱链接:
https://mp.weixin.qq.com/s/hG05tOLj1sbISYOJ9lkUGA
影响一个城市创新能力的因素都有哪些呢?去年11月,来自英国和意大利的几位城市研究学者利用美国城市人口流动网络数据,对城市创新能力进行了预测,形成了研究论文。该研究发现,相比于传统的规模指标,基于复杂网络模型的相关网络指标,如节点的PageRank度、加权入度等,对一个城市的创新能力有更好的预测效果。
对城市复杂性的相关研究表明,城市中存在一个“规模法则”——即城市的GDP、工资总额等,与城市的人口规模存在一种幂指数函数的关系,而非简单的线性函数关系。

图2 城市中的幂律现象
来源:推动城市罪恶与繁荣的奇妙数字︱ 《规模》︱作者:张章 ︱链接:
https://swarma.org/?p=11685
但在目前的很多城市研究中,还是以线性回归的方法对城市的一些特性指标进行相关性分析。如在欧美,就使用过自变量为人口总数、人口密度的线性模型来拟合并预测城市的GDP、就业人数、电力消费、总工资水平、住宅需求、公共服务设施总量等城市经济社会指标。
同样,也使用过以人口总数为自变量的线性模型来拟合预测城市的创新能力,如初创公司数、专利数等。这些模型的预测表明,人口总数等经济社会统计指标与这些城市特性之间存在很大的线性相关性,如人口总数和总工资数、电力消费、就业人员数量等等,其决定系数R2在0.88~0.99之间;但是,人口总数与城市创新方面指标的相关性,如与专利数量、研究与试验(R&D)投资规模、发明者数量等指标的相关性,就比较低,其决定系数R2分别只有0.72、0.76、和0.77(图3)。

图3 城市人口总数与城市相关特性的线性相关性
相关性的微小差异,引发了论文作者 Moreno等人的思考——一个城市的创新能力真的与其自身的人口规模关系那么密切吗?会不会有其他影响甚至能够决定其创新能力的因素呢?基于一般的城市原理,论文作者提出了传统的、基于规模统计的线性回归模型在预测城市创新能力方面效果不佳的几点原因:
传统的规模统计将城市看作是一个封闭的地理单元,忽视了城市与外部其它城市之间的联系,而现有的城市理论和相关经济学研究都表明,一个工人、企业家和投资者之间紧密联系的动态网络(或称市场厚度,Thickness of the market)是观点交汇、新思想产生和最终推动经济增长的重要因素。
传统的规模统计忽略了一个城市对创意人才、创意阶层人群这一特定人群的吸引力,而最近的研究发现,这些人群的创新产出能力是一些超线性城市现象产生的原因。
传统的规模统计所使用的变量(如统计年鉴数据、专利总数等),在统计周期上无法跟上许多科技创新企业生命周期的变化——有些企业从出生到死亡的整个过程没有被统计年鉴及时真实地捕捉到。
公司成长速度的加快、对数字业务能力的看重、以及市场全球化拓展等趋势,都让专利数这个传统的评价指标在评价城市创新能力方面变得更为逊色,不能及时动态地反映市场变化情况和公司创新能力的变现水平。另外,专利申请制度更多的是为了防止专利蟑螂(patent trolling)和竞争者突围的工具,未必真正会将创新成果进行商业投产或造福民众。
鉴于以上原因,论文作者选择创业成功的企业数(记作
),和大都市区中所有公司的累计收购价格(Cumulative acquisition prices)(记作
)两个指标来表征一个城市的创新能力。创业成功的企业数
是指大都市区中企业上市、或被上市企业收购、或收购了其它公司的公司总数目;大都市区中所有公司的累计收购价格
指这些公司累计的被收购价格总和。
论文作者对
和
与人口总数(记作
)、积累资金总额(Total past funding)(记作
)进行了两两线性回归分析;分析结果表明,人口总数
、积累资金总额
和创业成功的企业数
、累计收购价格
之间并不存在一种明显的线性关系,且预测结果波动很大(图4)。
这意味着,并非人口规模越大、积累资金总额越高的城市,创新能力就一定成比例地越强。有的城市人口规模大但创新能力低,有的城市虽然人口规模很小,但创新能力却很强(图4)。南佛罗里达城镇群与科罗拉多斯普林斯城镇群在初创公司总数(都在100左右)、人口总数(都是百万级)和积累资金总额(都是亿美元级)等方面都属于同一数量级,但在创新能力上却是十亿级和千万级的差别(累计收购价格
分别是5.8·10^9$与4.3·10^7$),是两个数量级的差别。

图4 城市人口总数
、积累资金总额F与创业成功的企业数
、
累计收购价格
之间的线性关系双对数坐标系图
那么,到底是什么因素对城市创新能力有着决定性的影响呢?既有研究认为,观念之间的交流碰撞是一个公司产生创新成果的重要前提。除去本地的观念交流,异地的观念交流也十分重要。鉴于此,论文作者构建了一个基于人才流动的城市网络,并假设网络中中心度最大的地区,而不是网络中人口数量最多的地区是最具创新能力的地区。
论文作者利用CrunchBase数据库中2010年至2019年的数据,构建了一个涉及全美380个大都市区的人才流动网络(Workforce Mobility Network,WMN)。一位公司员工的一次跨区流动被视为网络系统中的一条边(图5)。

图5 技术人才的一次工作改变带来了观念的交流,被视为网络中的一条边
最终构建了一个包含243个节点、2169条边的人才流动复杂网络模型,反映了全美大都市区中26660位人才流动的情况。最大的节点无权标准度为165,最大的节点加权入度为8370(各种度的定义和算法详见论文原文,此处略)。节点加权入度的分布符合幂指数为2的幂律分布,与生活中常见的复杂网络度分布类似。同时,论文作者还采用了“骨干法”对计算结果进行了可视化(图6)。

图6 采用“骨干法”对网络进行可视化。节点的大小表示一个地区的相对人口规模,节点颜色的浓淡代表其相对节点PageRank度,边的粗细代表其相对联系强度。左图是以美国地图为底图布局;右图是标准的重力-斥力均衡式布局
用PageRank算法计算的节点中心度,结果显示,全美东西海岸地区是城市PageRank度最强的地区。结果同样显示,人口规模和节点连接度之间的相关性不稳定——有的城市PageRank度较小,但人口规模较大;有的城市PageRank度较大,但人口规模却不大。
为了量化表示这种区别,论文作者利用城市PageRank度与城市人口规模的一个比率η来表示两者间的差异大小。下表列出了η值最高和最低的10个地区(表1)。排名靠前的,其城市PageRank度相对于其人口规模水平要高很多,包括人口多且PageRank度强的城市,如旧金山市(San Francisco);也包括一些人口规模较小且PageRank度强的城市,如博尔德市(Boulder)、伊萨卡市(Ithaca)。相应地,排名末后10位代表了人口规模大但城市PageRank度较低的城市。通过观察发现,在η值末后的10个城市区域,也就是在人口规模大但PageRank度小的区域中,科技创新相关的投资回报率普遍比较低。这似乎证实了前面的假设——一个地区的创新能力与其所在的网络度值大小有关。
表1 排名前十和末十的η值

论文作者进一步使用线性回归模型,分别对网络指标——节点PageRank度(Network PageRank)、节点加权入度(Network Strength)、节点无权标准度(Network Degree)、节点易接近性(Harmonic Centrality),和统计年鉴指标——人口总数(Population)、人口密度(Pop. density)、2010年来积累融资数额(Funding raised)、2010年以来专利数目(Patents)、2010年的在业初创公司数(Active startups),与两个表示城市创新能力的指标
、
进行了一元线性回归分析。结果显示(表2),对创业成功的企业数
影响最强的两个指标分别是在业初创公司数(Active startups, 创业成功的企业数的极大值)、节点加权入度(Network Strength);对累计被收购金额
影响最强的两个指标分别是在业初创公司数(Active tartups)、节点PageRank度(Network PageRank)。
表2 各个指标与创业成功的企业数
、累计收购价格
之间的线性相关性计算结果。括号外的值是标准化回归系数β的值,括号内的值为回归方程的标准误差值

同时发现,节点PageRank度在预测城市创新能力方面,其预测效果总是要比人口总数好,在两个对城市创新能力指标
和
的预测拟合度中分别高出12%和27%。
论文作者进一步考虑了多因素影响的问题。论文作者使用多元线性回归中的逐步回归分析法(stepwise)优化自变量集,留下对城市创新能力影响最大的自变量集(R2最高的),结果表明(表二第10栏),当多变量集中有节点PageRank度时,对城市创新能力的预测效果最好;而当多变量集中没有节点PageRank度、有人口总数、人口密度等变量时,模型对城市创新能力的预测效果欠佳。
除此之外,论文作者还考虑了多元回归模型中的多重共线性问题(即有可能多变量集中的变量之间互相影响)。在现实生活中,人口数量、节点PageRank度等变量的确是相互影响的。为了进一步查明各个自变量之间的相对贡献大小,论文作者采用了潜变量分析(Latent Growth Module, LGM)方法计算了各个变量的相对重要性。有趣的是,在一定的初创公司总数下,节点PageRank度依然被证明是对城市创新能力影响最大的变量(图7)。

图7 表二中各个自变量的相对重要性。其相对重要性用R2占比表示。
此项研究是第一次在美国全国的尺度上,利用开放数据建立劳动力流网络,并预测城市创新能力的尝试。计算结果证明,在预测城市长期的创新能力方面,不论是作为单一指标,还是多重指标之一,网络联系度指标都是最优的预测指标。
“形器不存,方寸海纳”,城市的魅力不仅在于其物质建成环境的绚丽和宏大,更重要的是它的包容性、变化性和活力。城市之间的广泛联系,是城市可以产生新理念、新技术、新事物的奥秘所在。在万物互联、世界一体的“网络时代”,更多的对外开放、互相联系,才是城市生存和发展的王道。
部门简介:
规划设计事业部,紧跟时代脉搏,深耕国土空间规划、城市更新、城市设计、乡村振兴领域,精准衔接自然资源相关业务线条,善于攻克各类规划技术难关,整合策划、规划、设计业务全流程,建立了一支涵盖城乡规划、土地资源管理、人文地理学、建筑学、交通市政等多专业背景的复合型团队,面向业主提供高质量的国土空间总体规划、详细规划和专项规划解决方案,为建设绿水青山美丽中国贡献一份力量。
责任编辑:林冬娜、邓小云
文章作者:崔嘉男
文章审核:刘海