本章中作者对三种不同方法处理灯光数据和微博数据的结果做了比较,同时也对城市多中心结构识别结果的范围准确性及识别准确性做了评估。
用阈值法不能很好地区分城市与郊区,中心范围破碎。LMI聚类法对主要中心的识别较为准确,但在上海使用单独使用夜间灯光数据则无法获取完整的主中心区域。OLS方法配合使用时,会在远郊区或者中心区识别出一些异常值,因为全局的模型对于地方级别的识别不够准确。总体看来LMI与GWR一同使用时3个城市的识别结果最好,主要城市中心和副中心位置准确且范围清晰。
在验证部分,作者分别使用了范围准确性(delineation accuracy)与识别准确性(detection accuracy)来评估结果。范围准确性方面,作者从Google Maps API中获取了17种与城市日常活动紧密相关的兴趣点(POI)数据,包括ATM机、银行、便利店、酒店、医院等,并与不同方法的识别结果做了验证,最后发现用LMI聚类与GWR的结合方法识别出的城市中心轮廓范围更准确。而关于对城市中心的识别准确性,作者则与3个城市的总体规划中定义的城市中心与郊区中心做了对比,发现本研究与总规中83%-88%的中心重合。
在讨论部分,作者首先针对签到数据的稳定性做了深入探讨。由于人的行为有很大的随机性,小样本的数据往往空间分布不够稳定,不具有代表性。本研究采用了396天3个城市一共560万的签到数据来提高数据稳定性。作者引入了一个指数来度量空间稳定性,发现数据在积累到100天后,稳定性指数基本不再变化,因此推测本研究的样本量足够了。研究同时发现,3个城市的指数变化上海的签到数据最不稳定,北京居中,重庆相对较稳定。作者在这一小节中还提到了社交网络数据应用中老生常谈的Bias问题,即老人、小孩和低收入群体相对较少使用社交网络。但作者引用了其他一些研究的结论,签到数据的空间分布与调查显示的人口分布呈一致趋势,因此签到数据完全可以代表城市内部的人口分布规律。
此外,作者还简单讨论了用POI验证结果的问题。与地表覆盖不同,城市和郊区中心是人类活动的聚集区,而非简单的不透水面。本文为了验证识别结果的有效性,采用了POI数据来进行中心覆盖范围的验证。但需要注意的是,单一类别的POI不足以代表中心区域,因此作者使用了与日常生活最相关的17类POI,并横向比较了其他方法和数据的结果。
分析单元的分割问题也有详细的讨论。行政边界对于探测人口活动区块太大、不够精确,基于栅格的分析又会使结果破碎,获取的区域不连续。而本文使用的图像分割方法则有效地解决了该问题。其分类框架既考虑了每个单元内部的异质性,又考虑到了单元之间的多样性。自适应的分割算法使得分析单元的尺度十分科学。
总的来说,本研究通过社交网络签到数据和夜间灯光影像等新型数据定义了中国三个大城市的多中心结构,突破了传统研究中采用行政统计边界作为分析单元的局限,应用了自适应的分割方法使得分析结果更准确。作者表示,当下多中心研究中的难点在于如何定量化准确检测各个中心的范围以及如何验证已获得的结果。选择样例城市的主中心、副中心主要是为方便对比算法提取的结果与总规方案。研究使用的数据容易获取、方法可行,对其他城市化地区也都能够普遍适用,其自适应的地块分割使得对别的研究范围以及研究尺度也有良好的兼容性,可以获取不同层级的中心,而不需要研究人员对当地规划有丰富的背景知识。
小编惊叹于这篇文章数据资源之丰富,思路之完整和逻辑之严密。不论是各种数据的使用还是计算和验证方法,都非常扎实,也比较有创新性。不过新的分析单元优势不用多说,劣势主要在于无法兼容其它官方渠道的统计数据,尤其是新数据、大数据渠道不太容易表达的信息。另外,在这个大数据的时代,井喷式的数据资源让人们能够捕捉到时空中动态的各项活动,类似主题的研究看多了,我们更想知道的,还是如何能应用到实际规划中以及与传统人口统计方式得出的结论区别和特点在哪里。