除应用描述性统计分析、不平衡指数、分级统计图法、全局Moran's I指数、LISA聚类图等方法对国家园林城市与国家森林城市分布的空间异质性和空间自相关性进行测度外,研究还涉及多种回归分析方法。本文对选取的变量及使用的回归模型说明如下。
鉴于两类城市的评比表彰项目属性,参照相关研究成果,从评选标准、气候、经济和城镇化4个维度选取10项指标作为自变量,以两者的分省数量为因变量,在省域尺度分别对两者分异格局的影响因素进行探究。由于两类城市在申报范围、考核内容等方面的共性较强,为进行比较研究,针对两类城市分别选取的10项自变量指标中有9项都相同,仅评选标准因素中的城市建成区绿地率(国家园林城市) 与森林覆盖率(国家森林城市) 不相同。
(1) 评选标准因素。两类城市的命名均需通过评审,申报城市的各项指标首先要达标。因此,两者的评价指标体系及考核要求,即评选标准将直接影响其命名和分布。尽管自“创园”“创森”活动开展以来,两者评选标准的结构及具体条目都在不断调整,但考核内容始终聚焦在绿色生态空间的营建上,评价指标尤其是核心的量化指标一直未变(表1)。基于此,考虑数据可获性,研究从表1提炼出的硬指标中分别选取城市建成区绿地率、城市人均公园绿地面积、森林覆盖率、城市建成区绿化覆盖率及城市人均公园绿地面积等评选标准因素,假设以上变量均分别正向作用于两类城市的创建活动。
(2) 气候因素。两类城市的评选均以城市绿化建设管理水平为考核的基本内容和重点。不论是绿量的增加、园林(或林木)绿化质量的提高,还是城市绿地(或森林) 的养护,都受到水热等气候条件的影响。因此,引入水分条件和热量条件两个变量,检验气候因素对“创园”“创森”的影响。其中,“创园”以多年平均降水量表征;“创森”是虚拟变量,全部或大部分位于亚热带和暖温带的省份取1,否则取0。研究假设水分条件和热量条件与两类城市的数量正相关。
(3) 经济因素。“创园”工作不仅涵括了城市园林绿化规划设计、建设和养护管理等各个环节,还已拓展到生态修复、资源保护、市政建设、住房保障及低碳节能等多个方面;“创森”除需完成城市森林保护、建设和管理方面的核心任务外,还涉及林业经济发展和生态文化传播等内容。“创园”“创森”都是庞大而复杂的社会工程,涉及面广、任务量大,需要政府和社会资金在短短数年内的大规模集中投入。因此,以人均GDP、地方一般公共预算收入、城镇居民人均可支配收入这3个指标反映经济层面上“创园”或“创森”的专项资金及各类资源的投入能力。研究假设某省份的这3项指标值越高,该省份两类城市的数量就越多。
(4) 城镇化因素。国家园林城市与国家森林城市主要从地级市和县级市中产生。既有研究表明,前者的分布受城市发育状况因素的影响,集聚在我国主要城市化地区。因此,以设市城市数量和城镇化率表征该因素,假设这两个变量对两类城市的数量都具有正向影响。
(1) 探索性回归,是一种数据挖掘工具,通过对上述解释变量的每种可能组合进行评估,查找到正确指定的OLS回归模型。合格模型的最小校正可决系数(Adjusted R2,以下简称“校正R2”) 值为0.5,最大方差膨胀因子(VIF) 值边界为7.5,最小Jarque-Bera p值为0.1。此时,模型通过了Jarque-Bera 检验和共线性诊断,残差呈正态分布,能解释因变量中至少50% 的变化。
(2) 普通最小二乘法(OLS)回归,是应用最广泛的传统( 非空间) 统计方法,也是空间回归分析方法的正确起点,可以从针对因变量所构建的自变量指标中筛选出对其具有显著影响的因素。当模型解释变量与因变量的关系在整个研究区中都一致时,作为全局模型的OLS 回归能构造出最佳解释方程。但具有空间自相关性和空间异质性这两种内在本性的空间数据经常与OLS回归的假定条件及要求不符,可能会导致模型估计产生偏差,需引入GWR 模型,以构建运算结果更符合实际的回归方程。不直接采用GWR模型的原因在于其诊断性不强。
在OLS回归结果中,校正R2用于衡量模型的性能;VIF用于测量解释变量中的冗余;Koenker(BP) 统计量用于确定解释变量是否在地理空间中与因变量具有一致的关系,其p值小于0.05表示模型具有统计学上的显著非稳态,适合进行GWR分析。在Koenker(BP) 统计量具有显著性的情况下,参考联合卡方统计量评估模型的统计显著性,其p 值小于0.05表示模型整体显著;系数反映解释变量与因变量之间的关系类型和强度,其统计显著性使用稳健概率评估。
(3) 地理加权回归(GWR),是基于局部光滑思想提出的空间回归模型,既能有效估计具有空间自相关性的数据,也能反映参数在不同区域的空间非平稳性。模型公式如下:
在GWR结果中,除多重可决系数(Multiple R2,以下简称“R2”) 和校正R2外,AICc 也可用于检验模型性能,并能比较回归模型,其值较低的模型能更好地拟合数据,是更佳的模型;当条件数小于0、大于30时,表明模型存在局部多重共线性,结果不可靠。
对“创园”“创森”成功的两类城市的分析单元进行叠加可以发现,两者中有137个分析单元是重合的。本文利用ArcGIS10.2软件对两类城市的分布进行可视化表达(图1)。
研究对象数据来源于住房和城乡建设部网(http://www.mohurd.gov.cn)、中国林业网(http://www.forestry.gov.cn)。在属性数据中,各省份的设市城市数量、城镇化率、人均GDP、城镇居民人均可支配收入、地方一般公共预算收入、森林覆盖率、城市建成区绿化覆盖率和城市人均公园绿地面积等数据来源于《中国统计年鉴2018》;城市建成区绿地率数据来源于《中国环境统计年鉴2017》;多年平均降水量数据采用2003年(“创森”活动开展前一年) 到2016年降水量数据的平均值,数据来源于2006~2017年的《中国环境统计年鉴》。