根据维基百科(Wikipedia)的定义,开放数据是指不受版权、专利或其他条件和机制的限制,可以免费获取,并重新按照使用者的意愿来使用的一种数据类型。其中,网络开放数据是社会上使用最为普遍的开放数据类型。简单来看,网络开放数据是指人们自愿在网络上发布或分享的数据,如人们在社交网站上签到留下的时空数据、社交网站用户关系网络和社交网站用户的相关言论,以及Flickr等分享网站上游客上传的照片信息等。与大数据体现的数量大、种类多、速度快和价值高等特征所不同的是,网络开放数据在一定程度上可以反映出个体对城市建成空间环境感知、情感、体验和价值等方面的主观判断,能够为将社会公众意愿纳入城市空间规划的决策过程提供可能,促进城市研究与城市规划在技术手段、价值取向上的转变。
国外利用网络开放数据进行城市研究始于2010年后,研究的数据来源以Twitter、Flickr等社交网站数据为主。Mark等人抽取英国利兹城的9223 个Twitter 用户数据,运用智能模型来判断城市居民生活、教育、工作、娱乐和购物五种基本行为活动与城市空间之间的关系,并结合三维GIS技术进行可视化表达;Malleson 等人采用核密度分析法,根据特定Twitter用户在不同地区发布的信息密度或频次来判断用户的活动地点和具体活动行为;Naaman等人利用Twitter防火墙破解程序来提取地理坐标和文本数据,并结合时间序列模型分析了不同城市Twitter帖的关键词特征和分布状况,发现只有很少的城市能够提供多个时段的关键词以搜索所需要的信息,进而得到城市之间的网络活动等级和联系;Crandall等人利用社交网站的在线照片来重构居民活动信息数据库,包括照片情感和地理信息的提取、基于照片的社交网络结构以及模拟拍照者的时空行为等;Sagl 等人将移动网络数据和Flickr社交网站数据相结合,采用空间分析方法揭示了城市的活动热点,以及不同季节中城市郊区居民的出行活动和变化特征;Luscher等人以英国的特大城市为例,在根据地形图数据库来判断城市空间地理特征的基础上,增加了包含居民情感和经验的人文元素,提出了三种划分城市中心区的方法;Hollenstein等人通过获取800万个Flickr的位置与图像信息来确定伦敦和芝加哥都市区的中心区边界。
在国内,随着互联网技术的进一步发展,特别是各大门户与社交网站应用程序编程接口(Application Pro-gramming Interface,简称“API”)对社会的不断开放,近年来也有部分学者运用网络开放数据进行了相关的城市研究。汪明峰等人通过对国内主要的电子商务企业之一—当当网的研究,初步探讨了网上零售企业的空间组织及其影响因素;甄峰等人以新浪微博为例,从网络社会空间的角度入手,对我国城市网络发展特征进行了研究;熊丽芳等人借助百度指数,获取了 2009 年、2012 年长三角两两城市之间的用户关注度数据,通过计算和模拟城市信息流,分析了长三角城市网络的时空演变规律;王波等人通过将微博用户的网络信息关系与地理进行关联,提出了网络信息空间中的地域根植性、网络信息联系与实际社会经济联系的相对一致性,以及网络信息空间中的等级差异性特征;秦萧等人运用大众点评网(南京站)餐饮商户的点评数据,在建立口碑评价指标体系的基础上,计算了各商户的口碑综合得分和排名,并对城市餐饮业的空间分布格局进行了核密度分析和综合评价。
综上所述,目前国内外利用网络开放数据进行的城市研究重点主要集中在城市之间的空间联系、城市体系、城市内部的功能区边界划定及城市行为活动特征提取等方面,这些研究催生了城市空间研究新的范式,也为转型期城市规划的编制工作提供了一种技术创新的思路。但也不难发现,现有的相关研究更多的是在宏观层面的城市群经济活动联系之间展开,而针对城市内部的研究则主要集中在城市社会空间组织与联系方面,鲜有针对信息网络影响下城市物质空间变化及其作用机制的探讨。此外,目前学界对利用网络开放数据进行城市空间结构、空间关系与城市中心体系的研究也相对较少。基于此,本文选取特大城市西安主城区为研究对象,以互联网上城市中心各服务业商户的地理位置和社会评价信息为数据源,通过分析城市中心服务业的空间集聚特征,识别出西安主城区不同主导职能的服务业在空间上的分异,并依据识别的结果,结合城市总体规划对未来城市中心体系的专业化发展与优化调整提出若干建议。