带有空间位置图片的信息挖掘通常可分为如下三类:对图片元数据的挖掘(如拍照地点、时间等)、对图片文本标签的挖掘和对图片内容本身的挖掘。
对图片元数据的挖掘最常见的就是旅游热点区域分析和城市形态分析,如Eric Fischer运用Flickr相片点位数据,绘制出了美国、加拿大与欧洲等地100多个城市的城市形态,并区分本地居民和游客的空间分布规律。Tammet基于Panoramio相片点位密度,开发了Sightsmap,显示了全球最热景观的分布。Zhou X L等人基于海量Flicker 相片的坐标点位信息、时间信息和标签信息识别了多个城市旅游目的地的时空分布规律。
图片元数据和文本标签信息也常用于旅游路线推荐、人群的时空行为分析。例如,Gavric等人基于Flickr点位数据分析了柏林的旅游热点和游客的旅游路线。Straumann 等人根据相片点位不仅分析了苏黎世本地居民和外地游客在空间分布格局上的差异,还分析了这两类群体旅游路线的差异。Vu等人基于 Flicker 相片,分析了香港本地居民和外地游客旅游行为的差异性。Hu 等人综合 Flicker 相片的点位信息、属性信息和图片信息分析了多个城市的旅游热点区域特征。Kim等人将全球地表划分为若干个网格,然后将 Flicker 相片落入相应的格网,根据 Flicker 的标签和图片内容,分析地标的时空分异格局。Palomares等人基于Panoramio图片,研究了欧洲8个大城市的旅游热点区域空间分布规律,并基于GIS空间统计分析功能,分析了本地居民和外地游客的空间分异规律,研究表明,外地游客的空间集聚度更高,巴塞罗那、罗马的空间集聚度比伦敦和巴黎更高。Sun基于带空间位置的Flicker相片,结合路网,通过机器学习的方法,为游客推荐旅游线路,尽量在较短的行程内通过较多的旅游热点。
在国内,北京城市实验室(Bei j ing City Lab,简称“BCL”)分享的Flicker相片点位数据也被应用在多个项目中,如《成都市中心城特色风貌街道专项规划》、《成都平原城市群规划》(旅游专题)、《中国国家地理:西藏专辑》(2015年10月)等。
此外,也有对图片内容信息挖掘展开的少量研究,比如Liu选择了全球最大的两个在线照片供应商—Panora-mio和Flickr相片,利用深度学习技术对照片内容进行识别并分类(分为绿色视觉意象、水视觉意象、交通视觉意象、高楼视觉意象、古建视觉意象、社交活动视觉意象和运动视觉意象),统计分析了每个城市的城市意象要素类型特征与空间分布特征,进一步探讨了各个城市在城市意象类型上的相关性与差异性。赵渺希等人以谷歌图片搜索中广东21个城市的图片为数据来源,分析案例城市在网络空间中的意象,试图通过实证研究对凯文·林奇的意象理论进行扩展和补充。除了VGI数据和搜索引擎中的图片数据,带空间位置的图片数据也日渐多源、丰富,街景地图也是常用的一种。Li等人运用Google街景图片,分析了曼哈顿的一个街区沿街300个样本点的绿化指数;同样的方法用于沿街样本点、地块的绿化水平的评估,并与收入展开相关分析。Yin等人基于谷歌街景地图,运用机器学习的方法,自动识别街道的行人数量。Harvey基于Google街景图片,对街道安全展开评分。Naik等使用计算机识别技术对海量的街景图像进行了测算,将获得的数据与社会经济学指标结合在一起进行分析,探索城市在社会经济学方面的演变和物质形态变化之间的关系。
由上可知,限于信息挖掘的技术门槛,从图片的元数据到文本再到内容,分析难度逐渐递增。分析研究多见于图片的元数据或文本数据,而对信息量最为丰富的图片内容挖掘较少,且用于旅游热点、旅游路线的推荐较多,关于人本尺度的城市形态、城市空间品质的研究相对较少。本研究将基于前人的研究成果,总结图片来源与常用分析工具,并用3个案例,展示空间位置图片在人本尺度城市形态上的最新研究。