原文/ CROOKS, CROITORU, JENKINS, MAHABIR, AGOURIS and STEFANIDIS
翻译/ 夏家琪 申妞妞 校验/ 徐蜀辰、曾辉
文献/ 罗谭晓思 排版/ 蒋理 编辑/ 众山小
《大数据与城市》专刊
篇八:用户生成数据与城市形态
传统的城市形态学,是将城市看作人类的栖息地,借助具体、物质的现象的分析进行研究。这些现象是复杂社会与经济力量的产物,此方面的研究主要由传统数据收集方式推动(例如人口普查,问卷调查,数据信息映射等方式加以分析)。随着Web2.0的出现和其应用的涌现,用户被提到核心的位置,通过发布一条条推文,一次次上传图片到Flickr,一个庞大的用户生成数据帝国正在被构建。用户生成数据的崛起也为城市形态学的研究提供了一个新视角。而实体空间与认知空间数据的对比,尤其是固态数据与实时数据的结合研究,将会产生许多有趣的成果,帮助我们更好理解如今所处的这个纷繁复杂的世界。
大数据与城市专刊
传统的城市形态学,是将城市看作人类的栖息地,借助具体、物质的现象的分析进行研究。这些现象是复杂社会与经济力量的产物,此方面的研究主要由传统数据收集方式推动(例如人口普查,问卷调查,数据信息映射等方式加以分析)。随着Web2.0的出现和其应用的涌现,用户被提到核心的位置,通过发布一条条推文,一次次上传图片到Flickr,一个庞大的用户生成数据帝国正在被构建。用户生成数据的崛起也为城市形态学的研究提供了一个新视角。
由于在空间、实时性、主题性等向度缺乏足够精确的数据,所以早期捕捉城市形态和功能及其相互关系的研究受到了局限。智慧城市的出现和产生,使得大数据成为研究城市和城市形态学的重要工具,并直接或间接为捕获城市功能和形态之间的关系建立了联系。传感器和信息源散布在城市的各个角落,源源不断地获取城市空间的快照,但是去了解一个城市不仅需要传感器产生的丰富数据,也需要一个新的框架来理解如何把民间叙事编织融入对城市形态的构筑中,用户生成数据丰富了传感器数据,更能反映公众对城市空间的印象。
众包数据数据和城市信息图景
像facebook、Twitter、Flickr和YouTube这类可以让公众相互交流信息的平台,彻底改变了信息传播的方式,并促进信息社区(基于同一个主题或同一个地理位置)的形成。
将群众数据和传感器收集的内容结合起来分析是一种更好地理解城市功能系统的方式。城市仪表盘作为一种有效的聚合交流信息的可视化模式,可以通过应用程序接口(API)访问数据库,搜集数据。例如,图1所示,由伦敦大学学院高级空间分析中心(CASA)的Gray and O’Brien所建立系统,从各种分布式传感器(如天气,交通摄像头,污染传感器)、新闻推送、社交媒体(如推特趋势计算)、新闻领域搜罗数据,并在一定时间内生成城市快照。
图一、CASA的城市仪表盘. (Source: http://citydashboard.org/)
城市形态学快照
传统的数据来源(人口普查、问卷调查、遥感),只能还原一个特定时间点的城市形态快照,所以从历史时间轴角度的角度看待一个城市就会受到限制,但是用户生成数据可以打破这种限制,提供给我们城市形态快速印象。下文,将选取几个典型例子,解释人群生成信息如何提供给我们城市的快照。同时也向我们展示,此类数据在研究互联空间的潜力,此类空间是地理社交社区形式下,物质与认知空间的结合。
物质空间
我们从城市集合、建筑及街道开始有关物质空间的讨论。在一定程度上,这是城市物质空间中最直观的信息。自从VGI(自发性地理数据)出现以后,研究者一直在探索如何利用这些信息来研究城市。如果我们取建筑作类比,通过人群收集信息(包括SketchUp和3D Warehouse)收集信息,这种方法创建了带有地理标签的三维物体数据库。
图二、用SketchUp和在谷歌地球可视化模拟的乔治梅森大学
随着数据的增长,特别是开源数据的增长。出现了如OpenStreetMap等不仅能显示道路、节点,也能显示了商店,交通方向等信息(图三a)的软件。在图三(b),展示的来自OSM一种截图,用建筑及其高度的信息构建的三维城市模型,清晰地勾勒出城市环境。
图三、在OpenStreetMap所见的纽约城的一部分(a) OSM提供的3D城市建筑模型(b)图片来源:htt p://osmbuildings.org
下一步的研究在于如何将来自群众的信息和传统数据的准确性和完整性做对比。最近的研究已经开始通过与诸如英国陆地测量部道路数据集(Haklay,2010)或商业(例如TomTom, NAVTEQ)等权威组织对比来评估OpenStreetMap的质量可靠性。结果是大多数的数据是可以和这些权威组织发布的地图同等比较的。
认知空间
尽管上述工作成功地捕捉到了城市的物质元素,但是在捕捉城市社会形态功能方面却望尘莫及。在这个领域,我们借助于另外一种形式的人群贡献数据,尤其是社交媒体的数据。研究人员从推特的API获取了用推特定位的推文(大约450万条),提取出现频率高的词语,并依据语意进行分类。如图四所示,在玫瑰园舞厅附近,Lady Gaga的主题形成了一个空间集群,而且越靠近主建筑物,推文的密度越大。
图四、玫瑰园舞厅(纽约百老汇)与Lady Gaga 主题的联系
如图五所示,研究人员监控了几个月以来,高线公园和麦迪逊广场区域内人群的社交媒体使用情况,并把其推文的内容简化成几个关键字标签,把它们分类为本地人和游客。用这种方法,我们可以估计本地人和游客对同一区域的不同看法,并且比对他们之间的差异。通过进一步分析,我们可以了解一个人对某个片区的熟悉程度会如何影响他对这城市空间的理解。
图五、由本地人和游客关注的不同的的娱乐热点
通过图六我们可以看到过去一天内伦敦市中心的有关政治的推文的区位变化。这种日常的昼夜交替的的政治热点区域,反映了这些区域每个时段在城市中扮演的不同角色。
互联空间
上文提到的例子对基于用户大数据内容如何被应用于探索物理空间和感知城市空间做了阐述,但这忽略了场所之间的联系。借力于社交媒体固有的互联互通的属性,可以实现连接和地理空间的融合。社交媒体的本质决定了它能连接各种各样的类型和意义(types and significance) 通过这种连接,用户可以分享有趣的信息,交流想法,与其他用户建立社会关系(例如朋友、同事)。用户和他们的网络(社交网络)都深深地根植于其所在的地理空间,用户(人际)网络的构建(在社交网络中如何被定义)决定了后来产生的新兴社区位置范围和形状。图六展示了地理定位社区的概念。
图六、通过连接从物理空间上的邻居演化成基于地理社交邻居
地理社交社区形成,将会在时间和空间上进一步演化。特别是,如果用户之间构建了新的连接,一部分原有的连接中断,这个地理社交社区的组成、构造、形状就会发生改变。如图七,这种演变能提供额外的信息,让我们去进一步思考支配地理社交行为的潜在过程。
图七、基于地理的定位社区的演化
通过收集和分析社交媒体的大数据,连接空间和基于地理信息的社区的构建指日可待。这个方法在2013年波士顿爆炸案发生之后,在推特上已经有所应用。如图八,定位者用圈来代替,圈的半径与用户数量成正比。用户之间转发推特信息用直线来表示。可以发现,地理定位社区大多在像纽约、华盛顿这样的大城市形成,他们之间的交互也更为密切。
图八、波士顿大爆炸发生后地理定位社区迅速形成
资料
免费索取英文原文资料:
联系微信公众号
或电邮 Daizongliu@qq.com
「 欢迎投稿 」
我们作为专业志愿者团体,秉承理想,帮助中国可持续发展。并为之贡献:理念与传播、培训与教育、实践与孵化。欢迎您加入我们一起并肩前行!
2014-2016 ? 转载请注明:源自公众号“”
请点击阅读原文
购买2015年半年刊