国匠城
刘伦,剑桥大学土地经济系跨学科空间分析实验室博士研究生
城市图像一直是记录城市发展变迁的重要信息载体,在当前的互联网与大数据时代,随着图片分享网站、社交媒体、街景地图等线上平台的蓬勃发展,可获取的图像数据正在以前所未有的速度增加。
同时,来自人工智能领域的机器视觉技术经过40余年的发展取得了大量进展,使对海量城市图像的自动化判别与解析成为可能。
而在城市研究领域,由于时间、人力等方面的限制,以往的城市风貌研究很少能够实现对整个城市的精细化全覆盖。在这样的背景下,我们开展了一项结合机器学习方法和城市街景照片对城市建筑形象进行大规模评估的实验性研究。
结合街景照片的内容特点,我们选择了建筑立面品质(“颜值”)和建筑界面连续性这两项建筑单体和建筑群体层面的关键要素进行了本次评估。具体操作过程如下。
(1)以北京五环内为研究范围,以200米间隔抓取了来自百度街景的36万张建筑立面照片。
(2)从中随机选取3500张,人工对照片内容进行立面品质和界面连续性打分,打分标准如下:
建筑立面品质打分标准:
优(4分):立面划分比例和谐、材料质感精致、细部丰富、使用中维护良好;良(3分):立面划分较为单调、材料质感一般、细部较少、可以看到一定的使用痕迹,如悬垂的电线、生锈的防盗护栏等,但大体仍呈现出整洁、规整的形象;中(2分):立面几乎没有构图与韵律方面的考虑、材料质感较为廉价、体现出年久失修的痕迹,如墙面污迹、墙砖剥落、大量的生锈防盗护栏等;差(1分):建筑物简陋、破败、部分坍塌、立面脏乱。
优(4分):立面划分比例和谐、材料质感精致、细部丰富、使用中维护良好;
良(3分):立面划分较为单调、材料质感一般、细部较少、可以看到一定的使用痕迹,如悬垂的电线、生锈的防盗护栏等,但大体仍呈现出整洁、规整的形象;
中(2分):立面几乎没有构图与韵律方面的考虑、材料质感较为廉价、体现出年久失修的痕迹,如墙面污迹、墙砖剥落、大量的生锈防盗护栏等;
差(1分):建筑物简陋、破败、部分坍塌、立面脏乱。
建筑立面连续性打分标准:
连续(1分):建筑物在人视线高度上呈现为连续状态,和道路之间没有围墙阻隔,没有退离道路过远;不连续(0分):不符合上面任一条即作为“不连续”。
连续(1分):建筑物在人视线高度上呈现为连续状态,和道路之间没有围墙阻隔,没有退离道路过远;
不连续(0分):不符合上面任一条即作为“不连续”。
(3)根据人工打分训练模型,让机器“学习”人类判断;
(4)将训练好的模型应用于全部36万张照片,计算照片中建筑物的立面品质和界面连续性得分,并得到北京五环内各个路段上的平均分值。
我们最终得到的北京建筑立面品质评价地图和连续性评价地图如下所示。(高清大图可电脑打开www.urbanvisionstudy.com网站查看)
从这两张地图中可以读出关于北京建成环境的丰富信息,篇幅所限,我们仅从面状的整体环境、线性的轴线空间、点状的特色片区三个层次对图中信息做一个简要解读。
整体环境:北京建筑立面品质与界面连续性的得分呈现出非常不同的空间分布。
立面品质大体呈现为北四环到南三环内较高,但北四环到五环之间以及长安街延长线两端也有不错的表现,北部品质较为平均,南部的品质差异则较为强烈。
作为代表北京城市历史文化的重要区域,北京旧城中因大量建筑建成年代较为久远,对整体得分有所影响,但一些重点片区如什刹海、南锣鼓巷等都呈现出较好的建筑立面品质。
而在界面连续性方面,旧城区域明显优于二环外的新建区域,新建区域的大多数路段都体现出高度不连续的状态。
轴线空间:截取北京南-北、东-西两条轴线周边的立面品质得分可以看到,相比于长安街一线(东-西轴线),作为北京重要历史轴线的南-北轴线得分表现平平,并没有在建筑立面形象方面充分体现出中轴线的独特地位,还存在较大的提升空间。
特色片区:我们首先关注了中央商务区、望京商务区、丰台总部基地三个北京主要特色片区,可以看到,三个片区的品质得分均较高,说明片区建筑形象的营造取得了较为明显的效果。
但也可以看到,相比于中央商务区和望京商务区,丰台总部基地和周边地区仍处于较为“割裂”的状态,对周边城市环境营造的带动作用还不很明显。
同时我们也发现,也存在一些“非知名”片区在地图上显示出了较高的品质,例如北京西站附近的达官营地区、北三环东路沿线、南四环的马家堡地区等。
思考
机器学习方法使城市环境与建筑形象的整体、大规模量化评估成为可能,评估的维度也可由本文所讨论的建筑立面品质和界面连续性扩展到风格和谐度、天际线美观度等诸多方面。
随着街景照片和其他城市图像在时间和空间上的积累,这项技术将有可能实现城市风貌的动态监控,以每月或每年更新的方式随时感知建成环境品质变化,为规划设计应对提供数据支持。
例如可通过类似方法识别在城市设计方面有待提升的片区,并对其改造紧迫程度进行排序,对城市管理与设计机构决策管控及设计规划提供依据。
但这一交叉领域也面临着不少挑战。
首先,虽然机器视觉在某些场景下已实现了与人类视觉相媲美甚至超过人类的表现,但整体而言,这项技术仍然有待提升。
此外,对于具有丰富理论与经验体系的城市设计领域,机器视觉对城市图像的评价依据是否具有理论有效性(如机器是否能对构图、韵律、虚实等设计要素做出准确判断),也是有待研究的问题。
最后要指出的是,由机器学习方法所得到的结果往往反映的是人们对现有建筑和城市环境的看法,是一种平均性的观念,而突破性、创新性、前瞻性的设计可能往往会被计算机模型给予负面的评价,过于倚重机器评价可能会导致过分强调文化的延续性而非创造性。
因此,这类方法在何种情况下适用、何种情况下不适用需要进一步分析,其中有关价值判断的设定更是涉及人文与科技、创新与记忆等问题的辨析,这既是目前机器学习方法可能存在的局限,更是未来值得跨学科深入挖掘的前沿领域。
本文作者,刘伦,剑桥大学土地经济系跨学科空间分析实验室博士研究生,本研究由作者与合作者共同完成,特别鸣谢剑桥大学工程系机器智能实验室博士研究生吴春阳提供的技术支持。我们建立了www.urbanvisionstudy.com网站用于展示目前以及未来一系列与城市视觉有关的研究,本研究生成的北京建筑立面品质地图和界面连续性地图,以及更多技术细节都可在该网站查看。
注:转自国匠城(ID:caupnet),作者:刘伦,版权归原作者所有,感谢小编的悉心编辑与分享。