石亚男,中国科学院地理科学与资源研究所博士毕业。主要工作内容与研究方向为空间信息技术在规划编制中的应用。参与研究课题包括国家“十一五”科技支撑课题《基于3S和4D的城市规划设计集成技术研究》,“十二五”科技支撑课题《城镇群空间规划与动态监测关键技术研发与集成示范》等。
感谢作者的悉心整理&授权发布。
很高兴有这个机会就“多源数据在城乡规划中的应用”主题同大家进行交流与探讨。交流内容主要包括两部分,第一部分是多源数据在城乡规划编制中应用的实例与思考,第二部分是我院信息中心近年来在这方面所开展的工作和取得的进展。
这一部分主要是介绍多源数据的内容,并结合信息中心参与过的实际案例介绍不同数据源在城乡规划编制中的应用,探讨多源数据的应用方向。
随着信息技术的发展,尤其是近年来网络技术的发展、大数据热潮的兴起,使城乡规划编制可获取的数据越来越多,数据类型和来源越来越多样,大大推动了规划分析的定量化水平。我们可以按照来源的不同将这些数据大致分成传统数据和新兴数据,其中传统数据包括最常用的统计数据、空间数据、文本数据,调查数据等;新兴数据又可以大概划分为网络开放数据和智能设备获取的大数据。不同的数据源的获取方式也不一样,主要包括部门收集、商业购买、现场调研、网络抓取、和互赢方式的合作等。
传统数据的应用大家都比较熟悉,这里只列举一些简单的例子。比如利用统计数据,分析区域的社会经济发展特征、进行对比、预测、空间可视化表达;而将统计数据空间化以后还可以进行更深层次的分析,比如计算区域间的联系强度。
空间数据应用的范围更加广泛,图中显示的是一些简单的应用案例。

在去年信息中心参与的项目中我们借助新兴数据开展了一系列的应用实践,采用的数据包括手机信令、公交卡、高速出入口监控数据以及一些网络开放数据。下面以“成都2049”项目中的相关分析为例作简单介绍。
首先对市区内居民工作日和休息日24小时的时空分布进行动态模拟;然后,针对一些特定类型的区域,分析人群的活动特征;结合这些特征的分析,得到反映特征空间性质的一些指标;以街区为单位,分析市区内的居住人口密度分布、职住关系,并基于交通小区分析居民平均出行距离、产生量、吸引量等出行特征。


对于微博数据的应用包括用户位置信息的分析和微博内容分析两部分。
应用新浪的位置微博数据进行区域联系强度的分析和人群活动特征的分析。比如左下角两张图,反映的是成都本地用户和外地用户国庆期间在成都市内的活动特征,可以看出相比本地用户,外地用户分布更加集中,主要分布在市中心商业区和主要景点。
对微博内容进行语义分析可以了解公众对城市的印象。比如左上角的图是对成都市官方微博内容进行的语义分析,提取出官方对成都的定位和宣传口号,而通过对非官方微博的语义分析,可以看到大众对成都的印象。图中字体越大,表示所占比重越大。

应用从大众点评网上抓取的数据,我们进行了城市活力和居民消费特征等方面的研究。例如结合成都美食之都的特征,对成都的餐饮消费进行了分析,并与其他主要城市的餐饮消费特征进行对比。结合餐饮类POI点位置信息,可以分析餐饮企业的空间分布、评价热点区域、消费档次等特征,左下角图就是采用点评中的人均消费数据,分析餐饮的高档消费区主要集中在哪些区域。

除此之外,我们还利用搜房网数据对城区内住宅价格、建筑年代、容积率、绿化率等要素进行了空间特征分析;利用豆瓣网数据对比各大城市文化活动数量和类型的特征,并借助演出活动的位置信息,分析城市内文化活动热点区域的分布特征。

以下基于我们的实践,谈谈对传统数据和新兴数据的一些认识。
对于传统数据来说,优点主要体现在:
?数据的来源相对可靠(至少是官方认可的数据)、数据的内容系统、收集也相对容易;
?可以获取具有时间序列的历史数据,方便规律的把握和趋势预测;
?针对城乡规划,已经建立了相对系统的理论体系、技术方法和实践经验;
?数据处理与分析工具成熟、多样。
传统数据有这么多优点,但为什么我们在规划分析过程中总觉得数据不够,不给力呢?主要是因为:
?传统数据缺乏针对个体人的数据。即使有一些抽样调查数据,但仍存在抽样样本的代表性不足、样本收集费时费力等问题;
?缺乏动态信息,很难反映人的活动特征和其他变化的事物特征;
?面对新问题的数据源缺失。城市规划现在需要面对的问题越来越多样,比如想要详细分析居民消费特征,应用传统数据就会觉得力不从心。
而对于开放数据大数据来说,长处和短处也都非常明显。
?新兴数据大大拓展了规划的数据源,为规划提供了新的视角和新的方法;
?可以提供大量关于“人”的数据,帮助规划人员更好地分析人的活动、人之间的关系以及人地的关系,帮助规划编制更能体现以人为本;
?纵深性。大数据既能反映整体性特征,也能反映某一部分群体和每个个体的特征,使规划人员进行从宏观到微观的判断与分析;
?可以提供动态的信息,帮助规划人员实现更细时间粒度的各种流空间的分析。
那么,新兴数据的缺点在哪里呢?
?数据质量。不同来源的数据都存在一定偏差,而且数据质量难以保证和检验。我们所获取的数据,通常只能反映一部分人群的特征,比如手机信令数据,只能体现有手机,经常用手机的人群的相关信息。而且由于各地电信运营商的技术水平不同,我们获取的信令质量也参差不齐。
?数据片段性。由于大部分新兴数据是依托近年来的信息技术和网络技术发展而产生的,缺乏历史积累,因此在历史分析和趋势预测方面就有天然的短板。
?来源有限、获取困难。对于多数真正的大数据来说,我们很难获取原始数据。数据的拥有方也都在探索数据增值的方向。
?理论与技术方法体系有待完善,应用领域有待拓展。目前对新兴数据的应用,基本取决于能找到什么数据,再依据能寻到的数据源去看能做出点什么分析,分析结果对规划编制的支撑作用也没有充分体现,基本还处在佐证对现状的判断阶段。

综上所述,不同类型的数据源,各有各的优缺点,各有各的长短板。而城乡规划是综合的学科和系统的工程,分析的问题复杂多样,甚至针对某一项分析,需要考虑的要素和影响因素也多样。为保证分析的科学性、有效性,并最大限度发挥数据的支撑作用,我们需要探讨多源数据在城乡规划中融合应用问题。
下面,就以常州战略项目中的一些简单分析案例,探讨多源数据在规划分析中的综合运用,主要是分析城区内人口的居住特征。需要说明的是我们也只是进行了简单的尝试,还处在比较浅显的阶段。
借助手机信令数据可以模拟人口的空间分布。而手机信令数据的可靠性则可以通过传统的人口统计数据来检验。以乡镇为单元对比传统的统计数据和信令数据得到的用户数量,可以看出二者之间具有很好的相关性。基于这个分析,才能应用信令数据进行与人口分布相关的分析。

将应用信令数据得到的用户密度与传统数据中的用地现状数据进行叠加,可以得到居住用地上的人口密度,进而划分出不同密度的居住用地。左下角图中显示的是居住用地的人口密度,颜色由绿到红代表密度由低到高。右下角是以三维方式展示的分析结果。高度代表居住用地的人口密度。

接下来,我们可以结合传统数据中的遥感影像,来看看不同人口密度居住区的环境是否具有明显的特征。从遥感影像上可以看出,在中心城区人口密度最高的居住区多是城中村,借助百度街景数据,可以对这一类居住区的环境进行更加详细的了解。

低密度的居住区多分布在城市周边。从搜房网上抓取的楼盘信息来看,多是2010年至今开发的住宅。这些楼盘高层建筑的比例高,容积率高,但入住率却很低,价格也相对较低。这也反映了常州市房地产低迷、供给过剩的现象。

再举一个例子,可以借助多源数据,评估上版规划执行的情况,从中归纳总结,为本次规划的编制提供决策参考。通过近期遥感影像与上版规划制定时期的状态进行对比,分析建设用地的扩张情况;对比两个时期的用地现状,分析土地利用类型的转变;利用手机信令数据,分析人口的聚集特征;借助大众点评数据,分析城市活力的空间分异特征。通过这些分析,可以初步得到以下结论,城镇建设用地扩张速度较快,人口集聚程度明显弱于居住用地的扩张速度,而城市活力距上版规划中提出的各类中心也有相当的差距。

面对越来越多的数据源,需要具备从数据获取到综合运用的技术能力。尤其对中规院来说,项目遍及全国,周期短,对数据收集、整理、分析需要既保证效率又要保证科学性。因此信息中心根据我院的实际情况,建立了多源数据应用的技术框架,并在此基础上开展数据积累和技术研发工作。在这个框架体系中,包括数据获取、数据服务、数据处理与分析及数据应用四个部分。下面我就结合信息中心已经完成的部分工作进行简单介绍。
对于传统数据,通过完善院内的基础数据收集制度,形成共建模式,不断充实和完善我院的基础数据库。对于难以获取的大数据,我们正在结合项目探讨能够和数据拥有方实现共赢的合作模式。为方便规划调研数据的获取,信息中心还开发了调研数据采集系统。系统基于Html5开发,不受平台和版本的限制,以微信企业号为平台,功能可不断扩充;调研底图由信息中心统一发布服务,方便用户使用;采集的数据会实时回传,项目组成员可实时共享,这样即使分组调研,大家也会在第一时间共享调研的照片和会议的记录;调研数据会统一存放在数据库中,并且自动记录采集人的信息,方便资料的归档、管理和汇总。

对于通过各种途径收集整理的数据,信息中心已经实现了虚拟化的云存储。针对每个项目组,可借助云平台实现数据的协同与共享。另外,我们开发了一系列的数据服务系统,方便用户对信息中心已有的数据进行查询、检索、申请、下载和在线分析。这些系统包括统计数据查询系统、空间基础数据服务系统、电子档案系统、全球30米地表覆盖数据平台、全国县级县域单元企业信息动态监测平台等。另外为方便查询行业竞争信息,我们还开发了竞争情报的收集和查询系统。为了方便用户使用,近期我们将推出整合的资源门户,该门户整合了上述的信息服务系统,用户可以通过该门户实现一站式访问。

为应对多源数据的处理与分析,针对传统数据,我们开发了城乡规划空间辅助分析系统。整合了常用的分析模型,该系统的功能将不断扩充;针对大数据,搭建了基于Hadoop的处理与分析平台。

对于多源数据的应用,需要在生产项目和科研项目不断积累和总结,以形成面向多源数据应用的理论体系和技术方法。
总之,我们希望通过信息中心的努力,在全院的支持和帮助下,构建一个包括机制、数据、技术工具、和理论方法的技术应用体系,使多源数据能够在规划编制中得到充分利用,辅助规划决策,为提高规划编制的工作效率和规划成果的科学性做出贡献。

以上就是我交流的全部内容,希望大家多提宝贵意见。
参与人员:石亚男 耿艳妍 翟健 余加丽 等。
感谢各项目组对我们的大力支持,感谢信息中心全体同事的共同努力!

CAUPD2015年度业务交流会视频已上传至http://www.china-up.com/video.php,欢迎浏览。