作为合作者的龙瀛老师代为陈述
图片来源@两条毛腿肩上扛
这次会议的主题是关于城市空间的品质、活力和设计。这次年会的主题和以往相比是更接近于我们的规划和设计。所以关于我们城市活力的研究工作,这是一个很经典的一个研究工作。比如从当年雅各布斯在纽约街头开始观察人对空间使用,他们的相互作用,评估当事人的活力,还有威廉·怀特等等很多人都在关注城市的活力。城市活力并不是一个非常新的一个研究的一个话题,而是说有很多城市设计,城市的理论学者做了很多探讨。为什么这次会议的主题也把活力作为一部分,因为我们现在认为我们有一些新的数据源和先进的技术的手段,让我们重新的审视经典的问题,这是主要的背景,使我们有了新的数据源,我们有新的技术手段。总体这是我们用新的数据回答我们的老的问题。所以说,我们总的定位是这样的位置。但是也有,可能会是非常重要的,用新的数据回答新的问题,产生或者来发展新的城市理论,这是另外的一个话题。总体上这是我们致力于用新的数据研究社会科学中的一些老问题。总体上我们说到的新数据,新数据是由大数据与开放数据组成的,当然我的一个观点也得到一些同行的认可,就是大的数据并不是开放的,开放的数据并不是很大的。刚才李栋说的京津冀的数据,用那个hadoop,可以很容易的存储和运行和数据挖掘,即便是图像的识别,很多都是在流转。我们今天大多数做的报告都不是真正大的数据。所以我们无论是大的数据还是开放的数据都有很多系统方面的误差。比如说这个Facebook,比如Twitter,说Twitter用户相对比例更多,微博上年轻人更多,总体上我们用这样的数据会有一些最熟悉的批评是样本的误差,但是我们也有一些针对大数据误差,新的数据误差等怎么应对。比如我有一个研究工作是什么呢?我们就用北京的公交刷卡的这种数据来研究我们北京的城市贫困问题。我们用这种有偏的数据研究有偏的人群,这种有偏的人群是非常现实的社会问题。原有我们来研究城市贫困一般问题,问在场的每一位你的收入有多少,你们的收入肯定不会超过6000块。所以这就是我们应对大数据有偏问题的一种思路。总体上如果我们用这种大数据,开放数据经常面对的一个批评是这样的,很多时候我们要回答,我们用新的数据度量了什么?特别有意思的是什么?比如还回到我们刚才说的这种公交刷卡的这种数据。这个是公交集团或者是公交公司为了收费才产生的数据,在20年前他们就有这样的数据,在10年前,很多城市都有NFC的设备。这种数据产生的过程并不是让你产生研究城市贫困,研究北京的通行问题解决的。我们很多数据产生和它应用是不匹配的,比如公交卡数据是来反映刷卡的频率,每天消费了多少,各个项目再来分钱,很多时候是这样的,各个子公司分收益,或者是申请补助。刷卡的数据很多是不能度量我们整个的行程,上车在哪里,下车之后在哪里,我们做的工作没有办法做。还有我们签到的数据可以知道位置,但是却难以知道真正发生的什么事件和相关人物。手机数据也是如此,虽然有非常值得尊敬的学者做了很多工作,但是有个别方面,难以反映通话和社会联系的内容,我们用手机数据只知道他们两个经常打电话,但是你们知道说了什么?我们说的情绪是什么?我们说的愤怒的还是高兴的?还是学术上的讨论?总体我们很多数据真正产生的背景和应用是有不匹配的,这个是说我们新的数据到底度量了什么。另外一个,我们可以发现,不同的数据源头也许有不同的反映,这是李栋做的对比。这两个图是用腾讯数据和百度数据所绘制的中国的春运的人口的迁徙模式。你看腾讯的数据是人口钻石结构。百度的是反映几个城市群他们的辐射的一个范围。长三角、珠三角,京津冀,这两个是有明显的不同,很多新数据来自互联网公司他们算法是不透明的,即便是透明的,他们得出来也是不一样的。同样一个问题我们用不同的数据,同样的数据有这么大的差别。所以刘行健跟我说,并不是说要泼什么冷水,而是我们在研究的时候是不是可以多一些思考,比如我们作为学者,作为规划师,作为设计的人员,总体上我们还是希望研究越做越好,越来越扎实,这是最初的初衷。还有另外的一个问题,关于平台设计和人类空间认知。什么意思呢?比如我们在这种我们出国旅游的时候要查餐厅、宾馆、什么地方好玩儿,如果我们在TripAdvisor上面搜索纽约的时候发现纽约在互联网公司的地址的列表里面只有比如说中城、上中区和东村属于纽约,那新泽西属不属于纽约呢?这和我们行政上的纽约和互联网公司自己的定义的纽约这是不一样的,我们在大众点评网上搜索商圈,和传统商业规划上的商圈也是不一样的,每个互联网都会对我们城市的空间Place、Space都会做一个自己的一个理解,那个又和大众点评网又不一样,又和这种美团、糯米又不一样。还有空间定位的不确定性。如果在谷歌上面搜索美国,美国给定义到堪萨斯州,还有俄克拉荷马,美国的中心是这样的位置吗?我们在地图上搜索北京可能自动定义到天安门,我们在做微博的研究,密度的研究,发现天安门这个地方人口密度一下很高,发了一个微博,选择地理信息发送就,自动的把北京的中心天安门的位置放在这个上面。但是这个事情并不真正是在天安门发生的,可能是在我们这个位置发生的。所以有很多空间位置的这个不确定性。另外一种还有我们很多同行们抓了很多数据,比如你发了微博,我发了微博,你做了拆分我也做了拆分。那么很多时候,像这个,这个是白宫转了一个消息,只是消息联系到了白宫,就是一个抱怨性的消息,这个不是一个真的人,并不是白宫发生了什么事,并不是白宫做了什么,我们只是把这个事情联系到白宫怎么了,如果我们在虚拟的世界里,现实并不是这样,反映的是机器的行为并不是我们个人的行为,这是一个另外的思考。当然还有一个是合法性,我们现在做这样的工作,我们小打小闹做做玩还可以,如果同行做成产品,要推广到整个中国设计界的产品,这个我们还是合法的?需不需要和新浪公司有一个协议,需不需要和每个用户谈,有没有权力用他的照片,算他是不是愤怒。这也涉及到合法性的问题,我们小打小闹可以,但是大张旗鼓来干,这个可能会有另外的思考,另外的考虑,非技术性的考虑。还有另外一种,数据和方法的可比性。我们知道计算机做图像识别,有几张脸经常被用的,今天我开发了一个算法,我把100张脸算了一下,你也开发了方法,再把这个100张脸算一下,我们在传统计算机界有很多通用的数据,大家用不同的算法。如果回到我们研究城市的活力,现在我们关注活力,关注品质,这个可能是注意它,刚开始可以。再过一个阶段我们可能会共享一个地方的数据,大家用不同的算法,不同数据测算,我们告诉你真实的世界是什么,你再来比对,你用扁平数据、手机数据、阿里数据测算,这个可以。我们用通用的数据测试方法,否则是不可比的。很多时候我们说论文没有写不出来的论文,在这个领域,做了成功了你能写出来,不成功你也差不多,大多数都是你做成功,或者我做了一件事。对于很多论文我们说一件事情没有做成也是值得的。比如我们证明用扁平的数据不适合研究城市活力,可能以后再有人做可能就少走弯路了。所以可以多一些这种类似不能做的研究工作,也可以我们来发表出来说出来,并不是可耻的事情。再有就是理论和实践,新的数据,新的理论,老的理论,老的数据。最后会说理性主义。我们每个人都非常理性,我们用大数据,用开放数据做定量城市研究的,每一个都是非常理性的一些学者,我们希望用量化研究工作回答我们的问题,改善我们的居民生活质量,并不是现在我们是第一批人我们是这样,我们的很多前辈们,特别是在规划设计的领域,很多工作也是很理性,比如巴西利亚,比如从工程、美学、技术上都是相对于理性主义的一个常识,所以并不是说这张片子最核心的一个要反映的观点是利用数据量化城市研究认识我们的城市,管理我们的城市,改造我们的城市,我们并不是理性主义的这方面实践的第一批人,而是我们有很多前辈们做了很多工作。这是一个总的思考。这个一部分工作是我和刘老师合作的,个别可能还没有深入的理解刘老师的思维的精髓,因为刘老师做这个BCL的LOGO,科学到艺术都是相当于是我非常崇拜的青年学者。
欢迎大家在评论区下方留言与BCL君聊聊你眼中的BCL年会,文体不限~
更多内容,请点击微信下方菜单即可查询。
请搜索微信号“Beijingcitylab”关注。

Email:BeijingCityLab@gmail.com
Emaillist: BCL@freelist.org
新浪微博:北京城市实验室BCL
微信号:beijingcitylab
网址: http://www.beijingcitylab.com
责任编辑:橘子