2017
原文/ Len Kiefer 翻译/ 辛梦阳
总校/ 徐蜀辰 文献/ 于晚
排版/ 肖阳 编辑/ 众山小
译者萌像&导读:这篇数据图表示例是作者在美国房地产价格相关研究中可视化作品的一个典籍,作者通过熟练掌握的图形语法让我们从不同信息维度理解房地产价格背后的趋势与关联。图形语法包含的内容有:几何对象(点、线、条形等),图形属性(包括颜色、大小、形状等);以及统计变换(取对数,box-cox等),坐标系(标度、映射类型等),分面(数据分解为子集并联合绘制)。带着图形语法的几个要点阅读本篇,你就可以感受到作者对图表艺术的精湛掌握。
在本文中,我们将以往在Twitter中分享的一些房地产数据可视化案例汇编一起,并引发一些思考与讨论。这其中的一些图表,我有在前几期中分享并附上代码,而另一些图表,则多是这些示例的扩展补充。
2017年2月28日篇肆
房地产价格可视化专刊
◆ ◆ ◆ ◆
本文是我房地产数据可视化系列中的第四部分,以下是前三期的内容,包括绘制图表所用到的数据和R语言代码。
篇一:数据清洗
篇二:动画迷你图和点图
篇三:气泡图和波动
前言
在一些案例中,我将从美国劳工统计局(BSL)获取的失业数据与房地产价格数据融合起来。我用一些代码自动爬取美国劳工统计局网页上的数据,并将其与房地产数据融合。至于一些附加数据所带来的争议性思考,我将在接下来的博文中予以呈现。不多废话,还是直接上图吧。
关于数据全美VS各州
自始至终,我们都在利用房地美房屋价格指数(FMHPI)数据,范围涉及了50个州与华盛顿特区,以及300余座城市。在以下的图表中,包含了美国全境与50个州、华盛顿特区,以及美国全境与300余座城市的历史房地产价格指数对比。
全美VS各州
图一、各州与全美房地产价格指数(灰色线条代表各州,红色线条代表全美)
图二、各州房地产价格指数趋势
价格趋势图同样有gif格式的动态图(按年份)
图三、各州房地产价格指数趋势(动态图)
全美VS各城市
图四、各城市与全美房地产价格指数(灰色线条代表各城市,红色线条代表全美)
我们将对这一系列数据进行处理,并创建房地产价格的多样可视化图表。
房屋价格棒棒糖图
棒棒糖图是一种线段与点相连的特殊图表(https://rud.is/b/2016/04/07/geom_lollipop-by-the-chartettes/)。它集点图的位置信息与线段的长度信息于一体。我们可以用该图表中点的位置比较房价(水平)以及房价的变化(变化百分比)。 下图是一张使用2016年3月获取的50个州和华盛顿特区数据制作的房地产价格棒棒糖图。
图五、各州房地产价格变动
该图表展示了美国50个州和华盛顿特区的房地美公司房地产价格指数(FMHPI)。图中点的位置代表了各个州2016年3月的房地产价格指数。与点相连的线段表示了该州最近12个月以来,房地产价格指数的波动区间。每个州之间都以颜色进行区分,而颜色的深浅是根据最近12个月房地产价格指数的变化率确定的。
我同样准备了该图表的动态版本,从2000年的1月份开始逐月滚动变化。因为房地产价格指数(FMHPI)的基数100是以2000年12月份的全美房地产价格确定的,所有点都是以12帧进行排列的。随着时间在15年间推移,点的移动,线段的伸缩和颜色的变换都在展现着各州房地产价格的起起伏伏。
图六、各州房地产价格变动(动态版)
此外,我绘制了另一个版本,加入了粉色箱型图,边界值对应着房地产价格指数在2008年以前的最大值,以及在2008年之后的最小值。
图七、粉色箱型图
价格旋涡形气泡图
在绘制了以上图表之后,我意识到y轴仅仅标注了州名,并未增加其他信息。如果我们再向图中增加一个信息维度会怎样呢?因为房地产价格指数是以对数为标度的,线段长度代表着年度变化率(在起止点是当前月份和最近第12个月份的情况下)。在如下的图表中,我将y轴标度设置为变化率以展示300多个都市区的房地产价格指数变化情况。
图八、各城市房地产价格变动(动态版)
在该图中,竖向距离代表了房地产价格指数的年度变化率,而x州则衡量了房地产价格指数的大小。我同样在x轴与y轴加入了直方图,以统计观测的相对频率。
我创建了这个图表后我发现错过了一个机会。我可以延长x和y轴尾值直至一年前。因此这是修改后的自2005年以来每年3月份的版本:
图九、各城市房地产价格变动,自从2005年以来的每年数据,颜色对应的是每年的年均%变化。
以及动图
图十、各城市房地产价格变动(动态图)
房地产价格的
季节性变化
图十一、各城市季节性房地产价格变动(动图)
房屋价格与失业率
我曾绘制了多张图表,对各州或各城市的房地产价格指数和失业率进行对比。有人曾将下图比作一只虫子(x轴标度为失业率,y轴标度为房地产价格指数)。
图十二、各州房地产价格指数与失业率
同样有各城市对比的版本(x轴标度为失业率,y轴标度为房地产价格指数)
图十三、各城市房地产价格指数与失业率
将上图对各个城市进行分面,就得到了各城市单独图表。
图十四、各城市房地产价格指数与失业率(分面图)
各城市与全美房地产价格关系
房地产价格变动的相关性是一个热门的研究领域,许多研究人员深入研究了各地区房地产价格变动之间的关系。以下是一些展示相关性的可视化。
各城市与全美房地产价格指数
图十五、各城市与全美房地产价格指数关系(每一点代表一个月份,虚线为45度角,蓝实线为线性回归)
图十六、达拉斯及洛杉矶与全美房地产价格指数关系
我们以达拉斯和洛杉矶为例进行分析。在达拉斯,指数似乎始终偏离了回归直线。另一方面,尽管洛杉矶的回归线位于45度虚线之上,洛杉矶似乎在紧跟着全美的价格趋势。
我们进而对月度变化率(对比年度指数)进行了回归分析,如下图所示。
图十七、各城市与全美房地产价格指数月度变化率关系(每一点代表一个月份,虚线为45度角,蓝实线为线性回归)
我们再次以达拉斯和洛杉矶为例进行分析:
图十八、达拉斯及洛杉矶与全美房地产价格指数月度变化率关系
显而易见的是,各点趋于集中在回归线附近,但回归线往往具有不同的斜率。达拉斯的回归线位于45度虚线之下,可以理解为达拉斯的房价增长趋势是受到全美趋势抑制的,而洛杉矶似乎更为敏感。我们继续在所有都市区检验这种关系。
回归
在下图中,我们比较了每一幅散点图的直线斜率系数,我们可以很快发现一些规律。
图十九、各城市散点图及回归直线斜率
聚焦于四个较大的州,可以归纳其各城市的规律。
图二十、四个主要州各城市散点图及回归直线斜率
加利福尼亚州的所有都市区和佛罗里达州所有都市区(两座城市除外)的斜率都大于1,而宾夕法尼亚州和德克萨斯州的所有都市区的斜率都小于1。这意味着平均而言,当全美房价上涨(或下跌)3%时,加利福尼亚州和佛罗里达州往往上涨(或下跌)超过3%,而宾夕法尼亚州和德克萨斯州往往上升(或下跌)不到3%。
点图分布
该图展示了与全美指数相比,每个都市区的房价升值分布(月份变化率)。升值显示为蓝色,贬值显示为红色,而橙色线则对应于该月份的全美指数。早期的帖子中,我写了关于如何绘制该图的说明。
图二十一、各城市房地产价格增长率分布(x轴为月度增长率,y轴为城市数)
结论:
尽管该篇展示了很多不同的可视化,但我想将它们收集在一个地方。我现在有更多关于房地产价格趋势可视化的想法,我们约在下一篇见。
Bonus Time
福/利/时/间
参考资料免费下载
联系我们索取
资料
免费索取英文原文资料:
联系微信公众号
或电邮 Daizongliu@qq.com
「 欢迎投稿 」
我们作为专业志愿者团体,秉承理想,帮助中国可持续发展。并为之贡献:理念与传播、培训与教育、实践与孵化。欢迎您加入我们一起并肩前行!
2014-2017 ? 转载请注明:源自公众号“”