数据分析是一个探索过程。分析人员通过地图、图形、统计方法和计算机算法处理、分析、可视化数据,动态交互,寻找模式,验证假设,进而发现未知信息。多维时空数据通常代表非常复杂的地理现象和过程,涉及多个变量之间的相互作用及时空演变。传统GIS分析和统计方法在多维数据探索分析领域存在一定的局限。
传统GIS方法一般不能够直接用多变量信息进行制图分析、可视化和交互分类。通常做法是对单变量分类生成专题图,然后加权叠加若干专题图来实现多变量分类。这类方法有两个主要的局限。首先,它假设多变量之间的关系是线性的。第二,它生成的分类结果对用户来说很难知道每一类代表什么,也不知道类和类之间的具体差别。统计方法可以直接对多变量数据进行分类或者通过降维方法(比如主成份分析)来分析多变量时空数据,但也存在类似于传统GIS的问题:用户只得到分类结果,却不能直观地理解和探索每一类代表什么及类和类之间的差别。同时统计方法的分类结果一般不能直接和GIS动态集成。用户需要人工把计算结果和GIS数据进行关联并给类别在地图上主观赋色。在用户不了解每一类数据具体代表哪些内容以及类和类之间差别的情况下,主观的地图赋色不利于有效认知及发现规律。传统GIS软件和统计软件在多维数据探索分析上都不能够动态有效地集成时间维、空间维和多维属性进行深度的交互联动和分析。
位和多维时空分析软件通过集成多变量分类、时空多元数据关联、多元色彩模式辅助认知、最优线性排序、时空地图矩阵、多维可视化及多视角协调互动等技术,很好地解决了上述问题。位和多维时空分析软件采用基于神经网络的无监督多变量分类方法,自动进行数据模式识别,寻找最优参考矢量集合,进而达到时空多维数据分类。该方法和软件可应用于探索不同领域的时空多维数据,交互识别数据的多维关系及其时空分布模式和演化规律。
下面以美国产业经济变迁分析为例介绍软件的功能。这个案例对美国13个产业经济类型在1997-2002-2013年3个年份的工资支出按照数据内在模式做了25个分类。数据来自美国Census Bureau Business Pattern Dataset.

在模拟神经网络产生的分类映射中,每个圆代表一个类,圆的大小代表该类的数据多少。圆和圆之间的距离以及阴影颜色代表类和类之间的差异:距离越近,阴影颜色越浅,表示两个类之间越相似,相似类的颜色也越相似。分类的颜色由算法自动生成,同时也支持人工干预和设计。分类结果和颜色同时传送到系统内的地图、矩阵和多维可视化模块达到多视角联动、交互探索和复杂模式识别。
图中蓝色系列分类代表以制造业为主的产业经济组成; 红色系列的分类代表以知识经济为主的产业经济组成。每个纵轴代表一个产业经济类型。每一个分类的细节在各个产业经济类型的组成都很清晰地表达在平行坐标图上。类和类之间的差别在分类映射表和平行坐标图上表达。从地图矩阵里可以明显地看出三个年份产业经济组成结构的变化趋势;制造业递减;知识经济递增;颜色越红,表示知识经济所占的比重越大。
图中右面的颜色条矩阵是时空矩阵;横轴代表时间维(1997-2002-2013年);纵轴代表地理空间元素(美国大陆的48个州);每个颜色条标识每个州的产业经济组成分类。地理空间元素的排练顺序经过计算自动调整,以最有利于用户发现规律的顺序出现。右下角的时空矩阵设置成以颜色代表分类,长度代表某个变量的值(在图中,表示知识经济在该州产业经济组成中的比重)。
平行坐标图纵轴(所选定要分析的变量)的排列顺序经过计算进行调整,以最有利于用户发现规律的方式排列(也可以变量原始顺序排列)。数据在纵轴上的值可以不同方式显示,如global index, Nested Mean, Data MinMax, CustomizedLinear等。每套数据特点不一样,用户从中选择最有助于认知的方式来表达。数据既可以分类的形式出现,每条线代表一个分类;也可以数据的形式出现,每条线代表一条记录。
上述模块互相联动,形成关联视图,帮助用户发现数据背后隐藏的难以发现的规律。
位和多维时空数据分析技术可广泛应用于包括城乡规划在内的不同领域的时空数据分析,譬如用于探索经济、产业、人口的分布特征、公共服务设施能力评价、区域特征分析、区域特征随时间的变化分析、基于多变量的选址分析等。位和科技以桌面数据挖掘软件、在线数据分析平台(http://services.wayhe.com)、用户定制开发等方式服务用户。