关联产业集群的定义
Defing clusters of related industries
这篇文章是作者Delgado,Porter和Stern2016年发表在“Journal of Economic Geography”上的论文。
测量地区经济的构成并提出好的地区发展的政策都需要高质量的数据和有用的测量集聚的工具。这篇文章的目标是提供一个高质量的集群的定义以满足地区发展的需要。
关于集群的定义,Poter(2003)认为集群是地理上邻近的某一特定区域内,由各种外部性相联系的各种企业、供给者、服务提供商、相关机构的组合。总之,集群是由知识、技术、投入、需求及其他一些相联系的各种产业的组合,地区内部的集群可以使得企业和各种组织(包括大学和地方政府)更有效率的运行,同时能够共享各种技术、基础设施、知识以及供给和需求。
最初研究集群的文献都是对案例的研究,最近这些年的研究更多的转向了更大规模的、定量的研究。这些研究发现相关产业的集群的存在对地区经济的绩效至关重要,包括就业机会、创新、创业、地区新产业的出现等(see e.g., Feldman and Audretsch, 1999; Porter, 2003; Feser et al., 2008; Delgado,Porter and Stern, 2010, 2012; Neffke et al., 2011; among others)。对于集群效应到底有多大,推动集群的最重要的机制是什么,这些机制是如何和其他一些因素相联系来影响地区的企业的绩效的。现有的研究利用不同类型的集群的定义并利用产业层面的数据作为集群的测量,对于这些问题已经得出了一系列的结论。但是却没有一个最好的定义集群的方法。因此本文提出了一个测量集群的新的方法以及一组可以作为研究基准的集群的定义,这个集群的定义可以检验跨地区的集群和一组综合的经济活动。
这篇文章通过具体的参数选择系统的提出和评价了几组集群的定义,从而提出了一个新的集群的定理,基于该定理可以将相关的产业分成不同的组。该定理通过使用跨地区产业的协同定位、投入产出的联系、劳动力市场的联系可以最好的囊括产业之间的外部性。这篇文章提供了对不同地区的集群进行比较的基准。文章还通过对每一个集群组进行评分,识别出了最好的集群的分组。
文章的贡献:第一,这篇文章提出的集群定理可以对以前的集群经济的文献中提出的对产业关联的测量的集群指标进行检验,从而提出一个更大的集群的空间(依赖于不同的产业之间的联系以及参数选择而得出的集群组的定义)。第二,这篇文章提供了一个评估每一个集群分组的质量的基准的评分,相比之下,目前大部分的集群方法没有提供这个评分而主要由使用者根据研究需要来选择最好的集群分组。第三,由于这篇文章最小化了需要的法则的数量,提高了集群定义的可复制性、以及随时间进行修正的可能性(虽然说对集群定义的生成经常需要专家对单个的集群进行判断,但是这篇文章的定理第一次证明了这个过程是透明的且有据可依的)。
这篇文章提出的定义集群的步骤主要由5步组成,简要介绍如下:
第一步:定义一个可以测量任意两个产业之间关联的相似矩阵,文章使用了5种方法:

第二步:参数选择,这里的参数主要有3个:设定集群组的个数以及和集群方程相关的其他两个参数。
第三步:选择集群方程,文献中提到的集群方程一共有两类,一类是Hierarchical function (with Ward’s linkage),另一类是Centroid-based clustering functions (kmean and kmedian),由于Hierarchical function可以引入相似矩阵,因此本文中主要使用Hierarchical function。
第四步,对第一至第三步得到的集群的定义按照三个标准进行评分。分数越高的集群的定义可以认为衡量了最多的产业间的外部性。
第五步,对第一到第四步得到的集群的定义进行异常值的识别,即有没有产业被分到了一个和该产业不相关的集群组。

图1 定义集聚的过程
最后,这篇文章使用了美国2009年的675个6位数NAICS分类的制造业和服务业的数据,对前面提出的集群的定义进行了一个实证的检验。数据来自于County BusinessPatters(CBP),National Input-Output Tables,Occupational Employment Statistics(OES)。文章使用自己提出的集群定理最终生成了173个不同的集群组。对集群的分析使用的是来自美国的数据,之所以选用美国的数据是因为:第一,美国是一个非常大的多样性化的经济体,几乎每一个产业和集群都是存在的。第二,美国的不同地区之间存在很大的差异但是各地区间是高度一体化的,从而地区间的协同定位是由潜在的集群经济驱动的。第三,美国有详细的就业信息和其他来自产业和地理的经济活动的测量数据。

Abstract:
Clusters are groups of industries related by knowledge, skills, inputs, demand, and other linkages in a region (Porter, 2003). There is an increasing need for cluster-based data to allow regions to benchmark their clusters against other regions and to help researchers, policymakers and practitioners define effective regional strategies. This paper develops a novel clustering algorithm that generates sets of quantitatively derived industry cluster definitions based on clearly specified parameter choices. Our method also provides scores that assess the quality of each set of cluster definitions. The empirical analysis is based in the United States, but the methodology can be applied to other countries. Using 2009 data for most industries (6-digit NAICS) in service and manufacturing and multiple measures of inter-industry linkages (e.g., basedon co-location patterns, skills or input-output links), we have systematically generated and ranked numerous sets of cluster definitions. We find that adefinition based on grouping industries with the same 3-digit NAICS performs poorly. The original cluster definitions developed by Porter (2003) are very meaningful, capturing many types of industry interdependencies. We use our algorithm to propose a new set of systematically generated cluster definitionsthat incorporate measures of industry linkages based on co-location patterns,input-output links, and labor occupation links. This set of cluster definitions better capture the structure of industry interdependencies today, and can be replicated and updated over time.
参考文献:
Delgado M, Porter ME, Stern S. Defining clusters of related industries [J]. Journal of Economic Geography, 2016, 16:1-38.
中国城市与区域实验室:中国城市与区域研究的交流平台,关注城市与区域发展转型,借鉴全球城市与区域发展智慧,做有国际水平的中国城市与区域现实问题导向型研究。努力做中国城市与区域科学好的研究者,做中国城市与区域科学好的组织者,做中国城市与区域科学好的传播者。
欢迎读者供稿,小编邮箱:LLXJRBB@163.com
更多精彩内容,请关注:中国城市与区域实验室
微信号:CCRLAB
