Schabus的研究概述了近年来健康出行评估方面的文章,综述指出了现有文献中包含和缺失的内容,作者甚至已经指出了一些实践上最近才快速发展的主题。
抛开综述中的要点,先反思一下评估本身的本质,特别是动机和目标。“评估”是个新词,大概起源于18世纪中期拉丁语的'出',以及古法语的'价值',牛津词典将其定义为“形成价值观”。所以说我们通过评估来提取物质或非物质物体的“价值”(优点或性能)。
如果评估能够告诉我们一个对象的价值是什么(或应该是什么),那评估就应该成为决策者和学者的主要实践方法,政策制定也应以公民的福祉为最终目标。为了衡量公共投资是否真正实现,评估一定要发挥其作用。然而主管部门的评估在很多情况下却仍然存在实施不足以及报告不周。这确实复杂,尤其需要在任何规划或战略工具甚至决策过程中都有足够资源可用。
从科学方面来讲,评估是对比假设的工具。我们首先假设干预措施正在完成我们的期望,就像当初对它在解决特定问题上的设定一样,但措施的影响发挥常与我们的预见不同,比如实际影响比预期小、产生得更快或更慢,甚至出现反弹效应(指不良影响导致了一个比解决中的问题还大的问题)。而由于事情不断变化或者我们的误解忽视,若想对未来做出预测,就必须认识到并使用评估这一工具来对比我们的期望。
评估还需借助于定性方法,以帮助整合不可预见的影响并更好地理解变化的过程,而令人惊讶的是,本次所选的研究几乎都没有采用定性方法。只在一项研究中Guell等人(2012)对健康出行干预措施进行了定性评估,它强调了定性输入在定义变化、判别及实践方面的重要性,并且特别整合了福利的概念。
除了福利,公平无疑是评估的另一重要方面,Schabus也在综述中表示,不管社会经济状况如何,希望每个人都能实现可持续的、健康的生活方式。但值得注意,文献中评估的健康出行干预举措通常由公共资金赞助,这意味着应该有尽可能多的人群被惠及,然而这些干预措施却很少根据可达性或公平方面的标准进行评估。虽然Schabus指出其他研究和政策文件强调了促进体力活动的举措中考虑了公平的重要性,但是本综述中的干预措施却没按照可达性或公平标准进行评估。
目前看来共享自行车领域越发强调公平性评估。从Ricci的评述(2015)以来,Clark和Curl(2016)的研究对共享自行车资产进行了社会空间分析。虽然只是广泛概念“评价”的一个方面(Urry,2007),但共享自行车在空间公平上的探索,似乎是健康出行干预中公平性评估有力的试验阵地,而原因很可能在于特定干预举措的可用性和数据的性质(Duran等,2018; Romanillos等,2016)。
Schabus综述中的大多数研究是自然实验,研究设计本身很有挑战,因为根据定义,自然实验应不受研究人员控制。为了评估政策干预的影响,对研究的设计需先于这些干预措施的实施,这样才能保证实施前后的对比。现实世界中干预措施的实施经常发生变化,如数量质量、时间进度、资金、地点等。当评估的政策在政治议程中的优先级不够高时,不确定性也会增加,这种情况在步行骑行上尤其常见。而不确定性正传达了一个信息,任何健康出行自然实验的评估框架都需要在研究设计时保持灵活,尤其是在采纳策略和研究方法方面。
变化不可预测却常常发生,于是研究人员与政策制定者间的密切合作至关重要,那些影响最终干预实施及效果的任何政治经济方面的变化,都需要通过持续沟通来应对。相反一旦与政策制定者疏离,研究人员就不会意识到政策实施的变化,也无法调整相应研究设计去适应变化,这对整个研究的可行性及其结果质量构成重大威胁。虽然给予协议很严格,保持研究项目的灵活性难度很大,但尽可能将政策干预评估的灵活性纳入项目提案仍然是值得努力的方向。
上述可能变化中,“质量”参数在更广泛评估背景下的相关性值得注意,Schabus也提到,质量是世界卫生组织(2013)报告中提出的关键建议之一。这虽不是综述主旨,但是论文评估的健康出行干预举措常常缺乏对评估质量足够详细的描述,评估框架也没有依照技术标准评价举措的质量,对那些致力于设计或评估类似干预措施的参与者来说,这显然是一个缺点。事实上应该根据现有的科学证据和技术指导,对干预措施明确界定并进行审计。
评估干预举措影响的另一个难点在于缺乏对技术细节和干预措施质量的了解,信息上的缺乏也给评估不同人群中的影响增加了难度。比如一些人群(妇女,儿童和老年人)相对于共用道路空间,更喜欢隔离出的自行车专用道,因此掌握在特定干预中应用了哪种程度的隔离就十分关键,这能解释不同人群对举措实施的不同反应(Aldred和Dales,2017)。然而现实情况却是,研究文章中经常缺失诸如隔离程度的描述细节,于是根据这一指标评估干预举措就无法完成。
对于未来的深入实践,以及将研究与政策制定相结合方面,评估模型需要通过添加定性方法来接近现实情况,这样才能更好地理解健康出行的实践、判别的定义和变化的过程。它们需要更加灵活,以适应政策实施中政治和经济的可能变数。这就意味着评估模型将变得更加复杂,比如考虑多个干预因素并在考虑混杂效应时添加更多因素。评估应该永远考虑公平性,公平也应该是所有公共政策的主要目标,因为公共政策的定义就是致力于改善所有人群、而不仅仅是某些群体的福祉。