南燕新闻

首页 > 南燕新闻 > 正文

院长基金创意创新竞赛获奖团队专题报道二:“无怀疑不能促发思考 无求证不能接近真实”

2013-01-11南燕新闻社

团队介绍:
    这支队伍是“首届院长基金创意创新竞赛总决赛”的桂冠团队,它来自城市与规划学院;其研究课题为“中国省级GDP统计的可靠性质疑——基于夜间灯光遥感数据的尝试”。
    此小组由吴健生副教授担任指导老师,由城规学院10级的王政同学担任组长,组员都为同院11级的同学:赫胜彬,牛妍,李小舟,张理卿。他们在项目研究中共同奋斗,也各自担负着任务,其中组长王政负责研究的整体设计、问题解决、数据处理和分析、成果表达及展示,赫胜彬负责遥感影像的预处理,牛妍负责经济数据的查找与预处理,李小舟负责GDP统计存在问题的分析,张理卿负责图表制作和经费的管理。
 
源起:新闻引发注意,实验产生灵感
    谈到课题的选择,王政认为此灵感主要由GDP统计数据的不准确性所激发。
    “去年年初时,我们一如既往地看到新闻里各个省‘捷报频传’,这些GDP总和比全国GDP多4万亿。类似的消息大家一定也耳熟能详。很多人都怀疑各级地方政府在虚报GDP,是不是这样呢?或者是不是都这样呢?当时我们实验室正试图利用DMSP/OLS灯光遥感数据做城市扩展方面的研究,几个组员便开始思考,可不可以用灯光数据来估计、校准GDP。”他进一步阐释想做此课题的原因:“事实上,GDP统计的不准确性早已为学界公认。已有很多经济学家利用通货法、电量法、结构方程法等多种方法尝试过估计GDP,但由于客观性较差、结果不理想、只能停留在国家层面等多种原因,不被广泛认可。”
    在萌发想法之后,他们开始查找文献,发现确已有学者证明GDP与灯光强度之间存在较强的线性关系。“这样我们研究的理论基础就具备了,当时我们很乐观,觉得剩下的思路很简单,利用GDP统计数据可靠的国家的GDP数据和灯光值回归得到一个系数,然后再用这个系数乘以中国各省的灯光值,就能得到各省的GDP。用这个值跟统计的GDP比较,就大功告成了,”王政话锋一转,“但事实上,这种乐观已经近于无知了,”他坦言,“操作中待解决的问题还非常多。”
    他提到课题面临的最大的两个问题:第一,很多研究表明,由于卫星的系统误差,各年的灯光数据不可直接相比,“这也就是为什么之前的学者一般都采用一年的截面数据做研究,而不用多年的面板;当然也有学者试图进行校正,但效果并不理想”,突破这个技术瓶颈成为团队面临的首要问题。第二,虽然GDP和灯光强度间存在线性关系,但相关系数只有0.75左右,而必须超过0.9,下一步的估计才是有意义、有说服力的。所以直接利用这样一个关系来做GDP的估计,误差将非常大,必须得找出还有什么因素影响这两者的关系。
 
过程:思维创新是利器,数据分析为关键
    明确了课题已经具备的基础和面临的问题,小组开始设计研究步骤,并有条不紊地进行。
    首先是理论推演。要突破第一个问题即技术瓶颈问题,可以通过两种互相补充的手段:一方面,可以尝试根据遥感中的不变目标法和幂函数关系对各期影像进行归一化校正;另一方面,可以在面板回归中采用时间固定效应模型,将残存的系统误差剔除到时间虚拟变量中。要解决第二个问题,王政略带自豪地说道:“我们非常创新地引入了经济学的思维:把灯光看做一种普通消费品。既然是消费品,那么灯光和GDP的关系便受到消费者消费偏好的影响。于是问题转化成了‘什么因素会影响居民对灯光的消费偏好’。我们尽可能多地考虑了一些因素:纬度、富裕程度、海拔高度、储蓄率、空间集聚度、农业比重、所在洲等。至于究竟哪些变量的影响是显著的,就要依靠数据的检验了。”
之后,他们从美国国家海洋气象局的网站上下载了1995-2009年经过年平均处理的全球灯光影像;在世界银行数据库中,甄别了统计数据可靠的国家,下载了各国历年的GDP、储蓄率等三千个样本的数万条经济数据,并找到了全球的数字高程图、行政边界及经纬度图等大量辅助数据;用arcGIS软件对影像进行校正、提取、裁切、统计等处理,得出了各地区的平均纬度、高度、灯光总值、均值和标准差等结果;对经济数据也进行购买力平价化、不变价格化等多步处理。再将这些经过预处理的数据在Stata中构造成面板,以此试验时间固定效应回归,剔除多重共线性、异方差等问题的影响,保留影响非常显著的变量,并得到各个变量的相关系数。
    “我们利用该结果与中国各省的相关数据计算出各省的GDP。在假定该结果可靠的前提下,将统计GDP与之进行比较得出了统计的误差率。结果显示,各省GDP统计的平均误差率在+25%左右,当然各省、直辖市、自治区之间差异也很大:广东历年的误差率基本为0,湖北、湖南、天津等地则大于+30%,也有个别省份,如海南、山西等误差率则在-5%左右。”王政说。
    虽然结果已经得出,但是在小组成员看来,结果的验证是个令人头疼的问题——“显然这种研究是不可能有数据直接验证的”。为了表明结果相对可信,小组做了三个假设,并依据这些假设做了相应验证:“首先,统计误差既然是人为虚报或漏报造成的,那它一定会受到领导换届、经济普查等事件的影响,那我们就要看计算出的误差率是不是受到领导换届和经济普查的影响。预期被验证了,2002年换届和两次经济普查都伴随全国平均误差率的显著降低。其次,虚报量大的省份的GDP数据很有可能会更多地被网民所质疑,统计丑闻曝光的几率也更大。通过搜索引擎的搜索,预期也得到验证。再次,统计数据可信的国家平均误差率应该比中国小很多。为此,我们计算了美国、加拿大等国家的误差率,结果发现均不超过15%。”
 
感言:求真求实敢质疑,凝结智慧与努力
    此项目具有怎样的意义和价值,能让它获得桂冠的荣誉呢?
    小组成员认为,项目的结果本身就具有不小的意义。“虽然我们不能保证对遥感数据的创新应用是最好的GDP估计方法,但至少丰富了GDP的估计手段。当然,任何研究都不可能是完全正确的,尤其我们如此大胆地运用了灯光数据,因此可能存在各种疏漏和不精确,结果也还不能作为评判统计的依据。但我们有信心说,结果是具有一定可信度。” 
    据介绍,相较于项目结果而言,他们在研究过程中获得的技术突破和其他科学发现则具有更为直观和令人信服的学术意义;具体来说可以分为四点。第一,年际灯光影像的校正技术得到改进。该成果目前已形成论文,并投稿到遥感领域的国际顶级期刊在审。第二,创新地将灯光视为消费品,并利用面板数据方法发现了灯光消费偏好的主要影响因素,这篇论文也已投稿到国际顶尖期刊在审。。第三,基于灯光作为消费品的假设,项目组推论出灯光不仅与直接产生灯光的工业、服务业相关,也与不直接产生灯光的农业相关。研究结果证实了此设想,反驳了一些学者的观点、也为灯光数据估计GDP提供了更坚实的理论基础。第四,项目组发现人均灯光消费量随人均GDP呈现先增后减的趋势,类似于倒U型的环境库兹涅兹曲线。小组对此的总结为:“相信这一系列发现将给相关研究和决策者带来些许启示和借鉴。”
    秉着实事求是、精益求精的态度,王政举出了项目研究的两个主要局限。首先是灯光影像中固有的缺陷——饱和像元问题,依然没有得到很好的解决;因此对于大都市等灯光饱和比较严重的地区,GDP计算值会偏小,“这也造成了结论中天津、上海、北京等地偏差较大的不科学结果”。其次,由于影像空间分辨率为一公里,且灯光与GDP的关系是在大量样本统计基础上建立的,因此灯光估计GDP只适用于地市以上尺度,而不适合更微观的尺度。
    “无怀疑不能促发思考,无求证不能接近真实,”对于此次获奖,小组感想颇多,组长王政尤其如是,“三分钟的视频和五分钟的辩论,凝结的是我们埋头实验室长达一年的求索,凝结的是我们办法总比困难多的集体智慧,凝结的是我们将枯燥的内容用大家乐于接受的方式呈现的努力。这绝不是一个程式化的科研,而是一个敢于质疑、勇于突破、挑战自我的历程。虽然研究远算不上尽善尽美,但我们在追求真实的道路上踏踏实实地迈进了一大步。感谢一路上实验室老师和同学的帮助、鼓励,感谢支持我们团队的每一位专家、朋友!”
 
                                                                      文/徐艺婷

 

关闭