中国住户调查数据收入变量的比较
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Comparisons on the Income Measurements in Chinese Household Survey Data
  • 作者:罗楚亮 ; 李实
  • 英文作者:Luo Chuliang;Li Shi;
  • 关键词:住户调查 ; 收入 ; 收入不均等 ; 收入分布 ; 数据比较
  • 中文刊名:GLSJ
  • 英文刊名:Management World
  • 机构:北京师范大学;
  • 出版日期:2019-01-15
  • 出版单位:管理世界
  • 年:2019
  • 期:v.35
  • 语种:中文;
  • 页:GLSJ201901008
  • 页数:13
  • CN:01
  • ISSN:11-1235/F
  • 分类号:31-42+233
摘要
随着对中国社会经济相关问题的关注程度日益提高,相应的住户调查数据也在逐渐增多,并且各套数据在调查方式、覆盖目标人群,甚至研究主题设计上都具有较强的相似性。本文对研究中常用的几套中国住户调查数据在样本人群结构偏差、消费与收入之间的关联性以及收入分布与收入不均等程度解释因素的差异性进行了比较。研究发现各数据都存在一定程度的人口结构偏差,但这种偏差对于收入水平和收入不均等程度的影响不明显;在一些数据中,消费和收入之间的关联性比较弱,并且与变量的度量误差对回归结果的影响具有相似性;不同数据来源的对数方差难以从变量结构特征和系数特征中得到解释。
        With more attention to social and economic issues during economic transition in China, more and more household surveys have been collected. There are many similarities among the surveys in terms of the survey method, targeted population groups, and even research topics design, but the findings and conclusions drawn from the various surveys might be very different. Therefore, this paper attempts to make some comparisons of demographic characteristics of sample population structure deviation, relationship between income and consumption, and differences in the explanatory factor of income distribution and income inequality. The findings indicate that,(1) almost all the surveys are seriously biased in the composition of"gender-age-educational attainment", although the readjustment on the demographic composition makes little change in the level of income and income inequality;(2) there is very weak correlation between income and consumption in some survey datasets, which seems to be related to the measurement error on income and consumption variables;(3) the inequality measures(variance of log income) is hard to be explained by the demographic composition and coefficient effect by regressed income function among the surveys.
引文
(1)Bjorn,G.,Li,S.and Hiroshi,S.,2014,“Data for Studying Earnings,the Distribution of Household Income and Poverty in China”,IZA working paper 8244.
    (2)Eichen,M.and M.Zhang,1993,“Annex:The 1988 Household Sample Survey-Data Description and Availability”,in K.Griffin and R.Zhao,eds.,The Distribution of Income in China,pp.331~346,New York:St.Martin’s Press.
    (3)Kong,S.T.,2010,“Rural-Urban Migration in China:Survey Design and Implementation”,in The Great Migration:Rural-Urban Migration in China and Indonesia,edited by Meng,Xin and Manning,Chris with Shi,Li and Effendi,Tadjuddin,Edward Elgar Publ.Ltd.2010.
    (4)Li,S.,Luo,C.,Wei,Z.and Yue,X.,2008,“Appendix:The 1995 and 2002 Household Surveys:Sampling Methods and Data Description”,in B.Gustafsson,S.Li,and T.Sicular,eds.,Inequality and Public Policy in China,pp.337~353,New York:Cambridge University Press.
    (5)Luo,C.,Li,S.,Sicular,T.,Deng Q.and Yue,X.,2013,“Appendix I:The 2007 Household Surveys:Sampling Methods and Data Descriptionin Shi LiSato H.Sicular T.
    (5)Luo,C.,Li,S.,Sicular,T.,Deng Q.and Yue,Description”,in Shi Li,Sato H.,Sicular T.Rising Inequality in China:Challenges to a Harmonious Society,Cambridge University Press.
    (6)Lyssiotou,P.,P.Pashardes and T.Stengos,2004,“Estimates of the Black Economy Based on Consumer Demand Approaches”,Economic Journal,114(497),pp.622~640.
    (7)Pissarides,C.A.and G.Weber,1989,“An Expenditure-Based Estimate of Britain’s Black Economy”,Journal of Public Economics,39(1),pp.17~32.
    (8)Saha,S.,P.Roy and S.Kai,2014,“Public and Private Sector Jobs,Unreported Income and Consumption Gap in India:Evidence from Micro-Data”,North American Journal of Economics and Finance,29,pp.285~300.
    (9)Tsai,L.L.,2008,“Understanding the Falsification of Village Income Statistics”,China Quarterly,vol.196(Dec.),pp.805~826.
    (10)甘犁、尹志超、贾男、徐舒、马双:《中国家庭金融调查报告·2012》,西南财经大学出版社,2012年。
    (11)卡梅伦、特里维迪:《微观计量经济学》,上海财经大学出版社,2010年。
    (12)李实、万海远:《提高我国基尼系数估算的可信度》,《经济学动态》,2013年第2期。
    (13)伍德里奇:《计量经济学导论》,中国人民大学出版社,2010年。
    (14)谢宇、邱泽奇、吕萍:《中国家庭动态跟踪调查抽样设计》,“中国家庭动态跟踪调查”技术报告系列CFPS-1,2012年。
    (15)许琪、张春泥、周翔、谢宇:《CGSS、CHIP、CHFS和CFPS收入比较》,中国家庭动态跟踪调查技术报告系列,CFPS-16,2012年。
    (16)张春泥、许琪、周翔、张晓波、谢宇:《CFPS、CGSS、CHIP、CHFS贫困率比较》,中国家庭动态跟踪调查技术报告系列,CFPS-19,2012年。
    (1)对历次数据的具体描述可参见Eichen和Zhang(1993)、Li等(2008)和Luo等(2013)。
    (2)到目前为止,对于住户调查中的流动人口都没有形成比较完整的抽样框以及规范的调查方法。在CHIP三次流动人口调查中,抽样方式也有非常大的差别。2002年流动人口样本的抽取方式是,每个城镇调查省份中选取两个城市(省会城市和另一个该省经济最发达的城市),在城镇住户相同的社区内抽取一定的外来户。2007年的流动人口样本则是在外来人口最多的16个城市,根据工作地点抽取农民工样本(Kong,2010)。2013年,国家统计局住户调查采取了按住宅抽样的一体化方案,因此流动人口与城镇住户同样被随机抽取。
    (3)国家统计局住户调查的收入和支出信息来自于被调查户的日记账。
    (4)本部分参考了“‘中国健康与营养调查’项目介绍”,参见http://www.cpc.unc.edu/projects/china/以及http://www.chinanutri.cn/Show-Article.aspx?code=Syscb6098daba7c4563a1359b4eb7f09525。
    (5)1993年以前的调查省份包括辽宁、江苏、山东、河南、湖北、湖南、广西、贵州,1997年增加了黑龙江,2011年增加了北京、上海和重庆。
    (6)参见http://www.chinagss.org/index.php?r=index/introduce。
    (7)在后续调查执行中,联合了全国各省份的40多家大学及科研机构组成的中国社会调查网络共同执行。
    (8)2003~2008年是CGSS项目的第一期,一共完成5次年度调查;2010~2019年是项目的第二期,至2015年底已完成5次年度调查,数据已经公布至2013年。
    (9)包括县区、乡镇街道、村居委会以及住户4个阶段,以住户为最终抽样单元。
    (10)在2013年进行了第二次调查,但相应的信息并没有公布,因此本文对这一数据库的信息仍基于2011年的调查。
    (11)由此所可能导致的偏差可参见李实、万海远(2013)的讨论。
    (12)参见http://www.isss.edu.cn/cfps/。
    (13)具体可参见谢宇等(2012)。
    (14)这3个变量在描述人口特征中可能是最为基础的信息,此外在收入决定的讨论中也是经常被强调的。当然,一个现实的原因也在于这些方面的公开统计信息比较详尽。此外,通常情形下,事前的调查权重设计主要是基于住户所处的地区,而年龄、性别、教育等特征通常不会构成直接的抽样单位,因此一般也不应该构成预先权重调整的基础。
    (15)中国的人口统计调查包括3种类型,逢“0”的年份进行全国人口普查,逢“5”的年份进行全国1%人口抽样调查,其余年份进行全国1‰人口变动情况抽样调查。由于本文所使用的数据大多集中在2010年左右,因而主要以第六次人口普查的信息作为总体特征。
    (16)全部样本总共划分了22个年龄组,即除了“0岁组”、“1~4岁组”、“100岁及以上”以外,其余年龄组均按5岁一组划分。鉴于篇幅,本文删除了各住户数据中基于“年龄(组)—性别”所得到的分布图,需要者可联系索取。
    (17)在住户调查数据中,对收入的定义将会影响到收入水平和收入差距的估计。但本文没有仔细讨论不同数据来源的收入口径的一致性,也没有再根据其调查信息对收入的定义重新进行调整,所采用的收入概念都是由这些调查数据中的总(净)收入直接得到的。
    (18)对于E[y|X]的估计,只要其函数形式是正确设定的,估计中并不一定需要加权(卡梅伦、特里维迪,2010,第24章)。
    (19)值得说明的是,由于调查年份不相同,因此这种比较只有参照的意义。尽管人们或许会认为,将某一年份的收入按照价格指数进行实际收入调整后再进行比较。但这种调整尽管考虑了不同年份之间价格水平的影响,但并没有考虑到收入的增长特征。收入增长,尤其是在收入分布不同位置上是增长特征,将会影响到这种比较的可信度。因此这里的比较只具有参考意义。
    (20)基于调查数据的低保人口比率指的是收入低于全国平均低保标准的人口比重,这与官方统计所给出的低保人口比率在计算方式上有所不同。官方统计中的低保人口比率是根据获得过低保补助的人口数量推算得到的。如果低保真正落实了“应保尽保”原则,则调查数据的低保比率应该与抽样调查的统计结果接近。有必要指出的是,低保人口的官方统计并不来自于国家统计局,与年度常规住户调查无关,而是由民政部门汇总得到的。因此,在某种程度上,也可以构成是对收入分布数据的验证。
    (21)CGSS和CHNS数据中关于家庭人口就业特征变量信息存在较大差异,因此这里的比较没有包括它们。
    (22)这里的高收入行业与低收入行业分别根据《中国统计年鉴(2010年)》“按行业分城镇单位就业人员平均工资”,将平均工资最低的4个行业列入低收入行业:农林牧渔业、住宿和餐饮业、水利环境和公共设施管理业、建筑业;平均工资高的4个行业列入高收入行业:金融业、信息传输计算机服务和软件业、科学研究技术服务和地质勘查业、电力燃气及水的生产和供应业。