本周,西南财经大学发布《中国家庭金融调查报告》,数据显示中国城市家庭资产平均247万元,自有住房率为89.68%。报告一出,立遭网友猛烈质疑。
有网友开心:“前天给算命的看了一下,他说我近期要发横财,我还不信,今早起来一看,247万!擦,果真发大了。”
有网友沮丧:“对不起,我扯国家后腿了,请求把我流放到美国或者加拿大,或者欧洲,要不澳洲也行”。
有网友无厘头:“据统计,潘长江和姚明平均身高为1.9米。潘长江哭了。”
还有网友技术流:中国城镇人口6亿9千万,按四口之家算(每家平均247万元人民币,也就是39.2万美元),那么城镇家庭总资产约为67.6万亿美元。另据媒体报道,截至2011年6月,全球财富总额为231万亿美元。中国仅城市家庭资产占全球财富就达29.3%!如果加上农村家庭,则占到全球财富快一半!这可能吗?欧美人和亚洲四小龙都要哭了吧?
事实上,西南财大这种调查报告,近似蹩脚的单口相声,属于“逗你玩”和“找抽”的复合体。此外意义甚微。
在中国,各种统计数据与人们的实际生活感受经常无法对应,从而显得荒谬乃至可耻,这主要有三个原因:相关和因果关系混淆;样本容量和范围有缺陷;使用概念不合理。
科学松鼠会写过一篇《别让数字吓到你》,文章指出,“统计数字不显示因果,只呈现相关。因果不来自统计,来自你对事物本质的认识”。比如说,有人心情不好,神思恍惚,出门被车撞了。他的心情与车祸就只是相关关系,不是因果关系。你不能说一个心情不好的人,就一定会被车撞,对吧?但在中国的统计及分析中,我们常常看到因果和相关的偷换。比如,2011年第一季度,中国GDP同比增长为9.7%,低于2010年一季度的11.9%。有学者就分析说,这是汽车和住房市场调控产生的影响。这种分析很虚弱,因为经济增速与宏观调控仅具相关性,而缺乏可靠的因果关系。
统计数字的另一个常见问题,是抽样不合理而产生偏差。如果不能保证足够的样本容量和很好的样本代表性,其结果自然不可信。比如,国家统计局2009年公布数据称,在金融危机影响下,中国城镇和农村居民收入增速仍超过了GDP增速。这个数据根本不靠谱,因为样本存在“选择性失明”。在此次统计中,数以亿计的农民工、私企员工、工商个体户以及灵活就业者,都被剔除了。而他们,本应在公共政策和数据统计口径中出现。
概念的不合理运用也会导致结果无法取信于人。平均数就是一个特别危险的概念。比如说,姚明走到我家,我2岁儿子宋小皮的身高就被平均到了1米6,可这有什么意义呢?有位网友说:“张家有产一千万,九个邻居穷光蛋;平均下来算一算,个个都是张百万”,这个有趣的顺口溜,充分揭示了在两极分化严重的情况下,平均数不能反映人们普遍的现实生活。实际上,只有在处理呈现正态分布特点的对象时,平均数才有意义。而在其它时候,比如贫困线划分,收入水准界定时,更应引入中位数概念。
平均数外,自有住房率是又一个危险的概念。该报告称,中国城市自有住房率达89.68%,这极易给人造成“城市里近九成人有自己房子”的错觉。可是,自有住房率本指私有住房占全部住房的比例,反映的是住房私有化的程度,而不是拥有私有住房的人在总人口中的比例。自有住房率高,可能是私有房多,但也可能意味着保障房太少。而对普通中国人来说,自有住房率这个数据的意义不大,人们更关心的是,到底有多少人拥有自己的住房。
总之,在两极分化严重的今日中国社会,不论官方还是民间的调查统计,若涉及到民生,都必须谨慎使用统计概念(最好让这概念对普通人有意义),也必须严谨抽取样本和设置范围。否则,在读了西南财大那种雷人调查统计之后,人们只会哀号——没有247万,你就当不了“平均中国人”。
(作者系知名网友)
新快报