【案例一】样本的代表性
1936年《青年文摘》对美国总统大选的结果进行预测,结果失败,问题出在调查方法上(调查对象是其读者,调查方法为电话调查)。1936年有能力购买电话和订阅杂志的人并不能代表所有的选民,至少在经济上,他们是一个极其特殊的群体,是有偏的,事实后来证实他们有许多人是共和党的选民。但是如果调查选择的样本是代表性的,能代表全部选民那么调查就能得到准确的预测结果。
l 盖洛普为什么预测美国大选的结果很准确?他们采用抽样调查方法,在全国各州按比例选择调查对象对总体有很强的代表性 。
l 国家统计局发布《2009年国民经济和社会发展统计公报》,其中称“70个大中城市房屋销售价格上涨1.5%”,数字公布之后,引起了代表委员和社会舆论的广泛质疑。从数字看起来房价上涨很少,但为何与我们的感受不一致,主要原因还是在于平均数,这一数字对房屋种类、地区、地段、楼层、朝向、时点等因素而差异较大的样本进行综合平均统计,过度消除了价格变化。
l 统计局公布1月CPI数字,因为春节假期央行再度加息,市场曾预期1月CPI必将再创新高,甚至有望接近6%数字,可实际数字4.9%却让人颇为意外。原因就是统计局CPI统计的新权重:居住类、医疗保健类、娱乐教育文化类价格权重上升,食品类权重下降。而食品类价格却是百姓感受最明显的一个指标,因此平均时权重差异也使得我们感受与数字之间产生差异。