统计211

标题: 刘万祥:基期标准化后再进行趋势分析 [打印本页]

作者: mxbj    时间: 2013-8-6 11:05
标题: 刘万祥:基期标准化后再进行趋势分析
来源:Excelpro的图表博客 http://excelpro.blog.sohu.com/     
在数据分析过程中,变量数据间常常因为噪声过大需要做标准化处理,但数据制图时是否也可以对数据做标准化处理呢?下面来看看中国统计网推荐的来自刘万祥老师的关于基期标准化后再进行趋势分析。
进行多序列数据的趋势图分析时,有时候会碰到这样的问题:
1、序列之间的数量级相差悬殊,小数据序列被大数据序列“挤压”成一条平坦的曲线,甚至躺在x轴上无法看见,无法反映其真实的变化幅度。比如做多省的 GDP增长趋势图,广东的数量级太大,那么中西部省份的曲线基本就在x轴附近了,虽然中西部省份的增长率可能高于广东,但图中并不易看出来。

2、序列之间的量纲不同,坐标轴不够用。比如做话务量的时长、话费、单价三者的变化趋势分析,三个序列之间的量纲、数量级都不相同,放在一个图中完全不成比例,单价的线条完全躺在x轴上看不见,用双坐标也只能勉强解决两个序列之间的关系。

下面这个图中,由于红线值大、变化大,我们只注意到红线的巨幅变化,而蓝线看起来似乎没有什么变化,但实际上蓝线的增长率也高达83%!这时候图表就给了我们误导。
[attach]2037[/attach]
这种情况下,我们该怎么进行作图呢?有的人对数据人为调整至相当的数量级,有的人用虚拟数据做第三个坐标轴,但这都不是好的办法,既存在误导、也很麻烦。

因为这时我们关注的是各序列之间变化趋势的差异,比较好的做法是对先各序列数据进行基期标准化,消去数量级或量纲的差异,然后对标准化后的指数数据进行趋势分析,则可真实反映变化趋势的差异。

基期标准化是以基期数据为标准,基期就是数据系列的第一个时期,各期标准化数据=100*各期数据/基期数据。这样基期数据就是100,其他各期数据就是100左右的数,是增是减、增减多少都一目了然,曲线图也可以非常清晰地反映各序列之间的变化趋势的差异。

下面是一些商业杂志上的基期标准化趋势分析的图表例子。
[attach]2038[/attach]
[attach]2039[/attach]
[attach]2040[/attach]
作者: appreciate    时间: 2013-8-7 16:53
请问:各期标准化数据=100*各期数据/基期数据。基期数据是100,这是一个固定的值的规定还是说具体的数据要根据自己的实际要求来定这个基期数据呢?




欢迎光临 统计211 (http://tj211.com/) Powered by Discuz! X3.2