|
Transform菜单说明:
计算新变量:compute
变量转换:recode,visual bander,count,rank cases,automatic recode五个过程,可以看成是compute再某一方面的强化和打包。
专用过程:建立时间序列、缺失值代替和设定随机种子三个过程,前两个专用于时间序列模型。设定随机种子的功能主要影响伪随机函数的使用。
数据分析中,将连续变量转换为等级变量,或将分类变量不同的变量等级进行合并是常见的工作。而recode可以很好的完成这个任务。
Recode提供了精确的分组功能,但是如果希望进行的分组是有规律的,比如等距分组或者等样本量分组,使用recode过程进行操作就显得非常麻烦,而且可视化程度不高,可以使用visual bander过程进行可视化分段。
在数据分析中,将字符变量转换为数值变量是非常实用的一个功能,除了使用recode过程手工设定转换规则外,还可以使用automatic recode过程自动按照原变量的大小或者字母排序生成新变量,而变量值就是原值的大小次序。
Automatic recode的排序功能和rank cases类似,不同在于,automatic recode可以用于字符型变量。
所谓变量的秩序,就是对记录按照某个变量值得大小来排序。Rank cases就是用来排序的专用过程。
Count:该过程用来表示某个变量的取值中是否出现某个值,可以使单个数值,也可以指定区间,并且可以仅给出条件,而不必对整个数据集进行操作。该过程可以直接使用recode过程来实现。
Random number seed:默认情况下,随机种子随时间不停改变,这样计算出的随机数值无法重复,可以用该过程人为指定一个种子,以后所有的伪随机函数在计算时都会以该种子开始计算,即结果可以重现。
[ 本帖转载自中国统计网 ] |
|