统计211

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 6634|回复: 10
打印 上一主题 下一主题

个人写的2010年统计学专业课试题答案,希望大家指正---by惹风零零零

[复制链接]
跳转到指定楼层
1
发表于 2010-10-26 13:03:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 veil 于 2010-10-26 13:49 编辑

                 2010年考研题目(p.s试题来自于网上,如有错误恳请包涵)

         (一)五道问答题(50分)

         1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为0.132,据此能否得出这两个地区的均值相等的结论?
          【分析】首先从前提假设来看,题目中没有给出假设条件,如果用t检验的话,需要的假设条件有
          1 、两个总体正态分布
          2、总体方差未知
          3、两个总体的样本独立抽取(否则为匹配样本)
          4、小样本(n<30)
           5、每一个总体样本内部也相互独立(否则为有限总体情况)
        题目中除了假设条件没有以外,还缺少为判断标准的显著水平a,如果a>0.132则还是要拒绝原假设的。如果还要写可以加上原假设未写明。

        2.在参数统计中,卡方分布有哪些应用,并举例说明

       【分析】在参数统计中,卡方分布有
       时序:检验白噪声的lb统计量、q统计量
       检验异方差相关性的Q统计量、lm统计量
       GARCH模型六部最后一步检验正态性的偏度峰度服从自由度为2的开放分布;
       多元:wills 统计量(就是多元中的F统计量)当不满足n、p的情况时就为卡方分布。
       典型相关分析中检验典型相关系数的卡方分布。
       多元中两个总体均值的假设检验,只要两个总体中最小的总体的数目趋于无穷则也服从卡方分布。
       统计学:单个总体的方差假设检验或者是参数估计也服从卡方分布。

     (有人说还有列联分析中拟合优度和独立性检验,不过我认为列联分析根本就不属于参数统计,列联分析是非参数统计的内容,所以这两个不能写入,其实多元中还有一个和马氏距离非常相似的公式也服从卡方分布,但是这台机子上没法打出符号,就请各位童鞋自己注意一下)

       3.贝叶斯统计与经典统计的区别

       【分析】贝叶斯统计的思想是假如对某一个总体有一定的了解,那么用先验分布来描述这种认识,然后从总体中抽取样本,用样本来修正这种认识得到后验分布,以后的推断通过都通过后验分布进行。经典统计分描述统计和推断统计,其中描述统计是将数据通过图表进行分析,而推断统计则是直接通过样本来描述总体,并未涉及先验分布。

       4.时间序列的弱平稳的含义

           【分析】这个题目书上有,就不写了。

       5.对于多元回归中的多重共线性的解决方法加以评价

        【分析】这个题目书上也有明确的答案,但是要注意多重共线性解决方法中——剔除不重要的变量,要注意使用VIF而不要用特征根因为在特征值都很小的情况下,即使特征根不大也包含多重共线性,而且在使用这个方法的时候要注明,要和分析数据专业上的意义相结合共同决定一个变量是否剔除。还有在有偏估计中主成分法对多重共线性的解决无能为力。

       (二)给出三个运动员10次射击的数据,问哪些统计图图可以表示这些数据,及这些图的适用场合和特点。用哪些统计量综合分析三个运动员的表现,这些统计量各有什么特点。(15分)

        【分析】这个题还是写一下思路吧,因为这个数据时定量数据,所以一些定性和定序数据的分析方法可以应用其中,比如条形图,帕累托图,对比条形图、环形图。由于数据不是分组数据,所以可以用茎叶图和箱线图进行分析。统计量方面,应该有众数、中位数、方差、标准差、极差等等(各位童鞋要多写啊!)

        (三)R型聚类与Q型聚类含义?聚类分析与判别分析区别?层次聚类的步骤?(25分)

              【分析】R型聚类是对变量进行聚类分析,其方法有相关系数和夹角余弦以及模糊聚类,并且R型聚类得到的相似系数可以和距离相互转化。Q型聚类是对样本进行聚类分析,其方法有系统聚类法等。聚类分析与判别分析的区别主要有:
1、判别分析有假设条件,聚类法没有;(这个假设条件要看,这里不写了)
2、判别分析是研究数值型自变量与分类型因变量之间的关系,聚类分析没有。
3、判别分析可以同时分析所有的样本,聚类分析需要分步完成聚类。
4、类分析和判别分析最根本的是有没有一个现成的分类标准。聚类分析一般做探索性研究,判别分析就有点数量分析的味道了,用到概率的一些内容确定偏误风险。
关于层级聚类法,其实就是系统聚类法,课本上的知识这里就不赘述了。

      (四)消费者认为土豆片平均重量<60g,商家怀疑是运输过程中土豆片碎片沉积造成的。商家从其最大供应商抽取样品进行检验,H0:均值大于等于60g,H1:均值小于60g,如果得出均值小于60g的结论商家将拒绝该供应商的土豆片并对其起诉。(15分)
     (1)该题中的第一类错误是什么?(2)第二类错误是什么?(3)顾客认为哪类错误比较重要?厂家认为哪类错误比较重要?

       【分析】这个,这个就没有必要说了吧

       (五)给出x1,x2,...,x7个自变量,要求找出能描述某市各县区经济发展的综合变量,从而分析经济发展的的内在原因。用什么模型?这种模型对数据有什么要求?模型有哪些假设?如何得到参数估计值?如何根据结果分析该模型?(25分)
        
        【分析】这个用因子分析法,课本上的知识,这里也不赘述了。

       (六)银行估计其排队时间,随机抽取了15位顾客进行调查。得到了一个排队均值的置信区间,请问要计算出均值的置信区间需要什么假设?如何验证数据是否满足这一假设?能不能说这个区间包含均值的真值?为什么?检验得到的p=一个很小的数(好心是10的负十次方),能不能说银行的认识正确?(20分)

         【分析】这个题也比较简单,在FAN大神的笔记里写的很清楚,大家可以去参考一下。

后记:终于要放弃人大了,心情很是糟糕所以写的也就很随性,如果有错误,希望大家指教一二。虽然我没有去人大,但是我还是会定期来这里看看,既然爱上统计,那我们就是朋友。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
2
发表于 2010-10-26 13:38:46 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
3
发表于 2010-10-28 23:11:37 | 只看该作者
简单看了下前3题,感觉有比较多的错误
4
 楼主| 发表于 2010-11-7 00:53:23 | 只看该作者
本帖最后由 wangming 于 2010-11-7 00:54 编辑

回复 pigtail 的帖子

请pigtail大侠具体指出错误所在,以便学习,3Q。
5
发表于 2010-11-8 21:14:23 | 只看该作者
1、在进行成组t检验的时候,只要求正态总体及方差齐性(方差不齐做t'检验也有的称t检验),而对样本量是没有要求的,只是在样本量大的时候可以用Z检验近似;配对资料的话是两总体不独立,而两总体不独立的话不一定是配对;每一个样本内部不独立的话不能认为是有限总体情形吧;对于显著性水平,对于统计上来说,有默认5%的水平。题目用“两地区的什么比例(收入均值?)”,除非把收入离散化,要不两者不太一样吧。

2、卡方分布的来源主要是用标准正态分布的平方和,实际使用几乎是近似的,如楼主所举例子

3、贝叶斯统计与经典统计最主要的差别在于两者有不同的哲学观点,贝叶斯统计把总体的参数看出是随机变量(先验分布、后验分布),而经典统计把总体的参数看出是常数,常数的话当然就不涉及到分布了。贝叶斯统计带有比较大的主观性,在统计初期比较不被认可,而后由于有人论证了选取特定的先验分布可以得到经典统计的结论,慢慢被接受,当然现在还有人不认可贝叶斯统计。
6
 楼主| 发表于 2010-11-8 22:04:30 | 只看该作者
回复 pigtail 的帖子

谢谢pigtail大大的精彩点评。
确实这个总结错误较多,权且当作典型错误案例分析题,大家一起讨论下吧。
针对pigtail大大的点评补充自己的一些看法:
1、进行成组t检验的时候应该还要默认独立性这个前提。还有就是这个题目的重点应该是在P值为0.132时怎么下结论的问题:不拒绝,不代表相等,要看这个检验的效能是否达到了。其它的pigtail大大分析的非常精辟。
2、精辟。
3、“经典统计把总体的参数看出是常数,常数的话当然就不涉及到分布了”这个不赞同。经典统计也应该分参数检验与非参数检验,如果是参数检验的话,不是设计到正态分布等等吗?其它的完全赞同。
7
发表于 2010-11-9 22:16:54 | 只看该作者
你所说的正态分布是涉及到总体而不是参数,两者根本不是同一东东。参数的区间估计就把参数当常数来理解,所以只能解读为区间有(1-\alpha)%的可能覆盖真正的均值而不说真正的均值有(1-\alpha)%的可能落入到区间中。
8
 楼主| 发表于 2010-11-10 00:02:27 | 只看该作者
可以举个具体的例子吗?
9
发表于 2010-11-11 22:44:59 | 只看该作者
如果你有李晓松的《医学统计》教材,看下均值估计那章开头的模拟例子就是了
10
发表于 2010-11-11 23:57:30 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


免责声明|关于我们|小黑屋|联系我们|赞助我们|统计211 ( 闽ICP备09019626号  

GMT+8, 2025-4-18 17:50 , Processed in 0.081894 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表