个人写的2010年统计学专业课试题答案，希望大家指正---by惹风零零零

wangming · 发表于 2010-10-26 13:03:49

本帖最后由 veil 于 2010-10-26 13:49 编辑

               2010年考研题目（p.s试题来自于网上，如有错误恳请包涵）

      （一）五道问答题（50分）

      1.两地区的什么比例（好像是收入的均值吧），运用t检验得出p值为0.132，据此能否得出这两个地区的均值相等的结论？
      【分析】首先从前提假设来看，题目中没有给出假设条件，如果用t检验的话，需要的假设条件有
      1 、两个总体正态分布
      ２、总体方差未知
      ３、两个总体的样本独立抽取（否则为匹配样本）
      ４、小样本（ｎ<30）
         5、每一个总体样本内部也相互独立（否则为有限总体情况）
      题目中除了假设条件没有以外，还缺少为判断标准的显著水平a，如果a>0.132则还是要拒绝原假设的。如果还要写可以加上原假设未写明。

      2.在参数统计中，卡方分布有哪些应用，并举例说明

   【分析】在参数统计中，卡方分布有
   时序：检验白噪声的lb统计量、q统计量
   检验异方差相关性的Q统计量、lm统计量
   GARCH模型六部最后一步检验正态性的偏度峰度服从自由度为2的开放分布；
   多元：wills 统计量（就是多元中的F统计量）当不满足n、p的情况时就为卡方分布。
   典型相关分析中检验典型相关系数的卡方分布。
   多元中两个总体均值的假设检验，只要两个总体中最小的总体的数目趋于无穷则也服从卡方分布。
   统计学：单个总体的方差假设检验或者是参数估计也服从卡方分布。

   （有人说还有列联分析中拟合优度和独立性检验，不过我认为列联分析根本就不属于参数统计，列联分析是非参数统计的内容，所以这两个不能写入，其实多元中还有一个和马氏距离非常相似的公式也服从卡方分布，但是这台机子上没法打出符号，就请各位童鞋自己注意一下）

   3.贝叶斯统计与经典统计的区别

   【分析】贝叶斯统计的思想是假如对某一个总体有一定的了解，那么用先验分布来描述这种认识，然后从总体中抽取样本，用样本来修正这种认识得到后验分布，以后的推断通过都通过后验分布进行。经典统计分描述统计和推断统计，其中描述统计是将数据通过图表进行分析，而推断统计则是直接通过样本来描述总体，并未涉及先验分布。

   4.时间序列的弱平稳的含义

        【分析】这个题目书上有，就不写了。

   5.对于多元回归中的多重共线性的解决方法加以评价

      【分析】这个题目书上也有明确的答案，但是要注意多重共线性解决方法中——剔除不重要的变量，要注意使用VIF而不要用特征根因为在特征值都很小的情况下，即使特征根不大也包含多重共线性，而且在使用这个方法的时候要注明，要和分析数据专业上的意义相结合共同决定一个变量是否剔除。还有在有偏估计中主成分法对多重共线性的解决无能为力。

   （二）给出三个运动员10次射击的数据，问哪些统计图图可以表示这些数据，及这些图的适用场合和特点。用哪些统计量综合分析三个运动员的表现，这些统计量各有什么特点。(15分）

      【分析】这个题还是写一下思路吧，因为这个数据时定量数据，所以一些定性和定序数据的分析方法可以应用其中,比如条形图，帕累托图，对比条形图、环形图。由于数据不是分组数据，所以可以用茎叶图和箱线图进行分析。统计量方面，应该有众数、中位数、方差、标准差、极差等等（各位童鞋要多写啊！）

      （三）R型聚类与Q型聚类含义？聚类分析与判别分析区别？层次聚类的步骤？（25分)

            【分析】R型聚类是对变量进行聚类分析，其方法有相关系数和夹角余弦以及模糊聚类，并且R型聚类得到的相似系数可以和距离相互转化。Q型聚类是对样本进行聚类分析，其方法有系统聚类法等。聚类分析与判别分析的区别主要有：
1、判别分析有假设条件，聚类法没有；（这个假设条件要看，这里不写了）
2、判别分析是研究数值型自变量与分类型因变量之间的关系，聚类分析没有。
3、判别分析可以同时分析所有的样本，聚类分析需要分步完成聚类。
4、类分析和判别分析最根本的是有没有一个现成的分类标准。聚类分析一般做探索性研究，判别分析就有点数量分析的味道了，用到概率的一些内容确定偏误风险。
关于层级聚类法，其实就是系统聚类法，课本上的知识这里就不赘述了。

   （四）消费者认为土豆片平均重量<60g，商家怀疑是运输过程中土豆片碎片沉积造成的。商家从其最大供应商抽取样品进行检验，H0：均值大于等于60g，H1：均值小于60g，如果得出均值小于60g的结论商家将拒绝该供应商的土豆片并对其起诉。（15分）
   （1）该题中的第一类错误是什么？（2）第二类错误是什么？（3）顾客认为哪类错误比较重要？厂家认为哪类错误比较重要？

   【分析】这个，这个就没有必要说了吧

   （五）给出x1,x2,...,x7个自变量，要求找出能描述某市各县区经济发展的综合变量，从而分析经济发展的的内在原因。用什么模型？这种模型对数据有什么要求？模型有哪些假设？如何得到参数估计值？如何根据结果分析该模型？（25分）

      【分析】这个用因子分析法，课本上的知识，这里也不赘述了。

   （六）银行估计其排队时间，随机抽取了15位顾客进行调查。得到了一个排队均值的置信区间，请问要计算出均值的置信区间需要什么假设？如何验证数据是否满足这一假设？能不能说这个区间包含均值的真值？为什么？检验得到的p=一个很小的数（好心是10的负十次方），能不能说银行的认识正确？（20分）

      【分析】这个题也比较简单，在FAN大神的笔记里写的很清楚，大家可以去参考一下。

后记：终于要放弃人大了，心情很是糟糕所以写的也就很随性，如果有错误，希望大家指教一二。虽然我没有去人大，但是我还是会定期来这里看看，既然爱上统计，那我们就是朋友。

veil · 发表于 2010-10-26 13:38:46

提示: 作者被禁止或删除内容自动屏蔽

pigtail · 发表于 2010-10-28 23:11:37

简单看了下前3题，感觉有比较多的错误

wangming · 发表于 2010-11-7 00:53:23

本帖最后由 wangming 于 2010-11-7 00:54 编辑

回复 pigtail 的帖子

请pigtail大侠具体指出错误所在，以便学习，3Q。

pigtail · 发表于 2010-11-8 21:14:23

1、在进行成组t检验的时候，只要求正态总体及方差齐性（方差不齐做t'检验也有的称t检验），而对样本量是没有要求的，只是在样本量大的时候可以用Z检验近似；配对资料的话是两总体不独立，而两总体不独立的话不一定是配对；每一个样本内部不独立的话不能认为是有限总体情形吧；对于显著性水平，对于统计上来说，有默认5%的水平。题目用“两地区的什么比例（收入均值？）”，除非把收入离散化，要不两者不太一样吧。

2、卡方分布的来源主要是用标准正态分布的平方和，实际使用几乎是近似的，如楼主所举例子

3、贝叶斯统计与经典统计最主要的差别在于两者有不同的哲学观点，贝叶斯统计把总体的参数看出是随机变量（先验分布、后验分布），而经典统计把总体的参数看出是常数，常数的话当然就不涉及到分布了。贝叶斯统计带有比较大的主观性，在统计初期比较不被认可，而后由于有人论证了选取特定的先验分布可以得到经典统计的结论，慢慢被接受，当然现在还有人不认可贝叶斯统计。

wangming · 发表于 2010-11-8 22:04:30

回复 pigtail 的帖子

谢谢pigtail大大的精彩点评。
确实这个总结错误较多，权且当作典型错误案例分析题，大家一起讨论下吧。
针对pigtail大大的点评补充自己的一些看法：
1、进行成组t检验的时候应该还要默认独立性这个前提。还有就是这个题目的重点应该是在P值为0.132时怎么下结论的问题：不拒绝，不代表相等，要看这个检验的效能是否达到了。其它的pigtail大大分析的非常精辟。
2、精辟。
3、“经典统计把总体的参数看出是常数，常数的话当然就不涉及到分布了”这个不赞同。经典统计也应该分参数检验与非参数检验，如果是参数检验的话，不是设计到正态分布等等吗？其它的完全赞同。

pigtail · 发表于 2010-11-9 22:16:54

你所说的正态分布是涉及到总体而不是参数，两者根本不是同一东东。参数的区间估计就把参数当常数来理解，所以只能解读为区间有（1－\alpha)%的可能覆盖真正的均值而不说真正的均值有（1－\alpha)%的可能落入到区间中。

wangming · 发表于 2010-11-10 00:02:27

可以举个具体的例子吗？

pigtail · 发表于 2010-11-11 22:44:59

如果你有李晓松的《医学统计》教材，看下均值估计那章开头的模拟例子就是了

veil · 发表于 2010-11-11 23:57:30

提示: 作者被禁止或删除内容自动屏蔽

帐号		自动登录	找回密码
密码			立即注册

veil veil 当前离线积分 3191 狗仔卡	2楼发表于 2010-10-26 13:38:46 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
veil veil 当前离线积分 3191 狗仔卡
	回复支持反对使用道具举报显身卡

veil veil 当前离线积分 3191 狗仔卡	10楼发表于 2010-11-11 23:57:30 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
veil veil 当前离线积分 3191 狗仔卡
	回复支持反对使用道具举报显身卡