|
本帖最后由 veil 于 2010-10-26 13:49 编辑
2010年考研题目(p.s试题来自于网上,如有错误恳请包涵)
(一)五道问答题(50分)
1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为0.132,据此能否得出这两个地区的均值相等的结论?
【分析】首先从前提假设来看,题目中没有给出假设条件,如果用t检验的话,需要的假设条件有
1 、两个总体正态分布
2、总体方差未知
3、两个总体的样本独立抽取(否则为匹配样本)
4、小样本(n<30)
5、每一个总体样本内部也相互独立(否则为有限总体情况)
题目中除了假设条件没有以外,还缺少为判断标准的显著水平a,如果a>0.132则还是要拒绝原假设的。如果还要写可以加上原假设未写明。
2.在参数统计中,卡方分布有哪些应用,并举例说明
【分析】在参数统计中,卡方分布有
时序:检验白噪声的lb统计量、q统计量
检验异方差相关性的Q统计量、lm统计量
GARCH模型六部最后一步检验正态性的偏度峰度服从自由度为2的开放分布;
多元:wills 统计量(就是多元中的F统计量)当不满足n、p的情况时就为卡方分布。
典型相关分析中检验典型相关系数的卡方分布。
多元中两个总体均值的假设检验,只要两个总体中最小的总体的数目趋于无穷则也服从卡方分布。
统计学:单个总体的方差假设检验或者是参数估计也服从卡方分布。
(有人说还有列联分析中拟合优度和独立性检验,不过我认为列联分析根本就不属于参数统计,列联分析是非参数统计的内容,所以这两个不能写入,其实多元中还有一个和马氏距离非常相似的公式也服从卡方分布,但是这台机子上没法打出符号,就请各位童鞋自己注意一下)
3.贝叶斯统计与经典统计的区别
【分析】贝叶斯统计的思想是假如对某一个总体有一定的了解,那么用先验分布来描述这种认识,然后从总体中抽取样本,用样本来修正这种认识得到后验分布,以后的推断通过都通过后验分布进行。经典统计分描述统计和推断统计,其中描述统计是将数据通过图表进行分析,而推断统计则是直接通过样本来描述总体,并未涉及先验分布。
4.时间序列的弱平稳的含义
【分析】这个题目书上有,就不写了。
5.对于多元回归中的多重共线性的解决方法加以评价
【分析】这个题目书上也有明确的答案,但是要注意多重共线性解决方法中——剔除不重要的变量,要注意使用VIF而不要用特征根因为在特征值都很小的情况下,即使特征根不大也包含多重共线性,而且在使用这个方法的时候要注明,要和分析数据专业上的意义相结合共同决定一个变量是否剔除。还有在有偏估计中主成分法对多重共线性的解决无能为力。
(二)给出三个运动员10次射击的数据,问哪些统计图图可以表示这些数据,及这些图的适用场合和特点。用哪些统计量综合分析三个运动员的表现,这些统计量各有什么特点。(15分)
【分析】这个题还是写一下思路吧,因为这个数据时定量数据,所以一些定性和定序数据的分析方法可以应用其中,比如条形图,帕累托图,对比条形图、环形图。由于数据不是分组数据,所以可以用茎叶图和箱线图进行分析。统计量方面,应该有众数、中位数、方差、标准差、极差等等(各位童鞋要多写啊!)
(三)R型聚类与Q型聚类含义?聚类分析与判别分析区别?层次聚类的步骤?(25分)
【分析】R型聚类是对变量进行聚类分析,其方法有相关系数和夹角余弦以及模糊聚类,并且R型聚类得到的相似系数可以和距离相互转化。Q型聚类是对样本进行聚类分析,其方法有系统聚类法等。聚类分析与判别分析的区别主要有:
1、判别分析有假设条件,聚类法没有;(这个假设条件要看,这里不写了)
2、判别分析是研究数值型自变量与分类型因变量之间的关系,聚类分析没有。
3、判别分析可以同时分析所有的样本,聚类分析需要分步完成聚类。
4、类分析和判别分析最根本的是有没有一个现成的分类标准。聚类分析一般做探索性研究,判别分析就有点数量分析的味道了,用到概率的一些内容确定偏误风险。
关于层级聚类法,其实就是系统聚类法,课本上的知识这里就不赘述了。
(四)消费者认为土豆片平均重量<60g,商家怀疑是运输过程中土豆片碎片沉积造成的。商家从其最大供应商抽取样品进行检验,H0:均值大于等于60g,H1:均值小于60g,如果得出均值小于60g的结论商家将拒绝该供应商的土豆片并对其起诉。(15分)
(1)该题中的第一类错误是什么?(2)第二类错误是什么?(3)顾客认为哪类错误比较重要?厂家认为哪类错误比较重要?
【分析】这个,这个就没有必要说了吧
(五)给出x1,x2,...,x7个自变量,要求找出能描述某市各县区经济发展的综合变量,从而分析经济发展的的内在原因。用什么模型?这种模型对数据有什么要求?模型有哪些假设?如何得到参数估计值?如何根据结果分析该模型?(25分)
【分析】这个用因子分析法,课本上的知识,这里也不赘述了。
(六)银行估计其排队时间,随机抽取了15位顾客进行调查。得到了一个排队均值的置信区间,请问要计算出均值的置信区间需要什么假设?如何验证数据是否满足这一假设?能不能说这个区间包含均值的真值?为什么?检验得到的p=一个很小的数(好心是10的负十次方),能不能说银行的认识正确?(20分)
【分析】这个题也比较简单,在FAN大神的笔记里写的很清楚,大家可以去参考一下。
后记:终于要放弃人大了,心情很是糟糕所以写的也就很随性,如果有错误,希望大家指教一二。虽然我没有去人大,但是我还是会定期来这里看看,既然爱上统计,那我们就是朋友。
|
|