|
第一章 绪论
1 资料类型
计量资料、计数资料、等级资料的定义及区别。
计量资料――可以用度量衡来测量的数据。如高血压,身高等资料。分析方法可用t检验,F 检验等。
计数资料――按属性或特征分类后计算观察单位的个数得到的资料。可以有二分类或多分类资料。如性别为二分类资料,血型为多分类资料。分析方法可用率的u检验或卡方检验等。
等级资料――按照程度的大小或高低分为若干等级。清点各等级的观察单位个数。也称为有序分类资料。分析方法可用秩和检验。或Ridit分析。
注意事项:处理资料时先搞清楚资料类型,再选用正确的统计分析方法。
2 总体、样本、抽样误差的意义。
总体――根据研究目的确定的同质研究对象的某特征的集合。总体是相对的,可有无限总体和有限总体。
样本――由总体中随机抽取的有代表性的一部分。
抽样误差――由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
第二章 定量资料
1描述集中趋势的统计指标,意义和应用条件。
定量资料的集中趋势是用平均数来描述的。平均数是分析定量资料的基本指标,它代表一组同质变量值的集中趋势或平均水平。平均数常作为一组资料的代表值,可用于组间的分析比较。常用的平均数有算术均数、几何均数和中位数。
均数:即算术均数,适用于对称分布或近似对称分布的资料。习惯上以希腊字母 表示总体均数(population mean),以 表示样本均数(sample mean)。
几何均数:常用于变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等,简记为G表示其平均水平。
中位数:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M)。在全部变量值中,大于和小于中位数的变量值的个数相等。用中位数表示平均水平主要适用于:①变量值中出现个别特小或特大的数值;②资料的分布呈明显偏态,即大部分的变量值偏向一侧;③变量值分布一端或两端无确定数值,只有小于或大于某个数值;④资料的分布不清。
百分位数:是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。用于偏态资料的频数分布资料。
众数:全部实测值中出现最多的数字。众数在医学上常用于描述某病或某次食物中毒的潜伏期。
2描述离散趋势的统计指标,意义和应用条件。
极差(range,简记为R)亦称全距,即一组变量值中最大值与最小值之差,反映变量值的离散范围。R值大,离散度就大;R值小,离散度就小。
极差由于易受两端值的影响而不稳定。所以使用较少。
四分位间距:将数据两端各去掉25%,取中间50%的数据,这样可先计算P25和P75,求出P75与P25之差,即为四分位数间距(quartile interval 简记为Q)。四分位间距由于不易受两端值的影响而较为稳定。尽管四分位数间距比极差稳定,但仍然是两点间的距离,也不能反映出所有变量值的离散情况。用于偏态分布的资料。
方差:对于正态分布资料,为了能反映每个变量值的离散大小,往往以均数作为比较的标准。变量值与均数之差越小,说明离散度越小;反之,离散度越大。为反映总体变量值的离散度大小,可计算总体中每个变量值X与总体均数 之差的和,即Σ(X- ),称离均差和。由于X- 有正有负,即Σ(X- )=0,这样仍不能反映总体离散度大小,故计算Σ(X- )2,称为离均差平方和。由于Σ(X- )2的大小与总体中变量值的个数N的多少有关,为了消除N的影响,取其均数即为方差(variance),总体方差用 表示。方差可以较全面地反映变量值的变异情况。用于正态分布资料。
标准差:将方差开方即得标准差(standard deviation),它与原始变量值单位相同。总体标准差用 表示,样本标准差用S表示。用于正态分布资料。
变异系数:是标准差与算数均数的比值,是一个不带量纲的相对数。主要适用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。
第三章 t-检验
t-检验与u-检验各自的概念、意义、应用条件和区别。
t-检验: 服从自由度为n-1的t分布。以t分布为理论依据的检验称为t检验。由t分布公式可知,│t│值与样本均数和总体均数之差成正比,与标准误成反比 。在t分布中│t│值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小 ,说明在抽样中获得此│t│值以及更大│t│值的机会就越小,这种机会的大小是用概率P来表示的。│t│值越大,则P值越小;反之,│t│值越小,P值越大。在同一自由度下,│t│≥ ,则P≤ ; 反之,│t│< ,则P> 。
t检验的适用条件:①样本来自正态总体或近似正态总体;②两样本总体方差相。③用于小样本n<100的资料。
u-检验:当样本含量越大即 逐渐增大时,t分布逐渐逼近于u分布,当 =∞时,t分布就完全成为u分布。u分布是t-分布的特例。在u分布中│u│值越大,其两侧或单侧以外的面积所占曲线下总面积的比重就越小 ,这种机会的大小也是用概率P来表示的。│u│值越大,则P值越小;反之,│u│值越小,P值越大。在同一自由度下,│u│≥ ,则P≤ ; 反之,│u│< ,则P> 。
u检验的适用条件:①资料呈正态分布。②方差齐性。③用于大样本n>100的资料。
第四章 方差分析
1 用途:单因素、双因素、拉丁方设计、析因设计、正交设计资料。
单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用。其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低。
双因素方差分析是按照随机区组设计的原则来分析两个因素对试验结果的影响及作用。其中一个因素称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素。两个因素相互独立,且无交互影响。双因素方差分析使用的样本例数较少,分析效率高,是一种经常使用的分析方法。但双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意。
拉丁方设计是在随机区组的基础上发展起来的,它可安排一个已知的对实验结果有影响的非处理因素,增加了试验的均衡性,起到减少误差、提高效率的作用。一般用g行×g列个格子代表行区组和列区组不同水平的g2 个组合,g个拉丁字母代表处理因素的g个水平。用来分析行、列及字母三个因素对试验结果的影响及作用。
析因设计:涉及到两个或两个以上的实验因素,各因素在实验中所处的地位基本相等,且各因素之间可能存在交互作用。
正交设计:在因素较多(3个以上),因素水平数不太大,要考虑交互作用项少且为一级交互作用时,可采用正交设计。在做正交设计时,应根据研究目的具体情况选择合适的正交表。
2 应用条件:方差齐、正态分布、两个或两个以上样本的比较。
3 F检验与t-检验区别
F检验用于2个及以上样本统计检验,t-检验只能用于2个样本或单样本的统计检验
第五章 计数资料的描述(相对数)
1率与构成比的区别、意义。
率(rate)又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。
构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常以百分数表示。
构成比只能说明事物各组成部分的比重或分布,并不说明某现象发生频率或强度。二者概念和计算方法都不同,所得结论也不同。
2 标准化法的意义。
标准化法(standardization method)的意义是:当两组或多组率之间比较时,当各组内部的构成比,诸如年龄、性别、工龄、病情轻重、病程长短等明显不同时,则不能直接比较两组或多组的总率,得出结论。只有消除混杂因素的干扰,才能正确地反映死亡率的真实情况。采用标化法时,若比较的两组或多组率当内部构成不同时,需要按统一的“标准”进行调整,使之具备可比性,称之为标准化法。
第六章 率的检验
1 率的u-检验:意义、应用条件np>5;n(1-p)>5
当样本含量n足够大,且样本率p和(1-p)均不太小,如np与n(1-p)均≥5时,样本率p也是以总体率 为中心呈正态分布或近似正态分布的。这时,两率差别的假设检验可用u检验。率的u-检验包样本率与总体率比较的u检验和两样本率比较的u检验
2 率的X2检验:意义、应用条件,与率的u-检验的区别。
意义: 检验(chi-square test)是一种用途较广的假设检验方法,常用于检验两个或多个样本率及构成比之间有无差别,还用来检验配对定性资料及两种属性或特征之间是否有关系等。
应用条件:四格表及行×列表基本公式(T≥5,且N>40);四格表专用公式(T≥5,且N>40);四格表校正公式(1<T<5,且N>40);若T≤1或N≤40时,用精确概率法;行×列表简化公式(不能有1/5以上格子T<5或任一格T<1) ;配对四格表资料的 检验公式:b+c>40,若b+c≦40时用其校正公式;
区别: X2检验用于两样本、多样本、构成比的检验;率的u-检验用于两样本。
第八章 秩和检验
1 秩和检验的应用条件。
配对设计资料的秩和检验(又称Wilcoxon配对法):n>50, 正态近似法u检验,当n≤50时,查表法;
两样本比较的秩和检验(Wilcoxon两样本比较法) 当n1≤10,n2-n1≤10时查表法 当n1>20,n2-n1>10时u检验
完全随机设计多个样本比较的秩和检验(Kruskal-Wallis法,即H检验):主要适用于不宜用方差分析检验的定量资料以及多组等级资料的比较;若组数k=3,每组例数ni≤5时,用查表法,若组数k>3,或每组例数ni >5时,H分布近似服从 的 分布,可查 界值,表当各样本的相同秩次较多时(如超过25%),如等级资料,由宜用校正公式Hc。
随机区组设计资料的秩和检验:当用方差分析方法来处理随机区组设计(配伍组设计)资料不能满足方差分析的要求时,则可用秩和检验来处理。
秩和检验资料类型:计量资料(两样本、配对资料、多样本);等级资料(两样本、多样本)
第九章 相关回归
1 相关的概念、意义。
相关:两变量在数量上存在相互协同变化的关系称为相关。包括直线相关和曲线相关。
意义:用于分析双变量正态分布资料。用相关系数(r)表示两变量相关关系。当r为正值时称正相关,表示一变量随另一变量的增加而增加;当r为负值时称负相关,表示一变量随另一变量的增加而减少;|r|愈接近1,表示两变量的相关愈密切。
2 回归的概念、意义,与相关的区别与联系。
回归:反应两变量间的数量依存变化关系。用回归系数和回归方程是描述两变量间的数量关系
与相关的区别与联系:①在资料上,相关分析要求两变量x与y均为服从正态分布的随机变量;回归分析要求y是正态随机变量,而x可以不是正态随机变量而是一确定值,也可以是正态随机变量 ②在意义上,相关反映两变量相关关系;回归反映两变量间的数量依存变化关 ③在应用上,说明两变量间的相关程度及相关方向用相关;说明两变量间的数量依存变化关系用回归。
联系:①对同一组数据,r与b的符号一致。 ②对同一组数据,r与b的假设检验是等价的。
第十章 实验设计
实验设计的基本要素: 受试对象,处理因素,试验效应
受试对象:验前须对研究对象的条件作明确的规定,即明确纳入标准、排除标准、剔除标准,以确保研究对象的同质性,同时要确保研究的样本有代表性。
处理因素:同一研究中应始终保持一致,即标准化。同时对实验结果有影响的非处理因素即混杂因素,在设计中尽可能找出,以控制并削弱其影响。
试验效应:据客观、精确、敏感或特异的原则选择适宜指标反映试验效应。
实验设计的基本原则:对照、随机、重复、均衡四原则
(来源:论群网) |
评分
-
查看全部评分
|