ThomasRobert MalthuS(马尔萨斯)(1766-1834),Alfred James Lotke(1881-1949),Ronald Aylmer Fisher(费歇)(189l-l962),及William Feller(费勒)(1906-1970)等人用渐趋复杂的数学来研究生命表的理论,这对人类及其它总体的动力学描述具有显著意义。
William Petty(1623-1687)是Graunt同时代的经济学家及朋友。他认为需要建立中央统计部来利用人口统计学的知识;由行政区利用列出记录年龄,性别,婚姻状况等细节的记录表格来收集数据;要有出生,死亡,婚姻,收入,教育和商业等方面的统计数据。 当时在研究诸如死亡等时间序列时,Graunt注意到了随机的起伏;但他仅以机械的术语加以描述一把这些与钟表运动的忽动忽停相联系。实际上,这种不规则的变化也影响赌博和天文学。因此,其后进一步导致了随机误差的误差分布概念的出现。
在1830年之后,天文学家和社会学家 Adolphe Jacques Quetelet(1796-1874)使得诸如身高体重之类的度量值的变量的经验分布通俗化。他在生物统计研究中大量利用了理论二项分布和正太分布。
后来 Ladislaus von Bortkiewicz(1868-1931)报告了在普鲁士兵团中由马踢造成的受伤事故,发现Poisson(普阿松)分布和官方统计学有关。在计算血红细胞数目上,Poisson分布也被Ernst Ahbe(184O-1905)所用。从那时起,该分布被大量地用于计数的试验中,比如闪光的计数。
在生物学上,统计方法使得 JOhann Gregor Mendel(孟德尔)(1822-1884)认识到某些主要遗传基因的存在,它们在0,l和2三个水平显现,其中水平0(双隐性)能和水平1和2区别开来。他能确定有相同或不相同的水平的个体之间交配的结果,而且提出了某些生物学事件等价干掷一个硬币的模型;他能对任意交配的结果给出概率并用实验来验证其假设。
虽然经济学没有产生超出用初等理论来求解问题,但在较早的医学统计中却产生了有意思的问题。 Philippe Pinel(1745-1826)和 Pierre Charles alexandre Louis(1787-1872)开始了建立疾病分类的困难
课题;这些工作人员保存了精确和完整的所有病例的记录,并且能给出和预后有关的统计数字。Louis能有利用跟踪调查的方法反驳了当时广泛滥用的放血疗法。他的三个学生是值得一提的:Jules Gavarret(1808-1890)写了一本医学统计的教科书;书中有应用 Simeon-Denis Poisson(178O-1840)理论来对两个比例进行检验的许多应用; Oliver Wendell Holmes(1819-1894)和他的不知名的数学顾问对一系列分娩热病例给出了有趣的分析,证明该病是传染的,这优于任何十九世纪的类似研究;William Farr(1807-1883)在官方统计学中建立了新的惯例。 更直接的原动力来自于遗传学(确切地说是优生学)。
Francis Galton(1822一19ll)在 1886 年研究了两代豌豆重量之间的
相关时发现了Y关于一个正态变量X的线性回归及类似于椭圆的等概率线;由此 James douglas Hamilton dickson(1849-1931)导出了密度与exp(-1/2 x*TAx)成比例的联合正态形式;按标准记号,x*TAx应为x+(y一ρxx)/(1-ρρ).ρ为y对x的回归直线的斜率。从此,多元正态分布就经常出现在文献之中;而两个和三个变量的正态分布在Laplace 时就已经知道了。该联合分布能够由互相独立的正态随机变量的线性变换而构造,例如 Giovanni Antonio amedeo Plana(1781-1863)和 lrenee-Jules Bravais(1811-1863)所做,而且,反过来它能分解为互相独立的正整随机变量的积,如Auguste Bravais(1811 -1865)和 Ire-nee-Jules Bravais(1811- 1863)所做。
Markov进一步证明Pearson xx统计量为样本尺寸乘以Wihelm Hector Richard albrcht Lexis(1837-1914)的离散系数。 Walter Frank, Raphael Weldon(1860-1906)利用取独立初第二项变量和的方法得到二项变量的联合分布。
许多作者,比如 Alexander Claig Aitken(1895-1967),已经参与了发展该思想;但是许多其它思想已经被用来获得联合分布。在 Karl Pearson的方法不能产生更多的联合分布之后,Sergei Natanovic Bernstein(1880-1968)认为一个更具有生产价值的方法可能存在于随机过程的领域中。
Karl Pearson 时代,1890-1920
到1920年为止的英国生物统计学派的主要就为
(i)收集并化简了许多经验数据;
(ii)定义了具有多重和总相关系数p的联合正态分布,还定义了估计误差的联合分布;
(iii)关于拟合度的f检验,比较观察分布和理论分布,包括由 Herbert Edward Soper(1865-1930)引进的条件Poisso变量;
(iv)分析列联表,特别是利用f统计量;
(V)当边缘分布充分细分时由最大似然法估计p;
(Vi)当边缘分布没有充分定义时估计p;
(vii)由一个统一的参数估计系统来描述一组曲线,即矩方法;
(viii)利用正态定理到遗传选择问题;
(ix)通往独立性一般定理的某些进展;
(X)通往估计和检验估计精确性的一个理论的进展;
(xi)构造了适当的表。
与此同时,在法国的 Felix Edouard Justin Emile Borel(1871-1956),Maurice Frenchet(1878-1973)及 Jules Henri Poincare(1854-1912),和在俄国的Alekandr Aleksandrovic Cuprov(1874-1926),A.A.Markov Vsevolod Ivanovic Romanovsky( 1879-1954)作出许多贡献,特别是把数据的数学处理严格化。
A. FISHER 时代, 1921-1936
所有的皮尔森的方法都可以应用于大样本,而且可以对方差作出较精确的估计。但对于出现在实际应用中的小样本,这些方法就未必奏效了。William Sealy Gosset(1876-1937)因此导出了一个检验;按照R.A.Fisher的建议该检验在作了一个变换之后成为现在熟和的t- 检验。
Fisher以其四篇值得纪念的论文开创了一个新纪元;相关系数估计的精确分布;协调一致了Mendelian和生物统计对遗传学的不同方法;正确解释了列联表;估计和推断的一般定理。在1920年之后,在Rothamsted实验室,Fisher发展了有广泛应用价值的方差分析和试验与分析的理论。Fisher有很强的数学功底,特别是在组合论
(combinatorics)方面,他能吸引其他数学家作为助手。他对应用领域的选择是很幸运的;研究结果都能立即应用并有明显的经济效应;能够有效地简化假设,比如误差的正态性和独立性;和一些顽固的教条斗争;试验的花费都很低;没有伦理问题。许多重要的步骤用来发展上面提到的Pearson学派的工作的一些分支。在(iii)和(iv)中的许多重要问题被解决了;给出了正确的自由度;K.pearson已经为该目标前进了一段;在(vii)中Fishe发明了更有效的方法来估计;他拒绝了用矩方法来确定分布;在(al)中Fisher和Yate发表了统计表。 Fisher在误差分布和互相独立性的假设使其能用正交变换来保持线性和二次型之间的独立性,这样就可合理地利用t- 检验和F- 检验。Fisher看到农业试验能利用更复杂的设计。于是,双向表的影响能够按地理因素(行和列)及处理来分别分析。这能推广到n维Latin方的应用,把处理用于Larin方相应的不同字母的位置上;该方法通过实行Graeco-Latin方来实现。Fisher及其助手和同事研究了设计问题,缺损值问题,非正交性等等;
这些人包括Maurice Stevenson Bartkett(1910),William Gemmell cochran(1990-l982),他们后来在美国特别有影响。此外,还有 David John Finner(1917-),Joseph Oscar Irwin(1898-1982),Kanneth Mather(1911-),及Frank Yates(1902-)。
NEYMAN-PEARSON时代,1937-1949