本帖最后由 tjstar 于 2011-11-6 10:08 编辑
R软件上了纽约时报了。。。。。。。。 纽约时报记者Ashlee Vance《纽约时报》科技版刊登了题为 Data Analysts Captivated by R’s Power的文章,这是R自1996年由Robert Gentleman和Ross Ihaka 教授开发以来的最大新闻之一,值得庆幸。R自诞生以来,深受统计学家和统计、计量爱好者的喜爱,已经成为主流软件之一。该文的经典语录摘录如下:(中文系本人翻译,不一定准确) “R is really important to the point that it’s hard to overvalue it,” said Daryl Pregibon, a research scientist at Google, which uses the software widely. “It allows statisticians to do very intricate and complicated analyses without knowing the blood and guts of computing systems.” R重要的一点是怎么都不会高估它,它允许统计学家做很多复杂的分析,而不需要懂得很多的计算机知识。 ————Google 统计家 Daryl Pregibon What makes R so useful — and helps explain its quick acceptance — is that statisticians, engineers and scientists can improve the software’s code or write variations for specific tasks. Packages written for R add advanced algorithms, colored and textured graphs and mining techniques to dig deeper into databases. 让R变得如此有用和如此快地广受欢迎是统计学家、工程师、科学家能够精炼代码或编写各种特殊任务的包。R包增添了很多高级算法、作图颜色、文本注释,以及与数据库链接等提供了挖掘技术。 The financial services community has demonstrated a particular affinity for R; dozens of packages exist for derivatives analysis alone. 金融服务部门对R表现出了极大的兴趣,各种各样的衍生品分析包出现。 “The great beauty of R is that you can modify it to do all sorts of things,” said Hal Varian, chief economist at Google. “And you have a lot of prepackaged stuff that’s already available, so you’re standing on the shoulders of giants.” R最优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。 ————Google首席经济学家 Hal Varian R has really become the second language for people coming out of grad school now, and there’s an amazing amount of code being written for it,” said Max Kuhn, associate director of nonclinical statistics at Pfizer. “You can look on the SAS message boards and see there is a proportional downturn in traffic.” R已经成为一个人从研究生院毕业后的第二门语言了,那里由很多各种各样的code.但SAS留言板的人气存在一定比例的下降。 ———— 辉瑞(财富500强公司之一,总部所在地美国,主要经营制药)非临床统计副主任 Max Kuhn 感兴趣者可详读:http://www.nytimes.com/2009/01/0 ... 07program.html?_r=2 R语言简介 R语言是一种为统计计算和图形显示而设计的语言环境,是贝尔实验室(Bell Laboratories)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现,提供了一系列统计和图形显示工具。S语言也是目前比较流行的统计软件S-PLUS的基础。 R语言的创始人Ross Ihaka和Robert Gentleman,由于这两位“R之父”的名字都是以R开头,所以就称之为R语言。 R语言是一组数据操作,计算和图形显示工具的整合包。相对于其它同类软件,其特色在于: 1.有效的数据处理和保存机制。 2.拥有一整套数组和矩阵的操作运算符。 3.一系列连贯而又完整的数据分析中间工具。 4.图形统计可以对数据直接进行分析和显示,可用于多种图形设备。 5.一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。 6.R语言是彻底面向对象的统计编程语言。 7.R语言和其它编程语言、数据库之间有很好的接口。 8. R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差。 9.R语言具有丰富的网上资源,更为重要的一点是R提供了非常丰富的程序包,除了推荐的标准包外还有很多志愿者贡献的贡献包,可以直接利用这些包,大大提高工作效率。R语言的官方网站是http://www.r-project.org,与R语言有关的网站还有CRAN(镜像),其主站网址是:http://www.cran.r-project.org,相应的中国镜像网是:http://www.lmbe.seu.edu.cn/CRAN/,在这些网站可以下载到很多程序包以及有关R语言的资料。 R语言与统计、计量 R语言具有丰富的统计方法,大多数人使用R语言是因为其(它具有)强大的统计功能。不过对R语言比较准确的认识是一个内部包含了许多经典统计技术的环境。部分的统计功能是整合在R环境的底层,但是大多数统计功能则以包的形式提供。大约有25个包和R同时发布,也被称为标准包,如果要想得到更多的其它包,可以在R的中国镜像里找到(http://www.lmbe.seu.edu.cn/CRAN/),镜像里除了有各种包以外,还提供了其它比如关于R使用的一些资料。大多数经典的统计方法和最新的技术都可以在R中直接得到,终端用户只要花点时间去寻找就可以了。 R语言的统计分析过程常常被分解成一系列步骤,并且所有的中间结果都被保存在对象(Object)中,以便使用R里面的函数做进一步的分析。虽然SAS、SPSS和Minitab也提供了丰富的屏幕输出内容,但其中间结果很难在后续过程中分析使用。 R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。 与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者(用户)能灵活地进行数据分析,甚至创造出符合需要的新的统计计算方法。 目前国外绝大多数的统计和计量经济学研究人员以及实业界人士都选择R软件! |