Linux开源统计学软件大盘点,总有一款适合你!
发表于 : 2011-09-14 5:59
构思这篇文章很久了,因为专业的关系,我经常用到一些统计学知识和计算,时间久了,无论是windows下还是linux下,这方面的软件也算是略知一二,而且包含了从傻瓜级到专业级的所有level。相信无论如何,如果你需要linux下的统计计算,下面推荐的软件总有一款适合你!ps. 有趣的是,以下的软件都有windows版,甚至Mac版也都不少,开源的东风加上跨平台的便利,还有什么理由不选择他们呢?
本着KISS原则,本文结构简单,没有图片,一目了然,软件按照在我心中的level从低到高排列,嘿嘿。
1. Libreoffice.Calc
网址:http://www.libreoffice.org/features/calc/
特点:提供基本的统计学计算,如summary statistics, t-test, F-test等。
优点:方便,会用Excel肯定会用Calc。
缺点:如果不用专业的眼光去挑剔,基本没啥缺陷。
2. Gnumeric
网址:http://projects.gnome.org/gnumeric/
特点:Gnumeric是Gnome的一个子项目。比上文提到的Calc节省系统资源。
优点:Calc有的统计功能Gnumeric都有,Calc没有的Gnumeric也有一些。最新版本的Gnumeric专门有个菜单就叫Statistics,可见这个软件在统计方面下的功夫。如果必须Calc和Gnumeric中选择一个,我会毫不犹豫哦选择前者!
缺点:同Calc,另外一个共同的缺点是,对于spreadsheet级别的统计软件,如Calc,Gnumeric,甚至Excel,专业领域计算的准确度不敢恭维,有兴趣的可以搜搜Science Direct,EI 或者UseR!上面这方面的论文。这里不做学术讨论,哈哈。
3. PSPP
网址:http://www.gnu.org/software/pspp/
特点:GNU的一个项目,看名字就能看出来,这个软件专门跟商业的SPSS对着干。
优点:熟悉SPSS的话,PSPP零基础就能上手。
缺点:作为SPSS的对手,功能实在不敢恭维。从这个软件上看有无商业支持,差别还是很大的!!!
4. Gretl
网址:http://gretl.sourceforge.net/
特点:好了,我们慢慢进入专业级领域了。gretl在我心中是非常强大的专门搞统计的软件,如果你不经常做统计的编程,不跑自己的统计模型,gretl绝对是终极的开源解决方案(虽然也有脚本扩展功能,但谁让有R这样的神器呢,还是术业有专攻吧)。
优点:能从多种格式导入数据,从最基本的统计计算,到高端的各种模型(时间序列,广义模型,multinomial,等等等等),都有菜单式的选择界面,生成的结果,文字的能转换成latex,rtf等格式,图片的也能保存成多种格式,方便latex论文写作。对于疑似时间序列的数据还会自动问你是不是,如果是的话会弹出定义时间的对话框,设计也很人性化。还提供多种统计教材的数据包,方便学生使用。
缺点:老实说实在是不想写这个软件的缺点,实际使用中偶尔感受到数据量大的时候速度有所下降,不过不明显。不能像R那样随意控制(这也算缺点?)。
5. R
网址:http://www.r-project.org/
特点:毫不夸张的说,R就是统计界的linux!linux的特点就是R的特点。关于Gretl和R的区别,这里已经说的清清楚楚:http://gretl.sourceforge.net/gretl_and_R.html
优点:只说一个,无敌的扩展性。
缺点:我还没用出什么缺点来。如果你非要说CLI的界面是缺点,我也没办法。不过据说处理上GB数据时速度会下降,大吞吐量的计算还需要开发者的完善。
最后说一句,统计学是解开这个纷乱世界的一把钥匙,也是一把双刃剑,慎用统计,善用佳软。
本着KISS原则,本文结构简单,没有图片,一目了然,软件按照在我心中的level从低到高排列,嘿嘿。
1. Libreoffice.Calc
网址:http://www.libreoffice.org/features/calc/
特点:提供基本的统计学计算,如summary statistics, t-test, F-test等。
优点:方便,会用Excel肯定会用Calc。
缺点:如果不用专业的眼光去挑剔,基本没啥缺陷。
2. Gnumeric
网址:http://projects.gnome.org/gnumeric/
特点:Gnumeric是Gnome的一个子项目。比上文提到的Calc节省系统资源。
优点:Calc有的统计功能Gnumeric都有,Calc没有的Gnumeric也有一些。最新版本的Gnumeric专门有个菜单就叫Statistics,可见这个软件在统计方面下的功夫。如果必须Calc和Gnumeric中选择一个,我会毫不犹豫哦选择前者!
缺点:同Calc,另外一个共同的缺点是,对于spreadsheet级别的统计软件,如Calc,Gnumeric,甚至Excel,专业领域计算的准确度不敢恭维,有兴趣的可以搜搜Science Direct,EI 或者UseR!上面这方面的论文。这里不做学术讨论,哈哈。
3. PSPP
网址:http://www.gnu.org/software/pspp/
特点:GNU的一个项目,看名字就能看出来,这个软件专门跟商业的SPSS对着干。
优点:熟悉SPSS的话,PSPP零基础就能上手。
缺点:作为SPSS的对手,功能实在不敢恭维。从这个软件上看有无商业支持,差别还是很大的!!!
4. Gretl
网址:http://gretl.sourceforge.net/
特点:好了,我们慢慢进入专业级领域了。gretl在我心中是非常强大的专门搞统计的软件,如果你不经常做统计的编程,不跑自己的统计模型,gretl绝对是终极的开源解决方案(虽然也有脚本扩展功能,但谁让有R这样的神器呢,还是术业有专攻吧)。
优点:能从多种格式导入数据,从最基本的统计计算,到高端的各种模型(时间序列,广义模型,multinomial,等等等等),都有菜单式的选择界面,生成的结果,文字的能转换成latex,rtf等格式,图片的也能保存成多种格式,方便latex论文写作。对于疑似时间序列的数据还会自动问你是不是,如果是的话会弹出定义时间的对话框,设计也很人性化。还提供多种统计教材的数据包,方便学生使用。
缺点:老实说实在是不想写这个软件的缺点,实际使用中偶尔感受到数据量大的时候速度有所下降,不过不明显。不能像R那样随意控制(这也算缺点?)。
5. R
网址:http://www.r-project.org/
特点:毫不夸张的说,R就是统计界的linux!linux的特点就是R的特点。关于Gretl和R的区别,这里已经说的清清楚楚:http://gretl.sourceforge.net/gretl_and_R.html
优点:只说一个,无敌的扩展性。
缺点:我还没用出什么缺点来。如果你非要说CLI的界面是缺点,我也没办法。不过据说处理上GB数据时速度会下降,大吞吐量的计算还需要开发者的完善。
最后说一句,统计学是解开这个纷乱世界的一把钥匙,也是一把双刃剑,慎用统计,善用佳软。