中文下载地址:http://www.wekacn.org/
简介
Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化(与之对应的是SPSS公司商业数据挖掘产品--Clementine )的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data minining)软件。它和它的源代码可在其官方网站下载。有趣的是,该软件的缩写WEKA也是New Zealand独有的一种鸟名,而Weka的主要开发者同时恰好来自New Zealand的the University of Waikato。
WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。而开发者则可使用Java语言,利用Weka的架构上开发出更多的数据挖掘算法。读者如果想自己实现数据挖掘算法的话,可以看一看weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。
开发历史
WEKA自1993年由位于 New Zealand的 the University of Waikato 进行开发,最初的软件基于C语言实现。1997年,开发小组用JAVA语言重新编写了该软件,并且对相关的数据挖掘算法进行了大量的改进。2005 年8月,在第11届ACM SIGKDD国际会议上,the University of Waikato 的Weka小组荣获了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被誉为数据挖掘和机器学习历史上的里程碑,是现今最完备的数据挖掘工具之一
weka 著名的数据挖掘工具(intellegent data analysis)
- linuxwj
- 帖子: 88
- 注册时间: 2008-08-03 10:06
- 联系:
weka 著名的数据挖掘工具(intellegent data analysis)
上次由 linuxwj 在 2008-12-06 22:02,总共编辑 1 次。
- sonic370
- 帖子: 484
- 注册时间: 2008-01-23 15:16
- 来自: Earth
Re: weka 著名的数据挖掘工具(intellegent data analysis)
非常有价值的帖子?没想到这里还有其他人在搞AI。
WA L L•E (Waste Allocation Load Lifter Earth-Class)
EVE...............................ing @.@
EVE...............................ing @.@
- linuxwj
- 帖子: 88
- 注册时间: 2008-08-03 10:06
- 联系:
Re: weka 著名的数据挖掘工具(intellegent data analysis)
呵呵,我算不上哈,只是这学期选了IDA的选修课,需要用到WEKA,又想到LINUX下软件实在贫乏,就发贴推荐一下。
- anticlockwise
- 帖子: 2394
- 注册时间: 2007-03-01 20:46
- 来自: 湖南长沙
Re: weka 著名的数据挖掘工具(intellegent data analysis)
Weka是不错,不过主要是用来做试验和初始的数据分析上,真正要写程序的时候,我还是很少会用到Weka的API~~
经常要用的就是Weka的Clustering,尤其是K-Means Clustering,因为Weka给出的信息最全面,不过Weka就是速度很慢~~
要做Classification和Prediction的话,我还是会用Maximum Entropy的一些实现,例如OpenNLP和ZLMaxent~~
经常要用的就是Weka的Clustering,尤其是K-Means Clustering,因为Weka给出的信息最全面,不过Weka就是速度很慢~~
要做Classification和Prediction的话,我还是会用Maximum Entropy的一些实现,例如OpenNLP和ZLMaxent~~
-
- 帖子: 164
- 注册时间: 2008-11-22 16:48
- 联系: