基于数据挖掘软件Weka的数据分析与应用
摘要:现今信息技术发展快速,信息化管理已经深入到了各个行业当中,由于信息化管理的高效性产生了许许多多繁杂的数据,这些数据用常规的方法很难分类,数据挖掘技术带来了解决这个问题的方法,越来越多的企业通过使用数据挖掘来提高效率。本文将使用Weka数据挖掘软件的决策树功能对乳腺癌的复发进行预测。
关键词:数据;数据挖掘;定义;分类。
Analysis and application of Weka data based on data mining software
Abstract:Nowadays information technology developing fast, information management has gone deep into various industries. Due to high efficiency of management information produced many, many complicated data. These data with conventional methods is hard to classify, data mining technology has brought the method to solve this problem, more and more enterprises by using data mining to improve efficiency. For the recurrence of this article will use the Weka decision tree data mining software function for breast cancer prediction..
Keywords:Data; data mining; Weka; DEFINITION; classification.
目录
一、 引言 1
二、 数据挖掘的介绍 2
(一) 数据挖掘的现状 2
(二) 数据挖掘的定义及含义 2
(三) 数据挖掘的过程 2
(四) Web数据挖掘 3
三、 数据挖掘软件Weka的介绍和实验目的 5
(一) 数据挖掘实验的目的 5
(二) Weka软件的简介 6
(三) Weka功能界面介绍 6
1. 总界面 6
2. Explorer界面 7
3. Experimenter界面 9
4. KnowledgeFlow界面 10
5. Simple CLI界面 11
(四) Weka数据挖掘流程 11
1、 数据预处理 12
2、 训练 12
3、 验证 12
(五) 实验流程 12
(六) 实验结果分析 18
四、 总结和展望 20
五、 小结 21
六、 参考文献 23
六、参考文献
[1] 袁梅宇.数据挖掘与机器学习—WEKA应用技术与实践 [M].北京.清华大学出版社,2014.
[2] 陈京民.数据仓库与数据挖掘技术 [M].北京.电子工业出版社,2007.
[3] 陈学进.Web结构挖掘研究[D]..银川.合肥工业大学,2006.
[4] Witten.I.H;Frank.E. 数据挖掘实用机器学习技术 [M] 新西兰.机械工业出版社,2006
[5] 丁春荣,李龙澍,杨宝华.基于粗糙集的决策树构造算法[J]. 计算机工程,2010.
[6] 周青松.贝叶斯网在图书馆图书采购中的应用[D].云南大学,2012.
[7] 王学辉,王兴鹏.教你使用数据挖掘工具Weka[J]. 电脑学习,2007
[8] 薛永大.网页分类技术研究综述[J]. 电脑知识与学习,2013
[9] 陈海霞.面向数据挖掘的分类器集成研究[].吉林:吉林大学,2006.
[10] 林聪.Web数据挖掘研究综述[J].现代计算机(专业版),2008
http://www.bysj360.com/ http://www.bysj360.com/html/5215.html http://www.bysj360.com/html/4215.html