基于EM 数据挖掘软件的分析与运用
摘要:近年来,各种数据挖掘工具已经在许多行业中取得了成功的应用,并越来越准。系统应使用数据挖掘技术的传播重点已经从基于数据库的基于Web的应用程序应使用传统的转变。本文主要介绍了数据挖掘技术,以及SAS企业软件模块Miner数据挖掘功能,现状及实际应用。
关键词:数据挖掘;SAS Enterprise miner
The analysis and use of EM data mining software
based on software
Abstract:In recent years, various tools for data mining has been successfully applied in many industries, and more and more accurate. The system should use the data mining technologyhas been the focus of communication from the database application program based on Webshould change the traditional based on. This paper mainly introduces the technology of data mining, and SAS enterprise software module of Miner data mining, the present situation andpractical application.
Keywords: Data mining,SAS Enterprise mine
一、前言
随着人们认识和改善管理水平,以描述客观世界越来越具体地,数据的存储量变得越来越对数据的数据库中的发展和应用,主要的检索查询,效率是非常低的,此外,有许多的数据时效性特别强,随着时间数据的价值会越来越低。一些数据简单的查询和统计,虽然一些低水平能满足需要,但需要更多的一般知识挖掘的决策指导,从大量的数据资源,知识是高度概括和大量的数据抽象。采集了少许迅速增长的大型数据库的大量数据,假如没有强有力的软件来执行,首要的决策不是通过数据库海量的信息来确定,是由管理者来决定的。出于这个原因,决策者非常需要从软件的大型数据库中提取有用的内容,数据挖掘技术能够满足上述要求。
二、数据挖掘
(一)数据挖掘定义
数据挖掘是由数据库技术,人工智能和统计等组成的。简易地说,数据挖掘能够将大量数据中的信息发现出来。另外一个更容易理解的意思是数据挖掘是指从海量的数据里发现隐藏着的信息,以前不知道的,在有用的内容里的过程【1】。许多人认定数据挖掘和KDD是同义词,而其他人使用数据挖掘是KDD基础的步骤,挖掘数据中内容的过程.
目 录
一、前言 1
二、数据挖掘 1
(一)数据挖掘定义 1
(二)数据挖掘发展前景 2
三、数据挖掘实验 3
(一)实验目的 3
(二)EM 软件简介 4
(三)EM的重要性 4
(四)数据关联作用性 4
(五)数据挖掘工作流程 5
(六)实验步骤 8
1、调用EM 8
2、准备建模数据 9
3、设置目标变量 10
4、数据分割 14
5、替换缺失值 15
6、回归模型 16
7、决策树模型 17
8、抽取打分程序 18
9、引入原始数据源 19
10、查看结果 20
(七)实验结果分析 22
四、总结与展望 23
五、参考文献 25
参考文献
[1]朱明,数据挖掘[D]:中国科技大学出版社,2002
[2]陈京民,数据仓库与数据挖掘技术[M].北京:电子工业出版社,2002.
[3]毛国君,.数据挖掘原理与算法[M].北京:清华大学出版社,2005.
[4]陈文伟等,数据挖掘技术[D].北京:北京工业大学出版社,2002.
[5] 黄鲁成杨少娣,论Web挖掘在新兴技术产业化潜力评估中的应用[D]. 经济论坛,2009
[6] 毛慧燕,关联规则挖掘相关算法研究[D]. 武汉大学 ,2011
[7] 文安邦,基于网络流量日志的分析与安全审计[D],大连海事大学 ,2010
[8] 包淑玮,基于数据库技术的Apriori改进算法研究与应用[D]. 浙江:浙江农业大学,2013.
[9] 梁丽琴,虚占时刻航班异常延误行为研究[D]. 电子科技大学,2009