下载此文档

数据仓库数据挖掘实验三(数据挖掘).doc


文档分类:IT计算机 | 页数:约9页 举报非法文档有奖
1/9
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/9 下载此文档
文档列表 文档介绍
.页眉. .页脚. 一、实验内容和目的目的: ; 、 OLAP 之间的关系 ,掌握数据挖掘相关工具的使用。内容: 将创建一个数据挖掘模型以训练销售数据,并使用“ Microsoft 决策树”算法在客户群中找出会员卡选择模式。请将要挖掘的维度(事例维度)设置为客户,再将 Member_Card 成员的属性设置为数据挖掘算法识别模式时要使用的信息。然后选择人口统计特征列表,算法将从中确定模式:婚姻状况、年收入、在家子女数和教育程度。下一步需要训练模型,以便能够浏览树视图并从中读取模式。市场部将根据这些模式设计新的会员卡,使其适应申请各类会员卡的客户类型。二、所用仪器、材料(设备名称、型号、规格等) 操作系统平台: Windows 7 数据库平台: SQL Server 2008 SP2 三、实验原理知识发现被认为是从数据中发现有用知识的整个过程。数据挖掘被认为是 KDD 过程中的一个特定步骤,它用专门算法从数据中抽取模式。 KDD 过程定义为: KDD 是从数据集中识别出有效出、新颖的、潜在有用的,以及最终可理解的模式的高级处理过程。 KDD 过程可以概括为 3部分: 数据准备( data preparation ), 数据挖掘及结果的解释和评估( interpretation & evaluation )。数据挖掘的对象主要是关系数据库和数据仓库,这是典型的结构化数据。. .页脚. 发展,数据挖掘对象逐步扩大到半结构化或非结构化数据,这主要是文本数据、图像与视频数据以及 Web 数据等。数据挖掘任务有 6项:关联分析、时序模式、聚类、分类、偏差检测、预测。数据挖掘方法是由人工智能、机器学****的方法发展而来,结合传统的统计分析方法、模糊数学方法以及科学计算可视化技术,以数据库为研究对象,形成了数据挖掘方法和技术。数据挖掘方法和技术可以分为 6大类: : ID3 等方法(决策树方法)、 IBLE 方法(决策规则树方法) :粗糙集( rough set )方法、关联规则挖掘、覆盖正例排斥反例方法、概念树方法。 :前馈式网络、反馈式网络、自组织网络 :繁殖(选择)、交叉(重组)、变异(突变) :物理定律发现系统 BACON 、经验公式发现系统 FDD :提取几何图元、绘制、显示和演放四、实验方法、步骤要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其 OLAP 操作过程。实验完成后,应根据实验情况写出实验报告。五、实验过程原始记录( 数据、图表、计算等) 本实验使用 Microsoft SQL Server 的数据挖掘工具,对一组电信运营商的客户数据进行挖掘,分析客户流失特征,以此来预测当前可能流失的客户,为企业营销提供支持。?首先将待挖掘数据(存放于文本文件中). .页脚. 先在数据库中建立数据表(若直接导入,相应字段的数据类型不匹配,会影响挖掘效果) USE [DW] GO SET A

数据仓库数据挖掘实验三(数据挖掘) 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数9
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2982835315
  • 文件大小0 KB
  • 时间2016-03-11