分享
 
 
 

数据挖掘与知识发现

数据挖掘与知识发现  点此进入淘宝搜索页搜索
  特别声明:本站仅为商品信息简介,并不出售商品,您可点击文中链接进入淘宝网搜索页搜索该商品,有任何问题请与具体淘宝商家联系。
  參考價格: 点此进入淘宝搜索页搜索
  分類: 图书,计算机/网络,数据库,数据仓库与数据挖掘,

作者: 李雄飞,李军编著

出 版 社: 高等教育出版社

出版时间: 2003-11-1字数: 320000版次: 1页数: 228印刷时间: 2003/11/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787040133080包装: 平装内容简介

本书详尽地阐述了数据挖掘与知识发现领域中的一些基本理论和研究方法。介绍了KDD与数据挖掘的概念、数据挖掘对象、知识发现过程、研究方法以及相关研究领域和应用范围。作为知识发现的数据预处理工作,简要叙述了数据清理、数据约简、数据概念等级分层、多维数据模型等内容。书中较详细地介绍了粗糙级、模糊集、聚类分析、关联规则、人工神经网络、分类与预测等数据挖掘方法,最后还简要介绍了多媒体数据挖掘工作的有关进展。

本书可以作为计算机科学与技术专业和信息科学方向高年级本科生和研究生的教材或参考书,也可供有关科技人员学习参考。

目录

第一章绪论

1.1 引言

1.2 KDD与数据挖掘

1.2.1 KDD定义

1.2.2 KDD过程

1.2.3数据库技术发展与数据挖掘

1.3数据挖掘的对象与环境

1.3.1数据与系统特征

1.3.2数据结构

1.3.3数据库系统

1.4数据挖掘方法与相关领域

1.4.1数据挖掘相关领域

1.4.2粗糙集

1.4.3聚类

1.4.4关联规则

1.4.5决策树

1.4.6模糊集

1.4.7规则归纳

1.4.8进化计算

1.5KDD系统与应用

本章小结

习题一

第二章数据预处理与数据仓库

2.1数据清理

2.1.1填补空缺值

2.1.2消除噪声数据

2.1.3实现数据一致性

2.2数据集成与转换

2.2.1数据集成

2.2.2数据转换

2.3数据归约与浓缩

2.3.1数据立方体聚集

2.3.2维归约

2.3.3数据压缩

2.3.4数值归约

2.4概念分层

2.4.1概念分层的概念

2.4.2概念分层的类型

2.4.3数值数据的概念分层与离散化

2.4.4分类数据的概念分层

2.5数据仓库与多维数据模型

2.5.1数据仓库的概念

2.5.2数据仓库中的数据组织

2.5.3数据立方体

2.5.4多维数据库模式

2.6数据仓库与数据挖掘

2.6.1数据仓库应用

2.6.2数据挖掘和数据仓库的关系

本章小结

习题二

第三章粗糙集

3.1近似空间

3.1.1近似空间与不可分辨关系

3.1.2知识与知识库

3.2近似与粗糙集

3.2.1近似与粗糙集的基本概念

3.2.2粗糙集的基本性质

3.3粗糙集的特征描述

3.3.1近似精度

……

第四章模糊集

第五章聚类分析

第六章关联规则

第七章人工神经网络

第八章分类与预测

第九章多媒体数据挖掘

参考文献

名词索引

书摘插图

第一章绪论

1.1引言

科技的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据库管理系统的应用领域越来越广泛。条形码和信用卡的普及和使用,进一步加速了商业、金融、保险等领域的信息化进程。人们已经利用计算机取代了绝大部分手工操作。超级市场中的交易数据,油站里的油料购买数据,旅行社中的旅行信息数据等均是数据库系统的信息来源。最近十几年中,数据库中存储的数据量急剧增大。例如,NASA轨道卫星上的地球观测系统EOS每小时会向地面发回50GB的图像数据;世界上最大的数据仓库之一,美国零售商系统Wal-Mart每天会产生2亿左右的交易数据;人类基因组数据库项目已经搜集了数以GB计的人类基因编码数据等。如此多领域的数据各自存放在相应的数据库中,致使数据库的规模日益扩大,已经达到数十兆字节,有的甚至更大。与此同时,大容量、高速度、低价格的存储设备也相继问世,管理大量数据的数据库管理系统以及各类数据仓库已经能够支持存储、检索如此规模的数据。但目前数据库系统所能做到的只是对数据库中已有的数据进行存取,通过这些数据获得的信息量仅占整个数据库信息量的一小部分,因为用来对这些数据进行分析处理的工具很少,而且有局限性。在信息时代,大量信息在给人们带来方便的同时,也带来了一系列问题,比如,信息量过大,超过了人们掌握、消化的能力;一些信息真伪难辨,给信息的正确运用带来困难;网络上的信息安全难以保障;信息组织形式的不一致性,增加了对信息进行有效统一处理的难度等。另一方面,人们意识到隐藏在这些数据之后的更深层次、更重要的信息能够描述数据的整体特征,可以预测发展趋势,这些信息在决策生成的过程中具有重要的参考价值。面对海量数据库和大量繁杂信息,如何才能从中提取有价值的知识,进一步提高信息的利用率,由此引发了一个新的研究方向:基于数据库的知识发现(Knowledge Discovery in Database)及相应的数据挖掘(Data Mining)理论和技术的研究。

基于数据库的知识发现(KDD)一词首次出现在1989年举行的第十一届AAAI学术会议上,其后,在VLDB(Very Large Database)及其他与数据库领域相关的国际学术会议上也举行了KDD专题研讨会。l995年在加拿大蒙特利尔召开了第一届KDD国际学术会议(KDD’95),随后,每年召开一次这样的会议。由Kluwer Academic Publishers出版,1997年创刊的《Knowledge Discovery and Data Mining》是该领域中的第一本学术刊物。

……

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
>>返回首頁<<
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有