模糊关联规则的研究与应用
分類: 图书,计算机/网络,计算机理论,
作者: 陆建江,张亚非,宋自林著
出 版 社: 科学出版社
出版时间: 2008-1-1字数: 180000版次: 1页数: 143印刷时间: 2008/01/01开本: 16开印次: 1纸张: 胶版纸I S B N : 9787030205568包装: 平装编辑推荐
关联规则发现是数据挖掘中最重要的任务之一,它的目标是发现数据中属性之间有趣的关联。数量型关联规则是一种重要的关联规则类型,用来发现数量型属性之间的关联。本书应用模糊集来软化属性论域的划分边界,并系统地介绍数量型属性的模糊关联规则及其应用。主要内容包括:数量型属性的模糊关联规则及其挖掘算法;集合值和区间值关系数据库上模糊关联规则及其挖掘算法;加权模糊关联规则及其挖掘算法;模糊关联规则的并行挖掘算法;模糊关联规则的增量更新;关注模糊关联规则的挖掘算法;模糊关联规则在分类和预测中的应用等方面。
内容简介
关联规则发现是数据挖掘中最重要的任务之一,它的目标是发现数据中属性之间有趣的关联。数量型关联规则是一种重要的关联规则类型,用来发现数量型属性之间的关联。本书应用模糊集来软化属性论域的划分边界,并系统地介绍数量型属性的模糊关联规则及其应用。主要内容包括:数量型属性的模糊关联规则及其挖掘算法;集合值和区间值关系数据库上模糊关联规则及其挖掘算法;加权模糊关联规则及其挖掘算法;模糊关联规则的并行挖掘算法;模糊关联规则的增量更新;关注模糊关联规则的挖掘算法;模糊关联规则在分类和预测中的应用等方面。
本书可作为高等院校计算机专业研究生的教材,也可作为相关领域学生的参考书。
目录
前言
第一章绪论
1.1 数据挖掘概述
1.1.1 数据挖掘概念
1.1.2 数据挖掘的任务
1.1.3 数据挖掘的方法和技术
1.1.4 数据挖掘工具的评价标准
1.1.5 数据挖掘的需求与挑战
1.1.6 数据挖掘研究现状
1.2 关联规则
1.2.1 布尔型关联规则
1.2.2 数量型关联规则
1.3 本书的主要内容
第二章模糊关联规则及其挖掘算法
2.1 模糊关联规则
2.1.1 应用FCM算法将数量型属性离散化
2.1.2 模糊关联规则的挖掘算法
2.1.3 算法的正确性测试
2.1.4 在肿瘤诊断实例中的应用
2.1.5 挖掘算法的多种策略
2.1.6 优化的模糊关联规则挖掘算法
2.2 正态关联规则
2.3 三角关联规则
2.4 正态云关联规则
2.4.1 云模型
2.4.2 用正态云模型软化划分边界
2.4.3 挖掘正态云关联规则
2.4.4 正态云关联规则挖掘算法的改进
2.5 相关工作
第三章特殊数据库上的模糊关联规则及其挖掘算法
3.1 挖掘集合值关系数据库的模糊关联规则
3.2 挖掘区间值关系数据库的模糊关联规则
3.2.1 通过在区间上取样来挖掘正态关联规则
3.2.2 应用RFCM算法挖掘模糊关联规则
第四章加权模糊关联规则及其挖掘算法
4.1 加权布尔型关联规则
4.1.1 加权布尔型关联规则介绍
4.1.2 第一种加权布尔型关联规则挖掘算法
4.1.3 第二种加权布尔型关联规则挖掘算法
4.2 加权模糊关联规则
4.2.1 第一种加权模糊关联规则挖掘算法
4.2.2 第二种加权模糊关联规则挖掘算法
4.2.3 讨论
第五章模糊关联规则的并行挖掘算法
5.1 布尔型关联规则挖掘的并行算法
5.2 数量型属性离散化
5.2.1 并行编程平台
5.2.2 PFCM算法
5.3 模糊关联规则的并行挖掘算法
5.4 性能分析
第六章模糊关联规则的增量更新
6.1 模糊关联规则的增量更新
6.1.1 增加新记录
6.1.2 删除现有记录
6.2 实例分析
第七章关注模糊关联规则的挖掘算法
7.1 典型模糊关联规则的挖掘算法
7.2 兴趣模糊关联规则的挖掘算法
7.2.1 关联规则的兴趣度度量方法
7.2.2 模糊关联规则的兴趣度度量
7.2.3 兴趣模糊关联规则的挖掘算法
第八章模糊关联规则在分类中的应用
8.1 典型的分类系统
8.2 基于模糊关联规则分类系统的设计框架
8.3 基于最长模糊关联规则的分类系统
8.4 基于短模糊关联规则的分类系统
8.4.1 应用短模糊关联规则构建分类系统
8.4.2 分类系统的精简
8.5 区间值关系数据库的模糊关联规则分类方法
8.5.1 分类系统的构建
8.5.2 实验分析
第九章模糊关联规则在预测中的应用
9.1 可加性模糊系统
9.2 遗传算法
9.3 基于模糊关联规则的预测方法
9.4 模糊预测系统的遗传优化
9.4.1 简化规则库
9.4.2 调整模糊集参数
9.5 实例分析
9.6 模糊集到模糊集预测
9.6.1 正态模糊数到正态模糊数的预测问题
9.6.2 正态云到正态云的预测问题
参考文献
书摘插图
第一章 绪论
1.1数据挖掘概述
近十几年来,人们利用信息技术生产和搜集数据的能力大幅度提高,越来越多的数据库被用于商业管理、政府办公、科学研究和工程开发等,并且这一势头仍将持续发展下去。于是,一个新的挑战被提了出来:在这信息爆炸的时代,信息过量几乎成为人人都需要面对的问题,仅仅依靠数据库管理系统的查询检索机制和统计学分析方法已经远远不能满足现实的需要,它迫切要求开发一种新的强有力的数据分析工具自动和智能地将待处理的数据转化为有用的信息和知识。因此,面对“人类正被数据淹没,却饥渴于知识”的挑战,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。
1.1.1数据挖掘概念
Fayyad等人将数据库中的知识发现(KDD)定义为“从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程”(Fayyad etal.,l996)。实际上,KDD的目标在于发现未知的、有用的并且简洁的模式,它是一个交叉的研究领域,吸引了许多机器学习、模式识别、数据库、统计学、人工智能、专家系统、图形理论和数据可视化等相关领域的研究者。KDD系统通常使用来自这些领域的方法、算法和技术。
KDD过程是一个使用数据挖掘技术,根据一些特定的度量方法和阈值提取有意义知识的交互和迭代式多阶段过程,如图l—1所示。KDD的主要步骤包括:
(1)数据准备。它包括3个子步骤:数据集成、数据选择和数据预处理。数据集成将多文件或多数据库运行环境中的数据进行合并处理,解决语义模糊性、处理数据中的遗漏和清洗脏数据等。数据选择的目的是辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量。数据预处理是为了克服目前数据挖掘工具的局限性。
(2)数据挖掘。该阶段先要决定如何产生假设,是让数据挖掘系统自动为用户产生假设,还是用户自己对于数据库中可能包含的知识提出假设。前一种称为发现的数据挖掘,后一种称为验证型的数据挖掘。然后选择合适的工具进行实际的挖掘操作,发现有用的模式或知识。
……