数据处理与知识发现 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

数据处理与知识发现电子书下载地址
内容简介:
本书系统地介绍了数据预处理、数据仓库和数据挖掘的原理、方法及应用技术, 以及采用Mahout 对相应的挖掘算法进行实际练习。本书共有11 章, 分为两大部分。第1 ~7 章为理论部分。第1 章为绪论, 介绍了数据挖掘与知识发现领域中的一些基本理论、研究方法等, 也简单介绍了Hadoop 生态系统中的Mahout; 第2 ~7 章按知识发现的过程, 介绍数据预处理的方法和技术、数据仓库的构建与OLAP 技术、数据挖掘原理及算法(包括关联规则挖掘、聚类分析方法、分类规则挖掘)、常见的数据挖掘工具与产品。第8 ~11 章为实验部分, 采用Mahout 对数据挖掘各类算法进行实际练习。
本书应用性较强, 与实践相结合, 以小数据集为例详细介绍各种挖掘算法, 使读者更易掌握挖掘算法的基本原理及过程; 使用广泛的大数据平台———Hadoop 生态系统中的Mahout 对各种挖掘算法进行实际练习, 实战性强, 也符合目前数据处理与挖掘的发展趋势。
本书既便于教师课堂讲授, 又便于自学者阅读, 可作为高等院校高年级学生“数据挖掘技术” “数据仓库与数据挖掘” “数据处理与智能决策”等课程的教材。
书籍目录:
目录
前 言
上篇 理论部分
第1 章 绪论 2
1. 1 KDD 与数据挖掘 2
1. 1. 1 KDD 的定义 2
1. 1. 2 KDD 过程与数据挖掘 3
1. 2 数据挖掘的对象 4
1. 3 数据挖掘的任务 8
1. 4 Mahout 简介 12
1. 4. 1 Mahout 12
1. 4. 2 Mahout 算法库 13
1. 4. 3 Mahout 应用 16
1. 5 小结 17
1. 6 习题 17
第2 章 数据预处理 18
2. 1 数据概述 18
2. 1. 1 属性与度量 19
2. 1. 2 数据集的类型 23
2. 2 数据预处理 27
2. 2. 1 数据预处理概述 28
2. 2. 2 数据清理 30
2. 2. 3 数据集成 34
2. 2. 4 数据变换 38
2. 2. 5 数据归约 40
2. 2. 6 离散化与概念分层 48
2. 3 小结 52
2. 4 习题 53
第3 章 数据仓库 55
3. 1 数据仓库概述 55
3. 1. 1 从数据库到数据仓库 55
3. 1. 2 数据仓库 56
3. 1. 3 数据仓库系统结构 59
3. 1. 4 数据仓库中的名词 59
3. 2 数据仓库的ETL 60
3. 2. 1 ETL 的基本概念 60
3. 2. 2 ETL 的工具 60
3. 3 元数据与外部数据 62
3. 3. 1 元数据的定义 62
3. 3. 2 元数据的存储与管理 63
3. 3. 3 外部数据 64
3. 4 数据仓库模型及数据仓库的建立 65
3. 4. 1 多维数据模型 65
3. 4. 2 多维数据模型的建立 67
3. 5 联机分析处理OLAP 技术 73
3. 5. 1 OLAP 概述 73
3. 5. 2 OLAP 与数据仓库 75
3. 5. 3 OLAP 的模型 77
3. 5. 4 OLAP 的基本操作 79
3. 6 数据仓库实例 80
3. 6. 1 数据仓库的创建 81
3. 6. 2 数据的提取、转换和加载 83
3. 7 小结 83
3. 8 习题 83
第4 章 关联规则挖掘 84
4. 1 问题定义 85
4. 1. 1 购物篮分析 85
4. 1. 2 基本术语 85
4. 2 频繁项集的产生 87
4. 2. 1 先验原理 88
4. 2. 2 Apriori 算法的频繁项集产生 90
4. 3 规则产生 94
4. 3. 1 基于置信度的剪枝 94
4. 3. 2 Apriori 算法中规则的产生 94
4. 4 FP-growth 算法 95
4. 5 多层关联规则和多维关联规则 99
4. 5. 1 多层关联规则 99
4. 5. 2 多维关联规则 102
4. 6 非二元属性的关联规则 103
4. 7 关联规则的评估 104
4. 8 序列模式挖掘算法 106
4. 8. 1 序列模式的概念 106
4. 8. 2 Apriori 类算法———AprioriAll
算法 109
4. 9 小结 114
4. 10 习题 115
第5 章 聚类分析方法 118
5. 1 聚类分析概述 118
5. 1. 1 聚类的定义 118
5. 1. 2 聚类算法的要求 119
5. 1. 3 聚类算法的分类 120
5. 1. 4 相似性的测度 121
5. 2 基于划分的聚类算法 126
5. 2. 1 基于质心的(Centroid-based)
划分方法———基本K-means
聚类算法 126
5. 2. 2 K-means 聚类算法的拓展 128
5. 2. 3 基于中心的(Medoid-based)
划分方法———PAM 算法 130
5. 3 层次聚类算法 133
5. 3. 1 AGNES 算法 136
5. 3. 3 改进算法———BIRCH 算法 137
5. 3. 4 改进算法———CURE 算法 141
5. 4 基于密度的聚类算法 143
5. 5 聚类算法评价 147
5. 6 离群点挖掘 149
5. 6. 1 相关问题概述 149
5. 6. 2 基于距离的方法 150
5. 6. 3 基于相对密度的方法 154
5. 7 小结 158
5. 8 习题 158
第6 章 分类规则挖掘 160
6. 1 分类问题概述 160
6. 2 近邻分类法 162
6. 2. 1 KNN 算法原理 162
6. 2. 2 KNN 算法的特点及改进 165
6. 2. 3 基于应用平台的KNN 算法应用
实例 166
6. 3 决策树分类方法 167
6. 3. 1 决策树概述 167
6. 3. 2 信息论 171
6. 3. 3 ID3 算法 172
6. 3. 4 算法改进: C4. 5 算法 176
6. 4 贝叶斯分类方法 180
6. 4. 1 贝叶斯定理 181
6. 4. 2 朴素贝叶斯分类器 183
6. 4. 3 朴素贝叶斯分类方法的改进 185
6. 5 神经网络算法 188
6. 5. 1 前馈神经网络概述 188
6. 5. 2 学习前馈神经网络 189
6. 5. 3 BP 神经网络模型与学习算法 191
6. 6 回归分析 193
6. 7 小结 196
6. 8 习题 197
第7 章 数据挖掘工具与产品 198
7. 1 评价数据挖掘产品的标准 198
7. 2 数据挖掘工具简介 200
7. 3 数据挖掘的可视化 203
7. 3. 1 数据挖掘可视化的过程与方法 203
7. 3. 2 数据挖掘可视化的分类 204
7. 3. 3 数据挖掘可视化的工具 206
7. 4 Weka 207
7. 4. 1 Weka Explorer 208
7. 4. 2 Weka Experimenter 216
7. 4. 3 KnowledgeFlow 219
7. 5 小结 221
7. 6 习题 221
下篇 实验部分
第8 章 Mahout 入门 224
8. 1 Mahout 安装前的准备 224
8. 1. 1 安装JDK 224
8. 1. 2 安装Hadoop 227
8. 2 Mahout 的安装 237
8. 3 测试安装 238
8. 4 小结 239
第9 章 使用Mahout 实践关联规则
算法 240
9. 1 FP 树关联规则算法 240
9. 1. 1 Mahout 中Parallel Frequent Pattern
Mining 算法的实现原理 240
9. 1. 2 Mahout 的Parallel F
作者介绍:
暂无相关内容,正在全力查找中
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
前言
前言
现在的社会是一个高速发展的社会, 科技发达, 信息畅通, 人们之间的交流越来越密切, 生活也越来越方便, 大数据就是这个高科技时代的产物, 并且将会以更多、更复杂、更多样化的方式持续增长。大数据的复杂化和格式多样化, 决定了应用服务平台中针对大数据的服务场景和类型的多样化, 从而要求应用服务平台必须融合大数据技术来应对, 传统的数据存储和分析技术已无法满足应用的需求。
目前行业中使用广泛的大数据平台是基于Apache 开源社区版本的Hadoop 生态体系,阿里巴巴、腾讯、百度、脸书(Facebook) 等国内外各大互联网公司的系统基本都采用Hadoop生态系统, 来完成数据存储和处理。事实上, 在未来2 ~3 年预计有超过50% 的大数据项目会在Hadoop 框架下运行。
在大数据时代, 大学生应具备一定的大数据处理能力。本书围绕大数据背景下的数据处理和知识发现问题, 从基本概念入手, 由浅入深、循序渐进地介绍了数据处理与知识发现过程中的数据预处理技术、数据仓库技术、数据挖掘的基本方法, 并在后使用广泛的大数据平台———Hadoop 生态系统中的Mahout 对各种挖掘算法进行实际练习, 实战性强, 也符合目前数据处理与挖掘的发展趋势。
目前, 数据处理与知识发现及应用方法逐渐成为各高校信息类和管理类本科专业的必修内容。本书作为立足于本科教学的教材, 具有如下特色:
(1) 在逻辑安排上循序渐进, 由浅入深, 便于读者系统学习。
(2) 内容丰富, 信息量大, 融入了大量本领域的新知识和新方法。
(3) 作为教材, 以小数据集为例详细介绍各种挖掘算法, 使读者更易掌握挖掘算法的基本原理及过程; 使用Mahout 实践各种挖掘算法, 符合大数据的发展趋势。
(4) 图文并茂, 形式生动, 可读性强。
本书的编写得到了武汉民办高校合作联盟、武昌首义学院信息科学与工程学院和机械工业出版社的大力支持和帮助, 在此深表谢意!
由于编者水平有限, 书中难免会出现不足之处, 欢迎读者批评指证。如果您有更多的宝贵意见, 欢迎发邮件至邮箱xuqin@ wsyu. edu. cn。
编 者
网站评分
书籍多样性:3分
书籍信息完全性:5分
网站更新速度:3分
使用便利性:7分
书籍清晰度:9分
书籍格式兼容性:4分
是否包含广告:5分
加载速度:8分
安全性:8分
稳定性:3分
搜索功能:5分
下载便捷性:6分
下载点评
- 无广告(328+)
- 下载速度快(61+)
- 超值(294+)
- 体验还行(451+)
- 速度慢(610+)
- mobi(331+)
- 无漏页(642+)
- azw3(514+)
- 格式多(458+)
- 全格式(635+)
- epub(271+)
- 无缺页(502+)
下载评价
- 网友 居***南:
请问,能在线转换格式吗?
- 网友 习***蓉:
品相完美
- 网友 曹***雯:
为什么许多书都找不到?
- 网友 屠***好:
还行吧。
- 网友 权***波:
收费就是好,还可以多种搜索,实在不行直接留言,24小时没发到你邮箱自动退款的!
- 网友 汪***豪:
太棒了,我想要azw3的都有呀!!!
- 网友 师***怀:
好是好,要是能免费下就好了
- 网友 薛***玉:
就是我想要的!!!
- 网友 冷***洁:
不错,用着很方便
- 网友 寿***芳:
可以在线转化哦
- 网友 车***波:
很好,下载出来的内容没有乱码。
- 网友 石***致:
挺实用的,给个赞!希望越来越好,一直支持。
喜欢"数据处理与知识发现"的人也看了
18秋期末冲刺100分数学三年级上(北师版)全新版 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
华职教育自学考试自考试卷类赠送随身学习手册2014年全国高等教育自学考试创新型试卷系列国民经济统计概论阶梯式突破试卷(单元卷+仿真卷+密押卷+真题卷)课程代码00065 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
入党培训问答 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
彩绘小说馆(第2级)(套装6册) 【英】Richard MacAndrew(理查德·麦克安 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
中公2015国家执业药师考试用书中药学专业知识二内部讲义新大纲版 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
中盘搏杀 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
民间年画 蓝先琳 著 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
朱元璋传 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
人性的优点 卡耐基著 经典青春文学小说成功励志书籍 人生哲理的书职场创业心灵鸡汤 揭示财富秘密的智慧杰作 改变千万人命运的励志经典 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
9787030428448 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 蝙蝠侠:黑暗骑士归来 三十周年纪念版[美]弗兰克·米勒世界图书出版公司【现货实拍 可开发票 下单速发 正版 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 洞庭湖区的龙文化 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 弗洛拉和火烈鸟 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 美国年度最佳科幻小说集.2003 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- ***写给中国儿童的性教育-全6册-启蒙绘本( 货号:755397239) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 房地产一二三级市场法律实务操作与案例精解 李金升 著 中国法制出版社【正版保证】 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 弹性密封胶与胶黏剂 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 鸭婶芭芭:外出购物+探望病人+帽子小船+客人(全4册)日本热销40年经久不衰,国家图书馆少儿馆馆长王志庚倾情推荐 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- C 唐诗宋词鉴赏辞典 唐诗三百首宋词三百首中国古诗词李白苏轼辛弃疾王维 精装书籍 文白对照 崇文书局 乐云黄鸣中国诗词大会9787540331696万卷图书专营店 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 英语全解-高考英语语法13 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
书籍真实打分
故事情节:6分
人物塑造:8分
主题深度:6分
文字风格:9分
语言运用:6分
文笔流畅:5分
思想传递:7分
知识深度:8分
知识广度:5分
实用性:9分
章节划分:9分
结构布局:8分
新颖与独特:4分
情感共鸣:7分
引人入胜:8分
现实相关:7分
沉浸感:8分
事实准确性:4分
文化贡献:9分