封面
版权信息
前言
第1章 大数据概述
1.1 大数据的产生及其特征
1.2 大数据发展
1.3 大数据思维
1.4 大数据应用
1.5 大数据技术与工具
1.6 本章小结
1.7 习题
第2章 大数据采集与预处理
2.1 概述
2.2 大数据的来源
2.3 大数据的采集方法
2.4 大数据预处理方法
2.5 大数据采集与预处理工具
2.6 本章小结
2.7 习题
第3章 大数据存储与管理技术
3.1 大数据存储与管理技术概述
3.2 分布式文件系统
3.3 NoSQL数据库
3.4 大数据查询系统
3.5 数据仓库
3.6 本章小结
3.7 习题
第4章 大数据处理与分析系统
4.1 概述
4.2 谷歌大数据处理系统
4.3 分布式计算框架Hadoop MapReduce
4.4 快速计算框架Spark
4.5 其他大数据分析系统
4.6 本章小结
4.7 习题
第5章 大数据机器学习
5.1 机器学习简介
5.2 数据
5.3 有监督学习
5.4 无监督学习
5.5 强化学习
5.6 弱监督学习
5.7 机器学习的相关资源与工具
5.8 本章小结
5.9 习题
第6章 数据可视化
6.1 可视化概述
6.2 数据可视化及其分类
6.3 数据可视化工具
6.4 本章小结
6.5 习题
第7章 大数据行业应用案例
7.1 大数据行业应用概述
7.2 政务大数据
7.3 交通大数据
7.4 征信大数据
7.5 画像大数据
7.6 本章小结
7.7 习题
第8章 大数据平台与实验环境
8.1 大数据平台与环境概述
8.2 安装虚拟机
8.3 在虚拟机中安装Linux系统
8.4 为Ubuntu系统配置Java开发环境
8.5 在Ubuntu系统中安装Hadoop
8.6 安装Eclipse和Eclipse-hadoop-plugin
8.7 新建、导入、运行与调试Hadoop工程
8.8 本章小结
8.9 习题
第9章 大数据治理
9.1 大数据治理体系
9.2 大数据法律政策
9.3 大数据行业标准
9.4 大数据治理内容
9.5 大数据伦理风险
9.6 本章小结
9.7 习题
主要参考文献
注释
更新时间:2025-03-28 17:08:04