Hadoop构建数据仓库实践最新章节全文无弹窗在线阅读-QQ阅读男频科幻网

QQ阅读男频轻小说网

男频轻小说网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库，将传统数据仓库建模与SQL开发的简单性与大数据技术相结合，快速、高效地建立可扩展的数据仓库及其应用系统。本书内容包括数据仓库、Hadoop及其生态圈的相关概念，使用Sqoop从关系数据库全量或增量抽取数据，使用HIVE进行数据转换和装载处理，使用Oozie调度作业周期性执行，使用Impala进行快速联机数据分析，使用Hue将数据可视化，以及数据仓库中的渐变维（SCD）、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员，也适合高等院校和培训机构相关专业的师生教学参考。

品牌：清华大学

上架时间：2017-07-01 00:00:00

出版社：清华大学出版社

本书数字版权由清华大学提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

王雪迎

同类热门书

会员

消息设计与开发
数据库
会员

Ethereum Projects for Beginners
数据库
会员

数据结构解析与基础实验教程
数据库
会员

INSTANT Windows Powershell 3.0 Windows management Instrumentation Starter
数据库
会员

INSTANT Android Fragmentation Management How-to
数据库
会员

TextMate How-to
数据库

最新上架

会员
云计算服务保障体系
云计算是一种商业计算模型，它将计算任务分布在大量计算机构成的资源池上，使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同，云计算环境下，信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构，安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型；服务
林果园计算机9.5万字
会员
网络科学与网络大数据结构挖掘
《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块：第一模块是基础理论，包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容，旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块，包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导，而是更为关注网络科学的思维习惯和研究方式，兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员
刘伟计算机0字
会员
一本书讲透首席数据官：CDO知识体系与能力模型详解
这是一本能指导首席数据官（CDO）快速构建知识体系和能力模型的标准指南。本书融合了作者对CDO角色的深刻理解和深厚的工程实践经验，系统而全面地介绍了CDO所需的核心知识体系与能力模型。本书从CDO的基本概念出发，逐步深入探讨了CDO在政策环境、数字化转型、组织数据体系建设与管理、数据价值创造等方面的关键作用。书中不仅详细阐述了CDO应具备的基础数据知识和组织数据管理能力，还通过丰富的案例和实战技巧
王晓华赵瑞计算机17.3万字
会员
大数据导论
本书围绕新工科背景下大数据人才培养需求编写，既涵盖了大数据的基础知识，又介绍了大数据分析的相关工具与案例。全书共9章，介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程；重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用，还介绍了大数据实验环境的详细搭建步骤，方便读者快速理解和体验大数据应用技术；最后介绍了大数据治理中法律政策、行业标准建设的
于俊伟母亚双闫秋玲编著计算机14.5万字
会员
数据产品开发与经营：从数据资源到数据资本
本书全面介绍数据产品开发与经营，全书共13章，分为数据产品基础、数据产品开发、数据产品实践、数据产品经营四篇。第一篇深入分析国家和地方层面的数据资产政策，提出数据资产运营框架，并介绍数据资源的治理和数据产品。第二篇详细阐述数据产品开发三大策略、数据产品设计五步法、数据产品开发方法以及数据产品运营方法。第三篇全面介绍数据产品开发的实践案例，特别从数据要素型企业、数商型企业两个角度说明数据产品开发的实
钱勇项灵刚林建兴于冰冰等计算机33.6万字
会员
云计算与大数据应用
本书是云计算与大数据相关专业的标准化教材。全书以云计算与大数据的应用为核心。以云计算与大数据的基本知识为入手，以实际应用为脉络，用理论与实践相结合的方式介绍云计算与大数据的内容，全书共分七章，首先介绍了云计算与大数据的基本内容，让初学者有一定大致了解。而后介绍了云计算的应用，着重与在金融与制造行业的应用方面进行讲解。最后以大数据的应用收尾。全文应用研究均以实学科前沿科技出发，内容详细丰实，力求为云
莫有印计算机15.1万字
会员
城市计算
本书概述了城市计算的定义、框架和主要研究问题，以典型应用为案例着重介绍大数据中异构数据的融合和协同计算技术，根据城市计算的框架分成四个部分：概念和框架、城市感知和数据采集、城市数据管理、城市数据分析。第一部分（第1章和第2章）给出城市计算的概述。第二部分（第3章）介绍了数据的来源和收集方法。第三部分由第4~6章组成，介绍了空间和时空数据的数据管理。第四部分由第7~10章组成，介绍了从城市大数据中挖
郑宇计算机30.4万字
会员
商业分析思维与实践：用数据分析解决商业问题
本书本书基于业务问题，就如何搭建分析框架，厘清分析思路，按照标准分析步骤对数据进行怡当的预处理，选择合适的分析方法和分析模型，使用恰当的分析工具对数据进行分析，以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解，帮助业务专家做出合适的业务判断，制定准确的业务策略。
傅一行计算机13万字
会员
OLAP引擎底层原理与设计实践
本书分为6篇，共14章。从OLAP核心概念出发，以Presto为例，从整体执行流程到不同SQL的执行原理，力图把OLAP查询的核心流程以一种系统化的方式来给读者讲清楚。第一篇背景知识（第1章和第2章）介绍OLAP的基础知识和Presto相关的背景知识，并给出了后续贯穿全书的SQL代码；第二篇核心原理（第3章和第4章）非常详细地串讲了SQL执行流程，介绍了执行计划的生成和优化；第三篇经典SQL（第5
高英举许一腾计算机19.7万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 idisk.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015