[美] 桑迪 · 里扎,[美] 于里 · 莱瑟森,[英] 肖恩 · 欧文,[美] 乔希 · 威尔斯
作为计算框架,Spark速度快,开发简单,能同时兼顾批处理和实时数据分析,因此很快被广大企业级用户所采纳,并随着近年人工智能的崛起而成为分析和挖掘大数据的重要得力工具。 本书由业内知名数据科学家执笔,通过丰富的示例展示了如何结合Spark、统计方法和真实世界数据集来解决数据分析问题,既涉及模... 详情
豆瓣评分: 0.0分 发布时间: 2019年6月15日 18:57
Mark Grover,Ted Malaska,Jonathan Seidman,Gwen Shapira
-使用Hadoop进行数据存储和建模的着眼点和思路 -将数据输入、输出系统的最佳方案 -MapReduce、Spark和Hive等数据处理框架介绍 -数据去重、窗口分析等常见Hadoop处理模式应用 -在Hadoop上采用Giraph、GraphX等图形处理工具 -综合使用工作流以及Apach... 详情
豆瓣评分: 7.9分 发布时间: 2019年6月14日 22:23
[美] Benjamin Bengfort,[美] Jenny Kim
通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,第一部分从非常高的层次介... 详情
豆瓣评分: 0.0分 发布时间: 2019年6月14日 22:16
[印] 迪帕延 • 德夫
本书主要目标是处理很多深度学习应用的热点问题并向读者披露解决方案的细节。主要内容分为7章:第1章介绍深度学习基础知识,第2章介绍大规模数据的分布式深度学习,第3章介绍卷积神经网络,第4章介绍循环神经网络,第5章介绍受限玻尔兹曼机,第6章介绍自动编码器,第7章介绍如何用Hadoop玩转深度学习。 详情
豆瓣评分: 0.0分 发布时间: 2019年6月14日 22:15
[英] Adrian Mouat
Docker容器轻量和可移植的特性尤其适用于动态和分布式的环境,它的兴起给软件开发流程带来了一场革命。本书对Docker进行了全面讲解,包括开发、生产以至维护的整个软件生命周期,并对其中可能出现的一些问题进行了探讨,如软件版本差异、开发环境与生产环境的差异、系统安全问题,等等。 详情
豆瓣评分: 8.8分 发布时间: 2019年6月14日 21:53
[美] Sébastien Goasguen
本书结构明晰,示例丰富详实,是全面实用的Docker入门教程。作者全面介绍了Docker相关各种工具和平台,涵盖网络、镜像管理、配置以及包括Kubernetes和Mesos在内的编排和调度生态系统,对私有云和公有云上部署的应用程序都给出了丰富实用的解决方案和示例。本书适合运维人员、系统管理员和... 详情
豆瓣评分: 7.6分 发布时间: 2019年6月14日 21:52
董西成
《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》内容简介:“Hadoop技术内幕”共两册,分别从源代码的角度对“Common+HDFS”和“MapReduce的架构设计和实现原理”进行了极为详细的分析。《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》... 详情
豆瓣评分: 8.4分 发布时间: 2019年4月30日 10:28
Martin Kleppmann
Data is at the center of many challenges in system design today. Difficult issues need to be figured out, such as scalability, consistency, reliabi... 详情
豆瓣评分: 9.7分 发布时间: 2019年3月27日 20:02