[美] Scott Murray
你手头有一些数据,想做成漂亮的图表放到网站上?好主意,通过浏览器来跨平台实现数据可视化是正确的选择。什么,你还想让图表能够响应用户操作?没问题,交互式图表比静态图片更能吸引人去探究本源。好啦,要生成通过浏览器展示的动态图表,首选目前最热门的Web数据可视化库——D3。 这本书很有意思,而且对读... 详情
豆瓣评分: 7.5分 发布时间: 2019年6月16日 11:30
[美] Megan Squire
数据清洗是数据挖掘与分析过程中不可缺少的一个环节,但因为数据类型极其复杂,传统的清洗脏数据工作单调乏味且异常辛苦。如果能利用正确的工具和方法,就可以让数据清洗工作事半功倍。 本书从文件格式、数据类型、字符编码等基本概念讲起,通过真实的示例,探讨如何提取和清洗关系型数据库、网页文件和PDF文档... 详情
豆瓣评分: 6.5分 发布时间: 2019年6月16日 10:54
[美] Holden Karau,[美] Andy Konwinski,[美] Patrick Wendell,[加] Matei Zaharia
豆瓣评分: 7.9分 发布时间: 2019年6月15日 18:59
[美] 桑迪 · 里扎,[美] 于里 · 莱瑟森,[英] 肖恩 · 欧文,[美] 乔希 · 威尔斯
作为计算框架,Spark速度快,开发简单,能同时兼顾批处理和实时数据分析,因此很快被广大企业级用户所采纳,并随着近年人工智能的崛起而成为分析和挖掘大数据的重要得力工具。 本书由业内知名数据科学家执笔,通过丰富的示例展示了如何结合Spark、统计方法和真实世界数据集来解决数据分析问题,既涉及模... 详情
豆瓣评分: 0.0分 发布时间: 2019年6月15日 18:57
[澳] Robert Layton
本书作为数据挖掘入门读物,介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带你轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用决策树和随机森林算法预测美国职业篮球联赛比赛结果,如何使用亲和性分析方法推荐电影,如何使用朴素贝叶斯算法进行社会媒体挖掘,等等... 详情
豆瓣评分: 7.6分 发布时间: 2019年6月15日 18:44
Jake VanderPlas
本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和... 详情
豆瓣评分: 9.2分 发布时间: 2019年6月15日 18:43