数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。 作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。 通过阅读本书,你可以: 学到一堂Python速成课; 学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的; 掌握如何收集、探索、清理、转换和操作数据; 深入理解机器学习的基础; 运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型; 探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。