80本值得一读的最佳数据科学书籍(一)

2019-12-23    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用


数据科学是近几年最受欢迎的概念。我相信很多人都在寻找进入该行业的入口,最近刚读了一篇文章,其中列出了一些对大家可能有帮助的数据科学书籍。因此,我在本文中进行了总结,同时还对书籍进行了简要介绍,以便可以选择要阅读的书籍。部分可以在网上找到一些数据科学书籍,文中给出了链接。但其中大多数可能需要在亚马逊上才能找到。

目录

第一部分:数据科学家的核心技能

♦  Data Science
♦  Math
♦  Probability and Statistics
♦  Machine Learning
♦  Data Mining
♦  SQL
♦  R
♦  Python
♦  Data Scientist Interview
♦  Algorithm
♦  Handbook
♦  Web Scraping and Data Wrangling
♦  Data Visualization and Storytelling
♦  A/B Testing

第二部分:数据科学高级技能

♦  Neural Network and Deep Learning
♦  Information Theory
♦  Causal Inference
♦  Sampling
♦  Convex
♦  Growth Analytics
♦  Text Mining and Natural Language Processing
♦  Anomaly Detection
♦  Recommender Systems
♦  Social Network Analysis
♦  Time Series Analysis and Forecasting
♦  Reinforcement Learning and Artificial Intelligence

第三部分:休闲阅读

第一部分:数据科学家的核心技能

数据科学 Data Science

1. The Data Science Handbook:25位出色的数据科学家的建议和见解

 

 

该手册中有25位业内专家给出了一些建议,对初学者非常有帮助。

2.Data Science for Business:需要了解的有关数据挖掘和数据分析思维的知识

 

 

商业数据科学由著名的数据科学专家Foster Provost和Tom Fawcett撰写,介绍了数据科学的基本原理,并引导您完成从收集的数据中提取有用的知识和业务价值所必需的“数据分析思维”。本指南还可以帮助您了解当今使用的许多数据挖掘技术。

3.Doing Data Science:Straight Talk from the Frontline

 

 

在许多这些长达一章的讲座中,来自Google,Microsoft和eBay等公司的数据科学家通过展示案例研究和它们使用的代码来共享新的算法,方法和模型。如果您熟悉线性代数,概率和统计,并且具有编程经验,那么这本书是数据科学的理想入门。

数学Math

4.多元微积分Multivariate Calculus

 

https://ocw.mit.edu/courses/mathematics/18-02sc-multivariable-calculus-fall-2010/index.htm

 

5.线性代数 Linear Algebra

 

 

https://ocw.mit.edu/courses/mathematics/18-06sc-linear-algebra-fall-2011/index.htm

概率统计Probability and Statistics

6. Introduction to Probability, Statistics, and Random Processes

 

 

这本书向学生介绍了概率,统计和随机过程。工程,各种科学,金融和其他相关领域的学生和实践者都可以使用它。它为这些主题提供了清晰直观的方法,同时保持了数学准确性。您还可以在线查找课程和视频。

https://www.probabilitycourse.com

7. OpenIntro Statistics

 

 

OpenIntro项目成立于2009年,旨在通过生产可免费使用和易于修改的出色书籍和教学工具来提高教育质量和可用性。而其首创成果是OpenIntro Statistics。相应的课程和视频可以在以下网址找到:https : //www.openintro.org

8.Statistical Inference

 

 

这是许多大学应届毕业生的教科书。

讨论理论统计和理论发展的实际应用。包括大量涵盖理论和应用的练习。

9.Applied Linear Statistical Models

 

 

“Applied Linear Statistical Models”是长期建立的领先权威文献,也是统计建模的参考。第五版在不牺牲概念或严格性的前提下,在整个过程中增加了对计算和图形分析的使用。通常,5e在示例和练习中使用较大的数据集,并且可以在软件内自动进行方法而又不会失去理解的情况下,这样做就可以了。

10.An Introduction to Generalized Linear Models

 

 

内容归纳为标题。广义线性模型简介。

11.All of Statistics: 统计推断简明课程

 

 

本书适用于希望快速学习概率和统计信息的人。它适合计算机科学,数学,统计学和相关学科的研究生或高等本科生。

12.Computer Age Statistical Inference: 算法,证据和数据科学

 

 

Efron和Hastie通过本书向我们全面介绍了大数据时代的统计数据。

13.Statistics in a Nutshell: 桌面快速参考

 

 

标题中的快速参考

14.Bayes' Rule: 贝叶斯分析教程简介

 

 

15. Think Bayes:Python中的贝叶斯统计

 

 

简要介绍如何使用Python进行贝叶斯统计

http://www.greenteapress.com/thinkbayes/thinkbayes.pdf

16.黑客的贝叶斯方法

 

 

有关如何使用Python进行贝叶斯统计的高级教程

https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers

17.Practical Statistics for Data Scientists: 50个基本概念

 

 

该实用指南说明了如何将各种统计方法应用于数据科学,告诉您如何避免它们的误用,并为您提供关于重要和不重要的建议。

您可以在这里找到它:https : //github.com/andrewgbruce/statistics-for-data-scientists

机器学习Machine Learning

18.An Introduction to Statistical Learning:R中的应用

 

 

毫无疑问,这是一本好书,该领域的每个人都应该听说过。

http://www-bcf.usc.edu/~gareth/ISL/

https://lagunita.stanford.edu/courses/HumanitiesSciences/StatLearning/Winter2016/about

19.Applied Predictive Modeling

 

 

应用预测建模涵盖了整个预测建模过程。面试或工作前必读。

20. Python机器学习

 

 

Python Machine Learning Second Edition现在包括流行的TensorFlow深度学习库。scikit-learn代码也已完全更新,以包括对该通用机器学习库的最新改进和添加。

21.预测数据分析的机器学习基础:算法,可行的示例和案例研究

 

 

全面介绍了预测数据分析中使用的最重要的机器学习方法,涵盖了理论概念和实际应用。

22.Real-World Machine Learning 现实世界的机器学习

 

 

本书告诉您如何使用机器学习来解决实际问题。强烈建议所有数据科学家在实习或工作之前阅读它

23.Learning From Data

 

 

解释了许多书中没有提到的许多机器学习理论,例如VC维。

https://work.caltech.edu/telecourse.html

24.The Elements of Statistical Learning: 数据挖掘,推理和预测,第二版

 

 

本书在一个通用的概念框架中描述了各个领域的重要思想,例如医学,生物学,金融和市场营销。很棒的ESL,我认为它很适合翻阅和摘录。

25.Pattern Recognition and Machine Learning

 

本书介绍了近似推理算法,可以在无法给出精确答案的情况下提供快速近似答案。当没有其他书籍将图形模型应用于机器学习时,它使用图形模型来描述概率分布。

 

数据挖掘Data Mining

26.数据挖掘原理 Principles of Data Mining

 

 

数据挖掘的基本介绍,讨论了很多关联规则。

27.数据挖掘概论Introduction to Data Mining

 

 

数据挖掘概论介绍了那些初次学习数据挖掘的人的基本概念和算法。

28. Data Mining Techniques: 用于营销,销售和客户关系管理

 

 

通过实际示例介绍如何使用数据挖掘从客户那里赚钱。

SQL

29. SQL Cookbook:数据库开发人员的查询解决方案和技术

 

 

本菜谱提到了SQL查询中的许多陷阱,并给出了每个流行数据库的查询代码。

R

30.R in Action

 

 

本书从介绍R语言(包括开发环境)开始。着重于实际解决方案,该书还提供了实际统计方面的速成课程,并介绍了使用R的功能处理混乱和不完整数据的优雅方法。

31. R for Data Science

 

 

32. R Packages

 

 

33. Advanced R

 

 

由Hadley Wickham教授撰写。

R for Data Science与Garrett Grolemund一起,介绍了使用R进行数据科学的关键工具。R软件包使用捆绑,文档化和测试代码的软件包,教导了R的良好软件工程实践。

高级R帮助您将R掌握为编程语言,并教会您如何使R打勾。

Python

34.Think Python

 

本指南逐步指导使用该语言,从基本的编程概念开始,然后再进行功能,递归,数据结构和面向对象的设计。适合初学者

35.Fluent Python

 

 

作者Luciano Ramalho带领您学习Python的核心语言功能和库,并向您展示如何使代码同时更短,更快和更易读。

36. Python for Probability, Statistics, and Machine Learning

 

 

本书涵盖了在这些领域中使用Python模块说明的将概率,统计数据和机器学习联系起来的关键思想。

37. Python数据科学手册 Python Data Science Handbook

 

 

一本非常全面的手册介绍了如何使用Python解决数据科学问题。

https://github.com/jakevdp/PythonDataScienceHandbook

数据科学家访谈Data Scientist Interview

38.Data Science Interviews Exposed

 

 

数据科学面试提供数据科学的职业建议和REAL面试问题,以帮助您获得六位数的薪水工作!

39.Cracking the PM Interview: 如何找到产品经理在技术领域的工作

 

 

在美国,许多数据科学家都与产品密切相关,甚至其中一些人被聘为产品经理,因此这本书的PM访谈对数据科学家具有参考价值。

算法Algorithm

40. Grokking Algorithms:面向程序员和其他好奇者的插图指南

 

 

《 Grokking算法》是一本完整而友好的指南,它教您如何将常见算法应用于程序员每天面对的实际问题。

41.使用Python解决算法和数据结构问题 Problem Solving with Algorithms and Data Structures Using Python

 

 

算法和数据结构的研究对于理解计算机科学的意义至关重要。这些就是本书的全部内容。

电子版:http : //interactivepython.org/runestone/static/pythonds/index.html

42.Algorithms in a Nutshell:实用指南

 

 

快速查看的算法指南。

Handbook

43.数据科学手册 The Data Science Handbook

 

 

数据科学的全面概述,涵盖了掌握该学科所需的分析,编程和业务技能

Web Scraping and Data Wrangling

44. Web Scraping with Python: 从现代Web收集数据

 

 

通过本实用指南,您将学习如何使用Python脚本和Web API一次收集和处理数千个甚至数百万个Web页面中的数据。实际上,仅使用 Octoparse 即可满足您的Web抓取需求。

45. Data Wrangling with Python: 简化生活的提示??和工具

 

 

本书教您如何清除凌乱的原始数据。将其整理成您想要的方式。

46. Regular Expressions Cookbook

 

 

尽管正则表达式很烦人,但您必须面对它。您可以使用本书来检查所需的正则表达式。

数据可视化和故事Data Visualization and Storytelling

47.Communicating Data with Tableau: 设计,开发和交付数据可视化

 

 

本实用指南向您展示如何使用Tableau Software将原始数据转换为引人入胜的数据可视化效果,以提供洞察力或允许查看者自己浏览数据。

48. Interactive Data Visualization for the Web: D3设计简介

 

 

此完全更新和扩展的第二版将带您了解D3的基本概念和方法,D3是最强大的JavaScript库,用于在Web浏览器中直观地表达数据。

49.使用Python和JavaScript进行数据可视化:抓取,清理,浏览和转换数据

 

 

在本动手指南中,作者Kyran Dale教您如何使用一流的Python和JavaScript库(包括Scrapy,Matplotlib,Pandas,Flask和D3)构建基本的dataviz工具链,以构建引人入胜的基于浏览器的可视化。

50.Storytelling with Data: 业务专业人员的数据可视化指南

 

 

本书演示了如何超越常规工具来获取数据的根源,以及如何使用数据来创建一个引人入胜,内容丰富,引人入胜的故事。

A / B测试

51. A / B Testing:将点击转化为客户的最强大方法

 

 

52.Designing with Data: 通过A / B测试改善用户体验

 

 

第二部分:数据科学高级技能

第三部分:休闲阅读

请在关注更新

by Paul Black 来源:bigdatanews

原文:https://www.bigdatanews.datasciencecentral.com/profiles/blogs/80-best-data-science-books-that-are-worthy-reading

标签: 数据 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:五个给机器学习和数据科学入门者的学习建议

下一篇:一看就懂的10个数据可视化技巧