《利用python进行数据分析 第二版》——第一章…
2018-11-29 09:47:26来源:博客园 阅读 ()
第一章 准备工作
本书的数据主要指的是结构化数据(structured data),代指了所有通用格式的数据。 也可以将数据集的特征提取为某种结构化形式。例如一组新闻文章可以被处理为一张词频表,而这张词频表可以用于情感分析。
NumPy是Python科学计算的基础包,除了为Python提供快速的数组处理能力,Numpy在数据分析方面还有另一个主要作用,即作为在算法之间传递数据的容器。Python之所以能在科学计算上独领风骚很大程度上就是因为这个库。它还影响了另一个很有名的深度学习库, PyTorch
pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。
matplotlib是最流行的用于绘制数据图表的Python库,非常适合创建出版物上用的图表,和IPython结合得很好
IPython是Python科学计算标准工具集的组成部分,它为交互式和探索式计算提供了一个强健而高效的环境
SciPy是一组专门解决科学计算中各种标准问题域的包的集合,包括以下包:
- sicpy.integrate:数值积分例程和微分方程求解器
- scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能
- scipy.optimize:函数优化器(最小化器)及根查找算法
- scipy.signal:信号处理工具
- scipy.sparse:稀疏矩阵和稀疏线性系统求解器
- scipy.special:SPECfUN(这是一个实现了许多常用数学函数的Fortran库)
- scipy.stats:标准连续和离散概率分布、各种统计检验方法,以及更好的描述统计法
- scipy.weave:利用内联C++代码加速数组计算的工具
NumPy和SciPy的有机结合完全可以代替MATLAB的计算功能(包括插件工具箱)
scikit-learn项目(http://scikit-learn.org)是目前Python编程者首选的机器学习工具包,其包含了以下子模块
- 分类:SVM、最邻近、随机森林、逻辑回归等
- 回归:Lasso、岭回归等
- 聚类:k-means、谱聚类
- 降维:PCA、特征选择、矩阵分析等
- 模型选择:网格搜索、交叉验证、指标矩阵
- 预处理:特征提取、正态化
statsmodels(http://statsmodels.org)是一个统计分析包,其包含了经典的(高频词汇)统计学、经济学算法。statsmodels更专注于统计推理,提供不确定性评价和p值参数。相反,scikit-learn更专注于预测
Python社区已经广泛接受了一些常用模块的命名惯例
1 import numpy as np
2 import pandas as pd 3 import matplotlib.pyplot as plt
安装及更新Python包
conda install package_name #安装包
conda update package_name #更新包
每年都有很多Python编程者会议,可以去参加。很多会议为没有能力负担入场费或旅行费用的人士提供经济支持。
- PyCon和EurPython:北美和欧洲两大主要Python会议
- SciPy和EuroSciPy:北美和欧洲面向科学计算的会议
- PyData:全世界范围内一系列区域性的会议,主题为数据科学和数据分析用例
- 国际和地区性的PyCon会议(参见http://pycon.org上的列表)
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
上一篇:搭建自动化测试环境
- 第一章 计算机基础 2019-07-24
- python大道——博客目录 2019-07-24
- python 知识回顾 2019-07-24
- Pyhon从入门到致命 2019-05-22
- 第一章 简单测试代码 2019-05-16
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash