数据分析学习路线
2019-07-24 09:06:50来源:博客园 阅读 ()
数据分析由三大重要部分组成:
1.数据采集。它是我们的原材料,因为任何分析都是需要数据源;
2.数据挖掘。它可以说是最“高大上”的部分,也是整个商业价值所在。数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能BI
3.数据可视化。它可以说是数据领域中万金油的技能,可以让我们直观的了解到分析数据的结果。
下面总结详解这三大部分的内容:
一 数据采集
采集工具:八爪鱼,自动抓取的神器,它可以帮你抓取 99% 的页面源。
python爬虫:可编写,采集,存储数据,以及自动化采集设计。
二数据挖掘
它可以说是知识型的工程,相当于整个专栏中的“算法”部分。首先要知道他的基本流程,算法,以及底层的数学基础。
基本流程:商业理解,数据理解,数据准备,模型建立,模型评估,上线发布
算法:分类算法,聚类算法,关联分析,连接分析
数学基础:概率论和数据统计,线性代数,图论,最优化方法
三数据可视化
当数据量大的时候很难理解,可视化可以帮我们很好地理解这些数据的结构,以及分析结果的视觉呈现。
数据可视化有两种方法(并不是全部):
1.python第三方库:Matplotlib,Seaborn等
2.第三方工具:如果生成了csv格式文件,想要采用所见即得的方式进行呈现,可以采用微图,DataV,Data GIF Maker等第三方工具。
原文链接:https://www.cnblogs.com/HugJun/p/11090141.html
如有疑问请与原作者联系
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- Python学习日记(十) 生成器和迭代器 2019-08-13
- python学习-53 正则表达式 2019-08-13
- python爬虫学习之爬取超清唯美壁纸 2019-08-13
- python爬虫学习之用Python抢火车票的简单小程序 2019-08-13
- Python学习日记(九) 装饰器函数 2019-08-13
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash