《Spark快速大数据分析》终于搞到了,源码阅读的…
2020-04-10 16:07:30来源:博客园 阅读 ()
《Spark快速大数据分析》终于搞到了,源码阅读的正确打开方式。
近年来大数据逐渐升温,经常有人问起大数据为何重要。我们处在一个数据爆炸的时代,
大量涌现的智能手机、平板、可穿戴设备及物联网设备每时每刻都在产生新的数据。
一套大数据解决方案通常包含多个重要组件,从存储、计算和网络等硬件层,到数据处理
引擎,再到利用改良的统计和计算算法、数据可视化来获得商业洞见的分析层。这中间,
数据处理引擎起到了十分重要的作用。毫不夸张地说,数据处理引擎之于大数据就像 CPU
之于计算机,或大脑之于人类。
获取资料
内 容 提 要
本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅
捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海
量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。
本书适合大数据时代所有需要进行数据分析的人员阅读。
本书特色
本书结构清晰,章节是按照从前到后依次阅读的顺序组织的。在每一章的开头,我们会说
明本章中的哪些小节对于数据科学家们更重要,而哪些小节则对于工程师们更为有用。话
虽如此,我们还是希望书中的所有内容对两类读者都能有一定的帮助。
前两章将会带你入门,让你在自己的电脑上搭好一个基础的 Spark,并且让你对于用 Spark
能做什么有一个基本的概念。等我们弄明白了 Spark 的目标和 Spark 的安装之后,就会着
重介绍 Spark shell。Spark shell 是开发 Spark 应用原型时非常有用的工具。后续几章则会详
细介绍 Spark API、如何将 Spark 应用运行在集群上,以及 Spark 所提供的更高层的程序库
支持,例如 SQL(数据库支持)和 MLlib(机器学习库)。
目录截图
Spark编程进阶
在集群上运行Spark
Spark Streaming
基于MLlib的机器学习
原文链接:https://www.cnblogs.com/yunxi520/p/12674555.html
如有疑问请与原作者联系
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- 我被炒鱿鱼了 2020-06-06
- 终于拿到了美团offer了,没有辜负了这三个月的努力啊 2020-06-06
- 好兄弟仅用3年,就做到了架构师的位置,真心羡慕!经验分享 2020-06-06
- 短短两个月的时间面试了十几次,我终于成为无情的面试机器了 2020-06-04
- 终于有人把最适合学习算法的书单找出来了,面试必备! 2020-06-03
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash