通过数据可视化发现了“油管”的秘密

2018-11-16    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

中国有优酷,美国有“油管”(AKA Youtube)。这个视频成为人们日常网络娱乐消遣的时代,大家一定都很关心这些视频网站都暗藏了哪些秘密?Shiyu Li通过数据分析与数据可视化从不同内容的占比、关键词等方面洞察了整个Youtube,快来看看他是怎么做的吧~

随着越来越多的人使用YouTube观看和上传视频,它已经变成最流行的网站之一。YouTube上的“热门视频”(trend videos)板块显示了视频的流行趋势,以及哪些是热门视频。作为一个数据分析师,我对这些趋势很好奇,并且更重要的是,我希望通过分析得到如何提高视频流行度的一些建议。

为了回答这个问题,我设计了一个shiny应用,来帮助我更好地理解这些数据。

 

 

(图片说明:整个可视化项目的全景图 来源:Shinyapp)

这是与这个应用相关的一些网址:

数据来源: https://www.kaggle.com/datasnaek/youtube-new

Shinyapp: https://vickywinter1991.shinyapps.io/Shiny_youtube/

数据: https://github.com/vickywinter/Youtube_shiny

在这个应用里我设计了三个标签:

♦  按类别划分的市场份额
♦  不同时间的热门视频
♦  关键词和频道排名

按类别划分的市场份额

这个标签可以帮助市场营销人员看到不同热门视频的市场份额。YouTube把视频分为几个不同的类别,包括动画,电影,音乐等。在我的shiny应用中,用一个饼图展示了特定地点和时间下,不同类别的市场份额。

 

 

从上面的饼图中,我们可以看到“娱乐”类别的份额最大。这可以理解,因为大多数人上YouTube是为了找点乐子。而且2017年到2018年,娱乐类别的份额还不断增长。这是个很强烈的信号,证明了YouTube到底是哪里吸引着用户。

另外,这些数据也显示了点赞、点灭和评论数据。我制作了一个柱状图来做比较。你可以比较任意一组数据甚至全部数据。因为数据的量级不同,所以这些数据都是按照百分比展示。

 

 

一个有趣的发现是,尽管娱乐类的视频占了热门视频的多数,但是音乐类视频的点赞数最多。这意味着,不是所有人都喜欢自己看的娱乐类视频,但大多数访客喜欢音乐。另一个可能影响着点赞数的因素,是“名人效应”,因为多数的名人都是音乐人。如果YouTube想吸引更多的访客并让他们留下积极的回应,那么增加些音乐视频可能是个好策略。

热门视频随时间的变化

视频的流行趋势如何随时间改变也很重要,这成为我制作的第二个标签。由于数据的数量发生了很大的变化,我只选择了2017年11月到2018年6月的数据进行分析

 

 

上图是加拿大地区的游戏类视频变化情况,看起来有些季节性的特征。2017年底有一个高峰,2018年5月又开始增长。一个可能的原因是,人们在假期对游戏类视频的兴趣会更强一些。(圣诞节和夏天),尤其是对于放假的小孩来说。在这些时间段在游戏类视频中增加广告投入可能会带来更好地效果。

另一个以时间为维度的图,是关于一周不同时间的热门视频变化情况。

 

 

上面的柱状图显示了音乐类视频的总观看量在一周不同时间是如何改变的。我们可以看到随着时间接近周五,看音乐类视频的人越来越多。但之后在周末却急剧下降。更多的数据可以提供更多的细节,以更好发掘这背后的原因。

关键词和频道排名

我做的最后一个标签是一个关键词的词云和频道观看数排名。如果你想花钱针对关键词进行投放,那么关键词的热度很重要。而且,YouTube还会给视频广告观看数多的视频博主们金钱奖励。所以我相信对于YouTube来说,知道哪个频道的观看数据更多也有帮助。另外,知道视频的点赞数据也有助于判断它是否适合投放广告。YouTube能借此找到办法提升它的投资回报率。

 

 

上图展示了2018年上半年,全球汽车类视频的关键词词云和频道排名。我们可以看到宝马、奥迪和法拉利是汽车类视频用到最多的标签。

结论

YouTube的热门视频数据提供了很多用户行为信息,也显示出热门视频的特点和用户观看习惯。Shiny app 对此进行了直接的可视化,用户还可以进行交互使用。它还能帮助YouTube的决策者更好地理解用户行为习惯并制定策略。

(以上内容编译自纽约数据科学院博客Stories from YouTube Trend Video,仅代表作者观点)

Shiyu Li,纽约数据科学院博客文章作者。

标签: 排名 数据分析 网络

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:工信部印发《新一代人工智能产业创新重点任务揭榜工作方案》

下一篇:三大方法保护Hadoop集群免遭攻击!