掉进数据黑洞的新访比和网站平均数
2019-03-22 04:17:55来源: 鱼励的网站分析笔记 阅读 ()
今天打开ga极慢,浇花倒水冲咖啡诸多动作下来,最后端坐在桌前时,报告还在加载中。等待时顺便瞄了一眼控制面板上大大的几个数值,看到%New Visits这个数值时,怔了一下,再一定睛细看,56%!什么时候网站新访问次数百分比达到这个程度了?
我之所以很惊讶,是因为这是一个99%依靠竞价的网站。对于一个竞价为主的网站,这个比值玄乎的厉害,单看这个数据就等于告诉老板说,你竞价花的钱,将近有一半都打了水漂了。为什么呢?一来广告投放没有明显减少,二来UV没有明显增加。反而来的将近有一半是回访客,你说要命不要命?
根据Brain的经验,一般做推广营销的网站,新访问次数百分比绝不能低于20%-30%,因为搜索引擎前三位是如此显眼,很容易成为回访客的便捷入口,不管你是不是为之付费!花钱买来回访客,老板听了肯定会大摇其头,竞价同事听了肯定也会抓狂不已。下一步肯定需要竞价策略的调整。
能这么报告吗? 且慢!
直觉告诉我,也许是这个数据本身出了问题。这可是一个平均值数据!所以在相信这个数据之前,最好验证一下这个数据的可信度。打开“访问者”报告,查看“新访者与回访者”比值。仍然是惯常见到的比值,80%,这就奇了怪了,从56%到80%,新访问次数百分比和网站平均数的差别怎么会有这么大呢,莫非ga也沾染了统计局的毛病?
显然这是一个异常情况,或者这就是一个我们未知的情况,发扬下福尔摩斯的精神,我们来一探究竟吧。新访比和平均数究竟差别为什么这么大?
1.是否和日期范围有关
首先需要确定日期范围。看看两个指标所选择的日期范围是不是一致。尤其是网站平均数默认的时间范围。目前坊间有两种说法,一种是默认为一月前,一种是默认为当前时间段。我觉得“当前时间段”这种说法比较靠谱。
2.是否有过滤器的干扰
如果之前设置了过滤器,排除了某一部分的流量,那么和整站比起来,过滤前的数据和过滤后的数据是不一样的。这点往往容易忽略。
3.是否选择了高级细分群体
高级细分群体影响百分比的原理和过滤器的一样,不过这个更容易发现一点。毕竟就在日期范围上方。
4.是否用了页脚的内联过滤器
这个不常用,不过搜索特定来源,也有可能产生数据差异。姑且算一个原因。
5.是否采用自定义报告
自定义报告的指标,经过过滤后,会和普通报告有细微的差异。新版的ga自定义报告直接加入了过滤器,不排除这个因素。
根据以上5点初步查看的结果如下:
令人大跌眼镜的是,即便我调出了完全纯净的,纯净的比山泉水还纯净的源数据,新访问次数百分比和网站平均值所显示的差别仍然很大。我开始怀疑自己是不是对这个数据理解有误,寻思着仔细琢磨一下新访客百分比的定义才好。
官方定义实在是简单的不能再简单:“以前从未访问过您网站的用户所占的访问次数百分比。”窃以为这样的定义,一直盯着看绝对会看傻。好在理解数据指标方面,蓝鲸的ga常用指标及解读给我们提供了一个很好的阅读范本,此处引用一下。
解读数据的几种方法:
1 、数据的含义和产生原因
2、和历史数据对比
3 、把数据带入到趋势中
4 、这是一个汇总数据吗?
5 、这是一个平均数据吗?
从1到5,让我们逐项来看:
一。新访比数据的含义和产生原因:
指标的定义
新访问次数百分比:以前从未访问过您网站的用户所占的访问次数百分比。
指标的真实含义
顾名思义这一项是新的visit占全部visit的百分比例。新的visit应该是从ip,cookies等n多数据共同验证的。
指标的计算方法
%New Visits = New Visits / Visits
可能对指标产生影响的因素
“新”的定义:是GA cookie第一次新建到user的brower的次数。也就是说,是记录在cookie里的utma中,时间是2年;定义中的细节是visits,而不是visitor。
二 、新访比和历史数据对比
依照定义,如果数据波动不大,那么同一时间段的网站平均数应该是和新访问次数百分比是一样的。
在日期中比较本月和上月的数据时,本周与上周趋势时差别其实并不大,总体在80%左右。
三 、查看新访比的趋势
在图表左上方的图表模式中,选择指标为“新访问次数百分比”并与网站平均数进行比较。可以看到基本是一条平滑的直线,和网站平均数相重合。没有高点和低点。这显然与我们之前看到的数据不符。
四、新访比——这是一个平均数据吗?是一个汇总数据吗?
新访比是一个汇总数据。分析汇总数据的前提条件是网站上所有的访问者都是完全相同的。但这明显是不可能的。同样的,新访比是平均数据,不同的流量来源访客有不同的新访问次数百分比。
解决了新访比的指标的困惑,我们再来看看网站平均数。
网站平均数的定义是什么呢?
我没有找到确切的新访问次数百分比的网站平均数定义。nigel告诉我,这个应该是上面选定的日期和这个时间段的平均值。类似于avgTimeOnPage,avgTimeOnSite之类,我感觉他的理解应该是对的。
网站平均数旁绿色(或红色)百分比的意义是什么?
网站平均数旁绿色百分比可以看成当前时段的值和平均值对比,计算出的值。
当日期区间改变为年,月,周,日时,括号中百分比也随之变化。向好的方向标记为绿色,向不好的方向标记为红色。比如访客上升的越快,绿色的比值就越多,但如果跳出率上升,则表示访客对网站兴趣不大,是一个不大好的方向,会显示为红色。
****趋势百分比的具体计算方法不详,如果你知道拜托留言告诉我。***
一路对数据的解读下来,其实我们已经从历史数据,趋势等好几个地方看出了疑点,那就是,网站平均数这个值是不可信的,有可能掉进了“数据黑洞”。
让我确定这个“数据黑洞”的存在是一个不经意的发现:
在同一个网站的6个副本配置文件都出错的情况下,独独有一个副本是显示和数据趋势相符的,基本“正常”的数据,这个副本在设置方面和其他副本没有任何差别,唯一的差别就是,它启用的是太平洋时间GMT-7时区的,而其他的是北京时间GMT+8时区。
时区上的差别如果能导致平均数总体这样大的差异,那真是黑色幽默了。所以,我终于可以确认是新访比的数据掉进“数据黑洞”了。长出一口气~错误数据害死人啊。
文章来源:yuli.in
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- 运营都会写分析报告了!数据分析该怎么办? 2021-05-07
- 亚马逊“最后一公里”:从数据中寻找创新 2020-03-30
- 亚马逊“最后一公里”:从数据中寻找创新 2020-03-30
- 亚马逊“最后一公里”:从数据中寻找创新 2020-03-29
- 7个Python特殊技巧,助力你的数据分析工作之路 2019-10-30
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash