对于百度的404错误页面的清理策略,之前个人一直的看法都是很久不更新,甚至有仁兄的站的部分收录结果还停留在N年前的状态。
百度SEO由于服务商方面的原因导致数据丢失,很庆幸通过Google中国新增的快照功能补回了大部分文章,由于文章的ID全部改变,所以干脆就进行了全面的更改,这次的更改包括了URL、关键词、头部规则。几乎可以算是全面动工了。
随之产生了大量的的404页面,根据检测到的收录曲线来看,Google的收录曲线为20-19-14-21,在索引新页面的同时清除旧的无效页面。曲线较为平滑,存在着新旧结果共存。
百度方面从11.23晚间的时候收录17-9,收录数据为9一直持续到11.30,这期间百度没有对百度SEO进行任何更新。
11.30日的收录数据突然转为0,在12.2的时候收录为1并持续到现在。按照这种数据的话我们推算出百度的新的404更新策略变得更为积极,首先会有一段时间的观察期,判断是否为访问暂时中断所导致的404错误,然后会在某一天清除所有404结果,然后进行重新索引。并且重点是在百度的更新变得更为积极,相对于十月来说。
其实这也可以给我们一些新的思路,搜索结果清零并不一定就是被K了,百度的算法调整至今,已经有很多站的收录结果出现摇摆不定的状况,今天收录清零,说不准明天就出来了,只要你确信你的站没有问题就可以放心地等待结果更新。
百度方面调整涉及到的站点,如果你的站点在最近的几次调整中有被恢复的话,那么可能显示出来的只会是近期的一些结果而并不是全部索引结果,估计百度的算法仍然在继续摇摆中。另外此次的算法调整并非此前某些人说的什么百度数据丢失或者服务器故障之类的原因,稍微有点常识的都知道,百度不会出这么低级的错误,数据才是它的生命线。
\