【官方说法】网页不收录?都是邀请制惹的祸
2019-04-10 08:55:59来源: 站长学院 阅读 ()
前方高能——本篇文章是攻城狮们根据日常收到的case整理而来,亲自编写,希望站长亲们给个好评哦!
平台攻城狮近日接到了百度内部用户的反馈,说lvshi.baidu.com站点的收录情况比较差,希望协助追查原因。
攻城狮追查的过程如下:
首先通过site语法检索,发现收录量确实比较少,只有11条,而且还发现一部分是死链数据。
然后根据用户反馈的部分url,检测发现这批链接在2016年12月26日当天已经就已经抓取回来了,首次抓取上是没有问题;
紧接着发现这批网页都被百度爬虫判定为空短页面,从网页库中获取当时的抓取页面,检查发现这些页面抓取回来的内容是一样的,都是提示让输入邀请码。
被百度爬虫判断为空短页面,肯定是不能被百度搜索收录的。
有站长可能会问,那等网站全部开放后,是不是就可以收录了呢?对于百度爬虫来说,当对一个网站抓取后发现大面积都是低值的空短页面时,爬虫会认为这个站点的整体价值比较低,那么在后面的抓取流量分布上会降低,导致针对该站点的页面更新会比较慢,进而收录也会比较慢。这里学院君再次强调一下,不要让爬虫给站点画上不优质的标签哦,后果很严重!
那么该如何避免呢?方法其实比较简单,网站在邀请测试阶段使用robots封禁就可以。
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-30
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-29
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-28
- 《百度新闻源生存法则》之官方培训视频:什么是新闻源 2020-03-27
- 《百度新闻源生存法则》之官方培训:影响时效性阿拉丁排序的 2020-03-27
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash