HTTP状态码及代表什么?

2019-03-21    来源:wanghaoran.net

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

细心的同学会发现,在本教程里,我们介绍概念的顺序是按该概念的重要性来的。

目标关键词、长尾关键词、链接锚文本的概念是最重要的,而且是同学们最不容易懂的,我们在本概念篇的最后会回到这几个概念上来。

其他的概念,是为着某一个具体的SEO操作而来。比如:

Google分析,用来分析和统计网站访问情况;

robots.txt,用来屏蔽死链接等。

今天,咱们要来讲一个新的为SEO操作目的而来的经典概念。

HTTP状态码:这是服务器和客户端之间交流信息的语言。

比如:

当客户端向服务器请求一个死链接时,服务器会返回“404”的信息。

“404”就是一个HTTP状态码,这个代码告诉客户端:“你请求的链接,我这边没有”。。

再举个例子,“200”这个HTTP状态码代表的是,“你的请求,已经成功发送”。

如果客户端向服务器发送一个链接,服务器返回“200”。那么就说明,服务器正常返回了客户端需要的信息。

HTTP状态码有什么用?和SEO有什么关系?。

因为网站日志往往会记录下HTTP状态码,所以通过查看网站日志里的HTTP状态码,我们可以清楚地看到网站服务器与客户端之间的信息交换情况。

这个客户端可以是用户浏览器,也可以是搜索引擎或其他爬取工具(如RSS)。

对于SEO来讲,HTTP状态码的最大意义就是,通过它们可以查看搜索引擎在你网站的爬取情况。

比如:

baiduspider爬取的痕迹记录是“404”,就说明,百度蜘蛛刚才访问了一个死链接。

Googlebot爬取记录是“200”,就说明,Google机器人刚才正常抓取了一个页面。

一般在网站日志中,最常见的HTTP状态码就是200和404。

其他常见的HTTP状态码以及其代表的含义有:

成功2×× 成功处理了请求的状态码。

200 服务器已成功处理了请求并提供了请求的网页。

204 服务器成功处理了请求,但没有返回任何内容。

重定向3×× 每次请求中使用重定向不要超过 5 次。

301 请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。 搜索引擎索引中保存新的URL。

302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。

304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器 人,可节省带宽和开销。

客户端错误4×× 表示请求可能出错,妨碍了服务器的处理。

400 服务器不理解请求的语法。

403 服务器拒绝请求。

404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。

410 请求的资源永久删除后,服务器返回此响应。该代码与 404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404 代码。如果资源已永久删除,应当使用 301 指定资源的新位置。

服务器错误5×× 表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。

500 服务器遇到错误,无法完成请求。

503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。

其他疑问:

1、怎么看网站日志?

通过Ftp (FTP 是File Transfer Protocol(文件传输协议)的英文简称,而中文简称为“文传协议”。用于Internet上的控制文件的双向传输。同时,它也是一个应用程序(Application)。用户可以通过它把自己的PC机与世界各地所有运行FTP协议的服务器相连,访问服务器上的大量程序和信息), 在根目录下可以看到一个包含log的文件夹,这就是网站日志。下载、解压,里面的txt文件内容就是日志记录。

但也有一些服务器或虚拟主机没有提供log文件,请与主机商联系,或自己开通服务器的记录日志功能。

2、网站日志中怎么看搜索引擎机器人?

搜索引擎机器人:百度的“代号”是baiduspider、Google是Googlebot、Yahoo是Slurp。

在日志中搜索baiduspider,看到的那行信息就是百度蜘蛛与服务器的沟通信息。

3、看到了200 0 0 代表什么?!

可以先简单记住,看到200就代表搜索引擎已经成功抓取了网页信息。

4、为什么“200”很多,但我的网站还没被收录,或收录很少?

如果和搜索引擎蜘蛛在一起的“200”很多,那收录是没问题的,但得等一次的更新期。除非被特殊处理,下次会展示很多出来。

5、怎么除了200之外的其他状态码很多?

请按以上的代码表对一下,然后分析为什么会出现这个情况。当然,如果只是个别则没事。

6、需要经常看吗?

只要你收录正常了,服务器没什么大问题,那一般没必要经常看。

7、推荐在线的HTTP状态码检测工具:http://www.seobox.org/getheader.htm

搜索引擎用来爬取网页内容的工具我们称之为搜索引擎机器人。

搜索引擎机器人每次来到要抓取的网站,都会先访问这个网站根目录下的一个文件(robots.txt),如果不存在该文件,则搜索引擎机器人默认这个网站允许其全部抓取。

标签: HTTP状态码 网站SEO 网站日志分析工具 

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:浅析新站做SEO的三大要点

下一篇:企业网站SEO要善于找到自己的短板和优势