HTTP状态码及代表什么?
2019-03-21 来源:wanghaoran.net
细心的同学会发现,在本教程里,我们介绍概念的顺序是按该概念的重要性来的。
目标关键词、长尾关键词、链接锚文本的概念是最重要的,而且是同学们最不容易懂的,我们在本概念篇的最后会回到这几个概念上来。
其他的概念,是为着某一个具体的SEO操作而来。比如:
Google分析,用来分析和统计网站访问情况;
robots.txt,用来屏蔽死链接等。
今天,咱们要来讲一个新的为SEO操作目的而来的经典概念。
HTTP状态码:这是服务器和客户端之间交流信息的语言。
比如:
当客户端向服务器请求一个死链接时,服务器会返回“404”的信息。
“404”就是一个HTTP状态码,这个代码告诉客户端:“你请求的链接,我这边没有”。。
再举个例子,“200”这个HTTP状态码代表的是,“你的请求,已经成功发送”。
如果客户端向服务器发送一个链接,服务器返回“200”。那么就说明,服务器正常返回了客户端需要的信息。
HTTP状态码有什么用?和SEO有什么关系?。
因为网站日志往往会记录下HTTP状态码,所以通过查看网站日志里的HTTP状态码,我们可以清楚地看到网站服务器与客户端之间的信息交换情况。
这个客户端可以是用户浏览器,也可以是搜索引擎或其他爬取工具(如RSS)。
对于SEO来讲,HTTP状态码的最大意义就是,通过它们可以查看搜索引擎在你网站的爬取情况。
比如:
baiduspider爬取的痕迹记录是“404”,就说明,百度蜘蛛刚才访问了一个死链接。
Googlebot爬取记录是“200”,就说明,Google机器人刚才正常抓取了一个页面。
一般在网站日志中,最常见的HTTP状态码就是200和404。
其他常见的HTTP状态码以及其代表的含义有:
成功2×× 成功处理了请求的状态码。
200 服务器已成功处理了请求并提供了请求的网页。
204 服务器成功处理了请求,但没有返回任何内容。
重定向3×× 每次请求中使用重定向不要超过 5 次。
301 请求的网页已永久移动到新位置。当URLs发生变化时,使用301代码。 搜索引擎索引中保存新的URL。
302 请求的网页临时移动到新位置。搜索引擎索引中保存原来的URL。
304 如果网页自请求者上次请求后没有更新,则用304代码告诉搜索引擎机器 人,可节省带宽和开销。
客户端错误4×× 表示请求可能出错,妨碍了服务器的处理。
400 服务器不理解请求的语法。
403 服务器拒绝请求。
404 服务器找不到请求的网页。服务器上不存在的网页经常会返回此代码。
410 请求的资源永久删除后,服务器返回此响应。该代码与 404(未找到)代码相似,但在资源以前存在而现在不存在的情况下,有时用来替代404 代码。如果资源已永久删除,应当使用 301 指定资源的新位置。
服务器错误5×× 表示服务器在处理请求时发生内部错误。这些错误可能是服务器本身的错误,而不是请求出错。
500 服务器遇到错误,无法完成请求。
503 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。
其他疑问:
1、怎么看网站日志?
通过Ftp (FTP 是File Transfer Protocol(文件传输协议)的英文简称,而中文简称为“文传协议”。用于Internet上的控制文件的双向传输。同时,它也是一个应用程序(Application)。用户可以通过它把自己的PC机与世界各地所有运行FTP协议的服务器相连,访问服务器上的大量程序和信息), 在根目录下可以看到一个包含log的文件夹,这就是网站日志。下载、解压,里面的txt文件内容就是日志记录。
但也有一些服务器或虚拟主机没有提供log文件,请与主机商联系,或自己开通服务器的记录日志功能。
2、网站日志中怎么看搜索引擎机器人?
搜索引擎机器人:百度的“代号”是baiduspider、Google是Googlebot、Yahoo是Slurp。
在日志中搜索baiduspider,看到的那行信息就是百度蜘蛛与服务器的沟通信息。
3、看到了200 0 0 代表什么?!
可以先简单记住,看到200就代表搜索引擎已经成功抓取了网页信息。
4、为什么“200”很多,但我的网站还没被收录,或收录很少?
如果和搜索引擎蜘蛛在一起的“200”很多,那收录是没问题的,但得等一次的更新期。除非被特殊处理,下次会展示很多出来。
5、怎么除了200之外的其他状态码很多?
请按以上的代码表对一下,然后分析为什么会出现这个情况。当然,如果只是个别则没事。
6、需要经常看吗?
只要你收录正常了,服务器没什么大问题,那一般没必要经常看。
7、推荐在线的HTTP状态码检测工具:http://www.seobox.org/getheader.htm
搜索引擎用来爬取网页内容的工具我们称之为搜索引擎机器人。
搜索引擎机器人每次来到要抓取的网站,都会先访问这个网站根目录下的一个文件(robots.txt),如果不存在该文件,则搜索引擎机器人默认这个网站允许其全部抓取。
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。
上一篇:浅析新站做SEO的三大要点