模仿Googlebot 机器人查来看你网页的代码
2019-03-11 10:07:26来源: Semwatch 阅读 ()
Google 网站管理员工具刚刚发布了一个 Labs 功能,其中有个功能叫做 Fetch as Googlebot ,你可以在这里模仿 Googlebot,查看你自己的网页代码。不过这个功能是必须通过管理员验证的网站才能查看,没有网站管理权限就没机会了。
而在这个 Labs 功能下面还有一个查看恶意软件的细节功能,自动侦测。
Fetch as Googlebot
在这个功能下,你可以查看任何你自己站点页面代码,通过 Google 机器人的视角,好好的审视自己的站点。操作过程很简单,只要点击 Labs 打开功能,点击 Fetch 按钮查看,等待 Google 机器人的处理,几秒钟后,再刷新一下就可以看到结果了。
有朋友奇怪了,这和我们平时看网页的源代码有什么不同呢? 为什么要麻烦蜘蛛再来一次,而且必须在网站管理员工具中查看
首先你可以看到 Http 的头信息,这个信息可以通过 Live HTTP Headers 等工具查看到,但是直接查看源代码是看不到的,见上图中最顶部,相当于有个小探针,帮你查看更多的服务器信息和其他相关信息。
其次你可以比较蜘蛛看到的信息和人看到的信息有什么不同。这个工具用的是和 Google 抓取网页的那个 Googlebot 及其人一样的IP,一样的方式,一样的 user-agent,如果你在不知情的情况下被人进行了代码修改,在蜘蛛下和人为下看到的代码不一样(英文叫 clocking),就可以靠这个工具来检查了。
还有你可以用这个工具测试一些变化,比如重定向。
在这个工具中你还能发现一些额外的东西,比如 javascript 能被 googlebot 抓取
我没有 flash 站,有的朋友也可以看看 flash 在 Googlebot 中是什么样子的。
目前测试发现 Google 机器人只能抓取前 100000 字节的内容,有人就会觉得网页文件最好不要超过这个大小,还有人说做链接不要放在底部。其实这个没关系,这个只是工具的作用,跟真实的 Googlebot 机器人还是有一定差距,你看看新浪的首页,肯定不止 100KB。
小知识:什么是 Cloaking?
通常是说在 Web 服务器上使用一定的手段,对搜索引擎中的巡回机器人显示出与普通阅览者不同内容的网页。
现象 1:为了提高在搜索引擎中的名次,不自然地大量向网页中输入关键字,使其不展现给普通用户,单是选择性地发给搜索引擎的一种手法。
现象 2:黑链,今年就流行黑客了。当然,普通黑客的所谓黑链,人可以直接在源代码里看出来,但若有高手用了cloaking,那就不得了。 (据传搜索引擎会对 cloaking 的网站进行严惩)
小知识:如何测试我的重定向?
用这个工具测试的话,就不用再去等待 Google 重新收录你的网站,比如我们给 www.semwatch.org 做了重定向,自动跳到 semwatch.org,你就可以通过这个工具了检测是否顺利了。
本文首发 SEM Watch
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- 利用.htaccess拒绝spam机器人评论 2019-04-04
- 模仿有何不可:你身上有多少东西是原创的? 2019-04-04
- SEOer:别当外链机器人 2019-03-28
- CMS爱好者如何模仿目标站 2019-03-28
- 浅谈论坛内容成型的三个特性:模仿性 专业性 自主性 2019-03-27
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash