做的,必须要了解清楚搜索引擎的工作原理,才知道怎么去做。其实在网上有很多长篇大论的的文章,但是你会发现读完只懂得有这个东西存在,根本就不知道搜索引擎的工作原理,板邓在这里用简明的方式系统告诉大家搜索引擎计算原理!
一、什么是搜索引擎?
如果没有专业的学习研究,简单的你就了解为一个能发现网页的程序。例如:抓取我们网页baiduspider,个人上网浏览网页点击链接的过程就是搜索引擎!
二、搜索引擎工作流程:
1.抓取网页
2.过滤
3.收录
4.排名
5.展现
百度为例解释:
抓取:
百度蜘蛛在整个互联网上爬行抓取提交的网页,通过访问链接读取文字内容。
影响抓取:中文路径和路径过长也不能识别,路径注意伪静态利于搜索引擎。怎么优化路径请点击查看:网站url路径优化。
怎么查看抓取数据?
1百度站长平台查看。
2、查看网站服务器日志。点击查看: 如何查看网站服务器IIS日记
过滤:
蜘蛛抓取之后,由于互联网上有大量的重复内容和垃圾内容,因此搜索引擎必须过滤掉无用的垃圾内容,保存有用的内容到搜索引擎的中,如果我们的页面连过滤这一关都通不过,那么无法收录,更别说参与排名。
影响过滤因素:
1、识别。蜘蛛无法识别网页的图片和flash ,所以一篇文章的质量高低就看文字的丰富度,对文章的图片一定要做优化,则无法识别。点击查看文章:文章图片优化
2、网站权重。也就是我们网站的信任度,网站权重越高,信任度就越高,收录就越快!
3、页面质量。页面内容质量越高越容易收录。
4、时间问题。老站的页面新站收录更快!
收录:
经过了过滤这一关之后就开始收录,质量较高的内容就把他放到搜索引擎高级数据库中,而质量比较低的就放到搜索引擎的低级数据库中。
新站收录:
新站内容比较少,要想快速收录,前期更新内容的量一定要大一些,而且要每天坚持更新高质量的内容,如果每天都是转载别人的内容,就会拉长收录时间。
排名:
搜索引擎他说抓取过滤,剩余的内容按照算法进行评分,按分数的高低排序,等待展现给搜索的用户!
总结:我们了解了搜索引擎的工作排名计算流程,就知道怎么去优化我们的网页,怎么去更新我们的网站内容,而不是盲目的往我们的网站里填充一些垃圾信息!