GOOGLE等新搜索引擎结果最成功的地方在于利用PAGERANK对结果排序,总是让最好站点的结果排在前面,从而大大提高了搜索的质量。简单的说:PageRank就是谁的页面被引用次数多,而且引用你页面的站点是权威,就说明你的页面的质量高,人气旺,PageRank就高。所以,这就是为什么同样是包含MP3的页面,偏偏MP3.COM排在前,而一些个人网站的MP3下载排在后面。
对于网站人气比较通用的说法是:LINK POPULARITY 即:站点流行度。对于站点推广服务来说:站点的人气评定已经是一个非常普遍的服务,很多搜索引擎的高级搜索都包括这个功能。更有专门的服务商帮助你直接从多家搜索引擎直接将URL的评定结果抓取。比如:在GOOGLE上查LINK POPULARITY,头2条会找到2家比较著名的站点评定服务商:LinkPopularity.com和LinkPopularityCheck.com。
我比较了一下LinkPopularity.com和 href="http://www.linkpopularitycheck.com/" target=nw>LinkPopularityCheck.com 的结果。
linkpopularity.com的搜索结果不佳,而且它用的是GOOGLE的结果,后面会说到,这是一个错误的方法。 href="http://www.linkpopularitycheck.com/" target=nw>LinkPopularityCheck.com结果好一些。它们的原理其实都是利用一些比较大的搜索引擎的LINKTO:命令功能实现的:统计连接到指定网页的链接数。链接数越高,人气(popularity)就越高。
数据源
结果
LinkPopularity
ALTAVISTA,HOTBOT
LINK TO GOOGLE
结果一般,但GOOGLE的结果不应该作为指标
LinkPopularityCheck
ALTAVISTA,HOTBOT,MSN,LYCOS
结果比较多,而且有很好的界面,结果按照查得的LINK多少排序,并用柱型图表示。
但他们msn的接口有问题,对于子页面的统计有问题,比如:http://news.163.com/viewpoint.html,结果是0但实际上应该有145条。
当然网上还有很多类似的资源甚至源程序,这里就不一一介绍了。但是这些的数据是否客观呢:随着互联网的商业化和分工细化,大部分网站的搜索结果其实是少数几个大的搜索引擎技术提供商提供的,比如:GOOGLE,INKTOMI,fast等(去这些门户网站的页面检索上看看上面的POWERED BY就知道了),例如:YAHOO的后台网页搜索引擎是GOOGLE,LYCOS的后台是FAST搜索引擎,而上面MSN和HOTBOT的搜索结果其实都是INKTOMI提供的,之所以不同网站的结果数量略有出入,只是由于服务条款的限制而已。所以,如果能够尽量使用后台的服务提供商的搜索结果,数字应该是比较全的。
其次,有些结果并非反向引用,我按照以下规则试验了以上搜索引擎的接口:
能区别域名: href="http://www.yeah.net/">www.yeah.net > href="http://chedong.yeah.net/">chedong.yeah.net,这样很多个人站点的域名转向就能和www.126.com, href="http://www.yeah.net/">www.yeah.net区别开了
能区别子目录:能够区别一个站点的首页和其子页面,比如:http://news.163.com/和http://news.163.com/viewpoint.html
子栏目
能够区别大的站点: href="http://www.yahoo.com/">www.yahoo.com > href="http://www.sina.com.cn/">www.sina.com.cn > href="http://www.chedong.com/">www.chedong.com
具体的命令接口参考了 href="http://searchenginewatch.com/webmasters/popularity.html" target=nw>Measuring
Link Popularity专题中对各个搜索引擎一些隐含的命令的介绍,最后我选择用做站点人气评价的搜索引擎包括:AltaVista,
Msn(inktomi), AlltheWeb NorthernLight这4个比较大的引擎:(没有选用GOOGLE,因为它的link:命令其实是针对域名的,比如:查 href="http://www.yeah.net/">www.yeah.net和chedong.yeah.net的结果数是一样)
命令
例子
AltaVista
link:URL命令
MSN(Inktomi)
点选高级搜索》在下面的下拉框里选择LINK TO URL=》填写URL
href="http://search.msn.com/results.asp?q=http%3A//news.163.com/viewpoint.html&FORM=SMCA&cfg=SMCINK&v=1&ba=0&f=lnk&sort=&rgn=&lng=&dom=&depth=&d0=&d1=&cf=">http://search.msn.com/results.asp?q=http%3A%2F%2Fnews.163.com/
viewpoint.html&FORM=SMCA&cfg=SMCINK&v=1&ba=0&f=lnk&
sort=&rgn=&lng=&dom=&depth=&d0=&d1=&cf=
AlltheWeb
link.all:URL
注意这里URL需要去掉HTTP://
href="http://alltheweb.com/search?cat=web&lang=any&query=link.all%3Achedong.yeah.net">http://alltheweb.com/search?cat=web&lang=any&query=link.all%3Achedong.yeah.net
NorthernLight
link:url
href="http://www.northernlight.com/nlquery.fcg?qr=link%3Ahttp%3A%2F%2Fwww.yeah.net%2F">http://www.northernlight.com/nlquery.fcg?qr=link%3Ahttp%3A%2F%2Fwww.yeah.net%2F
最后,需要补充的是有时候结果会因为URL中的ENCODING等问题,导致结果数不准确,所以结果数还进行了一些校正。
能够完成以上功能的一个PHP程序,大家可以通过以下入口进行测试(速度可能会比较慢):
href="http://www.chedong.com/linkPopCheck.php">http://www.chedong.com/linkPopCheck.php
程序源代码:
href="http://www.chedong.com/linkPopCheck.php?show=source">http://www.chedong.com/linkPopCheck.php?show=source
影响站点人气的因素除了链接数的多少以外,另外一个因素是反向链接站点的质量:引用站点的权威度,如果一个页面被一个著名站点链接过和被一些个人站点链过,其PageRank是大不一样的。关于PageRank算法的具体说明,这样的算法避免了很多个人用户利用链接炸弹,恶意提高自己排名。
结论:提高你站点知名度的方法:
被别人链接(引用)次数多;
引用你的站点本身的权威度高;
对想提高自己网站的知名度的建议:
老老实实提高自身网站的质量;
在推广过程中,尽可能选用一些大型站点;
参考资料:
Measuring Link Popularity
href="http://searchenginewatch.com/webmasters/popularity.html">http://searchenginewatch.com/webmasters/popularity.html
Google 的秘密- PageRank 彻底解说
href="http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html">http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html