百度站内搜索防止恶意利用
2014-11-24 来源:百度站长平台论坛
在前面了解了防止网站内部搜索被他人恶意利用http://info.west263.com/cms/info/search/2014-11-13/1575.html大体思路后 ,从本人工作经验来说,跟大家分享下面自己的观点,如果有不妥希望大家能及时拍砖,互动分享提高。
说明下:使用百度站内搜索的,由于robots自动屏蔽了搜索结果页(各自可以检查下),如下
User-agent: * Disallow: /cse/
所以使用百度站内搜索的可以不用担心这个问题。
“从结合实际来看,很多搜索结果的数据质量并不一定可靠,从以前百度对专门利用搜索结果做排名的打击来说,原因在于搜索结果不一定能十分满足用户的需求,特别是算法不够精准的情况下。因此结合实际来说,不可控的用户搜索url需要防止被利用,回归单纯的满足用户的搜索功能即可,反而可以重点研究结合标签等属性加上一些人工整合、提高信息质量生产的url更为优质。”当然大站的搜索结果页面质量不一定好,有时也能获得不错的引流,但近年来大搜索越来越少见到中小站点的搜索结果页参与排名。
一些不良用户使用软件(或其他手段)在网站内搜索一批敏感词,网站上就会产生这一批敏感词对应搜索结果页(即大量垃圾搜索结果页)。
1、现象及危害
1.1、影响网站其他页面被抓取
百度对每个站的抓取频次是有限定的,当这些垃圾搜索结果网址(url)被百度抓取到,网站的其他页面网址就可能因为这个网站的抓取频次到达上限而不被抓取。
1.2、垃圾搜索页网址被百度收录
如下图,对网站在搜索结果中的展现以及其他正常页面的排名都可能产生负面影响
2、解决办法
核心思路有两个:
A、修改搜索结果页的网页标题(title)、网页描述(description)、网页关键词(keywords)调用规则,不调用用户搜索的词;
B、使用robots.txt禁止网址url被搜索引擎抓取收录。
可两个思路分别使用,具体如下所述进行操作,但建议A、B同时使用。(由于腾讯qq等展示url的时候会调用title等信息,因此如选择robots,也要做好搜索结果页的title设置)
2.1 修改搜索结果页的网页meta(title/keywords/description)调用规则
2.1.1 meta只显示“搜索”
【方法】修改后的页面meta(title/keywords/description)三部分不再显示用户搜索词,只显示“搜索”二字,title可带**网站名称,如下图
【效果】可避免敏感关键词的搜索结果页被收录,另外还可以避免搜索结果页面抢占其他页面的关键词排名,但会造成网站内大量网页(全部搜索结果网址)的meta一样。
2.1.2 不同类别的搜索结果页meta设置唯一的需布局的关键词
【方法】同样,修改后的页面meta(title/keywords/description)三部分不再显示用户搜索词,但显示某栏目类别下的搜索结果页meta设置的关键词,如下图,属于北京四星级酒店栏目分类下的搜索结果页的meta设置
【效果】可避免敏感关键词的搜索结果页被收录,但可能会出现部分搜索结果页抢占其他页面关键词的排名,因此需要做好关键词布局的整体规划工作。这种做法会造成部分搜索结果页的meta一样。
2.2禁止网址url被搜索引擎抓取收录
【方法】利用robots.txt文件,禁止符合搜索结果页特征的网址被搜索引擎抓取收录,如下图,禁止带search.php特征的网址url被搜索引擎抓取收录。
【效果】理论上,禁止符合搜索结果页特征的网址被百度抓取收录,能提高百度的工作效率,让百度更有精力去抓取其他页面,另外因为不被抓取收录,这些页面自然也就不会在百度搜索结果中出现。但是由于robots.txt由于某些原因不一定能完全让百度不抓取收录,因此如发现百度不遵守robots的情况,可及时利用百度站长工具、快照投诉等机制进行反馈。
标签: 排名 搜索 搜索引擎 搜索优化 网站 问题 选择 用户
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。
下一篇:网站推广如何做内链外链?