鄙人是飞寻(www.feiseek.com)一个无名小站的无名小卒站长,辛苦了好长时间,终于把站点挂出来了,可刚挂上三天服务器的IP被Google封了,导致站点不能正常地抓取网页内容,伤心透了,鄙人不得其解。
当初开发飞寻仅仅是作为一个技术爱好,绝非想有任何商业目的。简单介绍一下飞寻是什么东东。
很久以前我就开始使用搜索引擎搜索我想要的信息,也在很久前,我发现百度和Google的搜索结果正如所说的有80%的不相同,所以我常常使用两个搜索引擎分两次搜索,所以我浪费了很多时间来敲键盘和点鼠标。有一天我发现了一起搜的站点,所以我省了很多时间。我又一直再想怎么才能更快的展现搜索结果而不是简单的分栏呢,有一天我突然有了点想法,所以我就去做了,和同学一块用了几天的时间最终完成了飞寻的核心代码,不久飞寻就推出了。
飞寻的出现只是为了实现一个简单的想法:让人们花费最少的时间,找到最合适的搜索结果。
百度和Google的搜索结果平均80%不相同,如果只使用任何一个搜索引擎我们将可能错失很多有用的信息,如果我们同时使用两个那样将耗费太多的时间。你想找到最好的搜索结果,但是不想同时使用两个搜索引擎而浪费时间,飞寻将能解决你这个问题。
我一直坚信:Trusting two is better than one
飞寻同时抓取百度和Google的搜索结果,并分析它们同一个关键字的不同搜索结果,根据你的倾向性选择,为你展现它们的相同搜索结果和不同搜索结果。
功能介绍
百度、Google共有的:飞寻选取百度和Google共有的搜索结果,并显示每一个搜索结果在百度和Google的排名情况,您可以通过对比有选择性的查询二者的搜索结果。
百度独有的:飞寻选取百度独有的而在Google没有出现的结果,让您的选择更具有针对性。
Google独有的:飞寻选取百度没有而Google独有的内容,让您的搜索结果更加准确。
事件过程:
三月份的时候飞寻代码基本写完,可由于一直忙于工作,飞寻并没能开发完善,所以飞寻一直处在停滞状态,8.29再次捡起飞寻的源代码进行完善并推出来,飞寻推出第三天的时候IP 225 pv:804,当我正在担心百度会封掉我们服务器IP的时候也就是9.12 大概18:36左右,Google封掉了我们服务器的IP,导致不能抓取Google的页面。
我查询了一下用户的搜索记录,除了有少许几处有敏感词汇外,其他的词汇都属正常。只是查询关键字,Google也不足以封飞寻的IP吧,再说了Google能保证用户不在自己的网站上面搜索敏感关键字吗?晚上我给Google的管理员发了封邮件,估计不会搭理我这无名小卒,结果就是连个退信都没见到,IP到现在还一直封着。
从Google的企业文化,到李开复的个人魅力,我一直对Google的印象比较好,一直崇拜着 Google的思想、Google的技术,但是现在封它了我的IP,我无语了。
访问我的站可以发现,倾向性选择我设置的默认是我更信任百度,之所以设置的是百度是感觉百度大家用的比较多。下面的内容顺序也是百度在前面,有人提示我是不是因为有偏袒百度之嫌,Google才封我的IP的,我觉得这种可能性比较小。当时设计的时候从没想过要袒护任何一方,我的原则是对双方的搜索结果不做任何评价和个人色彩。我做的也就是把搜索结果更好的呈现给大家。
谁能给我点答复?