透过人肉搜索引擎看威客
2008-04-02 10:10:12来源:互联网 阅读 ()
文/流浪诗人
【1】 什么是人肉搜索引擎?
人肉搜索引擎就是指更多的利用人工参与来提纯搜索引擎提供的信息的一种机制。猫扑的人肉搜索引擎就是其中一个比较成功的例子。后面我们会根据猫扑的人肉搜索引擎给出一个更加具体的描述。
针对搜索引擎的Link Farm和Spam也许永远不会停止,因为他们能够从他们的作恶中得到利益。我们知道得到利益不是作恶的唯一原因,然而大规模的产业化的作恶唯一的原因当然是那样可以得到利益。
所以,这是一场永远无法结束的战争,只要搜索引擎还是应用最广泛的一种互联网应用,只要搜索引擎还是用户找到合适服务的最主要手段。很多人把问题归结于PageRank技术,当年人们也是这样地抱怨META关键字和描述技术。也许Google或者其他的公司能够研究出来更加伟大的技术来取代PageRank,但是谁知道这新的技术什么时候又会变成明日黄花。
搜索引擎是利用机器自动化的收集网络信息并有序化的一种技术。搜索引擎高效快速,然而因为现在人工智能并不完善,搜索引擎还很难甄别刻意的、修饰过的信息,所以SEO Spam才会那么猖獗。所以,有些人想从搜索引擎的反面来解决问题,那就是更多的利用人工把搜索引擎得到的信息进一步萃取,进一步有序化,我们称之为人肉搜索引擎。
【2】 人肉搜索引擎的起源
很多人知道的中国有一个叫做猫扑的论坛,人气非常旺。Tiny在2001年到2004年期间是这个论坛的忠实用户。在我的印象中,人肉搜索引擎的概念应该出自于猫扑。
跟很多论坛一样,猫扑上面也经常有人问这个问题那个问题。同时,猫扑有种虚拟货币叫做Mp,问问题的人往往会用Mp来奖励可以帮助他们的人。虽然Mp不能吃不能喝,但是还是很多人醉心于挣取更多的Mp。那些惯于通过回答问题挣取Mp的人在猫扑一般叫做赏金猎人。
于是很有趣味的一幕出现了,某人需要解决一个问题,就在猫扑发贴并许诺一定数量的Mp作为酬谢。很快,就会有赏金猎人看到这个贴子,他们就会去用搜索引擎来寻找问题的答案,然后争先恐后地把找到的答案回在帖子里面邀功。最后,提问题的人得到了答案,赏金猎人得到了Mp,皆大欢喜。这也就形成了所谓的人肉搜索引擎的机制。有趣的是,我们可以发现人肉搜索引擎的搜索流程和搜索引擎在不同服务器之间的分布式搜索流程看起来是那么的相似,区别仅仅在于发动和执行流程的是人,还是机器。
人肉搜索引擎的质量怎样保证呢?这是一个非常有趣的问题,从刚才的流程上大家可以发现,如果有足够多的赏金猎人,他们之间就会产生竞争,寻找资料速度的竞争,资料准确性的竞争。竞争的结果是,一个速度又快、资料又准确全面的赏金猎人会有越来越多的Mp,这会给他带来更多的成就感,同时他也会更加的醉心于赏金猎人的工作。甚至,据我所知很多赏金猎人会形成自己的职业道德和行为准则,这样可以给他们更大的自我实现,同时提高了用户的满意程度。这就形成可一个正反馈,一个良性循环,前提是有足够的激励(Mp)投入和足够产生竞争的参与者(赏金猎人)。
同时,很多人也为自己是一个人肉搜索引擎的用户感到自豪,因为这确实太好用了,不需要担心分词不准确,不用担心电脑错误的理解了你的话,不用担心搜索引擎收录范围不同造成的风险,甚至不需要学习搜索引擎怎么用,而且答案也不会仅仅局限于搜索引擎能找到的信息,虽然绝大部分问题是通过搜索引擎就可以找到的。
然而,人肉搜索引擎几年来仅仅是一个概念,没有成为一种产品,在猫扑,人肉搜索引擎只能帮助猫扑提升人气,并不能成为一个产品给猫扑带来效益,同时也给更多的人服务。这是为什么呢?我想可能有4点原因:
<1> 猫扑人肉搜索引擎和论坛的差异不够明显。或者说在猫扑里,人肉搜索引擎只是论坛的一种应用而已,任何需要人肉搜索引擎服务的人必须是论坛的用户,这降低了用户普及度。
<2> Mp过于游戏化。Mp是虚拟货币,是游戏化的货币,这也给猫扑的人肉搜索引擎加上了游戏性的标签。做赏金猎人的人仅仅是喜欢这个游戏化氛围的人,或者说是能被Mp这样的虚拟货币激励的人,这影响了赏金猎人队伍的扩大,从而影响了人肉搜索引擎的扩大。
<3> 人肉搜索引擎的反映比较慢。Google可以在0.00001秒内给你一个答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出结果才会有所反应。
<4> 猫扑人肉搜索引擎不能保留历史纪录,每次有一个问题出现,就会引发一次分布式搜索。即使问题是重复的,也会同样引发这个流程,而且相同的问题在不同的时间问,答案可能迥异,不能对相同答案给予一致性的结果。
【3】人肉搜索引擎大事件纪实
搜索引擎就是通过关键词搜索网页的工具,但你知道最强的搜索引擎是什么吗?或许你会说百度,还有Google,又或者你会问是雅虎、MSN、中搜、爱问、搜狗当中的哪一个?其实答案并不在其中,而应该是——“人肉搜索引擎”!不信?!从卖身救母事件,网络虐猫事件,到火爆的“铜须门”网络丑闻和近期的“功夫少女”色情照片事件,还有最近针对流氓外教的“网络追杀令”,人肉搜索引擎时刻显示着网民互动战争的浩瀚、壮阔,如此强大的人海战术威力不禁让人折服!
人肉搜索vs电脑搜索
人肉搜索引擎其实就是在一个社区里面提出一个问题,由人工参与解答而非搜索引擎通过机器自动算法获得结果的搜索机制。通俗来说就是通过广聚五湖四海的网友力量,每个遇到困难的人提出问题,而有这方面知识或者线索的人就对其解答、分析,可以说是一种问答式搜索。百度知道、新浪爱问、雅虎知识堂从本质上说都是人肉搜索引擎,也是应用这种针对性的人工参与方式。
对于一些八卦搜索、没有唯一答案的多选结果搜索,人肉搜索往往能得到更有价值和吸引力的结果。在百度知道里待解决问题数目高达339196,而爱问知识人则称“知识人,亿万网民帮您解决困难!”为什么会有如此惊人的数字呢?其实这就是人肉搜索引擎的威力所在,也证实了不能通过机器搜索引擎解决所有的困难。
相反,由于网络这个虚拟空间聚集了各地的不同阶层,不同知识背景的人,得到帮助的几率也会大大增加。当然,人肉搜索引擎也有比不上机器搜索引擎的地方,那就是速度。Google可以0.00001秒内给你一个答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出结果才会有所反应。所以说,人肉搜索引擎的潜在力量比机器搜索引擎强大,但反馈速度就比不上机器搜索引擎,两者的PK只能说是平手。
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash