原创+高质内容网站的福音 360搜索上线“后羿算法…

2019-04-10 08:55:34来源: 站长之家用户 阅读 ()

新老客户大回馈,云服务器低至5折

互联网发展至今,除了给网民们带来巨大的便利外,也产生数量庞大的“信息垃圾”,低质的伪原创内容、恶劣的标题党、偷换标题、采集拼贴内容等行为层出不穷,甚至这种低质内容还被排在了一些搜索引擎的首页位置,这不仅严重伤害了用户的浏览体验,更是对那些积极努力做原创、高质内容的站长们的一种“打击”。

原创内容之“殇”

此前,人们似乎都倾向于将“互联网”与“免费”等同起来。在我们看来,互联网的信息(内容、视频、图片作品等)就应该供网民们免费使用。在互联网的发展历史中,这一想法也愈发根植于我们的意识中。

然而近几年来,内容产出者、内容发行商等方对“知识版权”的意识越来越高,对版权保护也有了较为深刻的认知。但仍无法避免一些站点试图通过内容拼凑、偷换标题、隐瞒篡改出处、采集内容后小量修改等投机取巧的方式将他人的原创内容“据为己有”。

那么,搜索引擎和站长们该如何应对这种“窘境”呢?针对这一问题,近日360搜索上线的“后羿算法”也许可以给我们答案。

何为“后羿算法”?

所谓的“后羿算法”主要是控制低劣的内容采集站点,保护原创和稀缺性内容,并适当提高相关内容页的权重、排名等,同时确保新闻网站之间正常的转载行为不受影响。

“后羿算法”秉承了英雄后羿的“去除冗余,除暴安良”精神,控制互联网上的采集信息和垃圾信息;同时“后羿算法”积极倡导“原创精神”。360搜索方面表示:只有不断的倡导原创,控制采集,才能使整个互联网的信息丰富度和精品度持续提升。

另外,后羿算法采取了业界领先的大规模并行机器学习算法,通过亿万维度特征的刻画,结合对搜索领域问题的不断探索和实践,对海量文本数据进行主题和内容倾向性分析,对用户喜好程度进行全面建模和应用,能够对原创信息进行快速而精准的鉴别,并对采集行为和垃圾网页进行定向的约束和管控。

“后羿算法”打击恶意采集

目前来看,“后羿算法”主要针对互联网上泛滥的恶意采集进行抑制,其中包括一些滥用采集手段的行为,如整站大规模采集。此类恶意采集网站涉及领域有普通问答类,商品购物类,娱乐新闻类,企业商情类,成人色情类,赌博诈骗类,私服外挂类,违法违禁类等。

“后羿算法”还将控制一些生产低质的伪原创内容行为,如页面内容拼凑、大量无关热词堆砌等。此外影响用户浏览体验的行为,如含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等,也在“后羿算法”的控制之列。

此外,“后羿算法”还会从源头上控制恶意采集网站在360搜索上的展示,采集站主要靠流量变现来获益(如广告,弹窗,跳转,下载挂马等行为)。这其中的大部分行为会被搜索引擎视为“对用户不友好”或者“坑害用户”。

一旦被“后羿算法”认定为“低质内容”,则会导致网页的收录量的下降,以及搜索引擎排名的降低。另外,360搜索还表示,对于涉嫌敏感和色情的内容领域,也将遵循国家法律法规不断进行打击和控制。

原创+精品内容站点将从“后羿算法”中受益

360搜索方面表示,“后羿算法”上线后,将会增大内容丰富的优质网页(如原创内容、稀缺资源、精心编辑的内容页等)在搜索引擎结果页中的展示机会(有利于页面的收录及搜索引擎排名等)。

其实一直以来,360搜索都掌握着采集类站点的完整索引量和历史行为模式,并对之进行长期的密切的关注和监控,一旦发现有恶劣作弊倾向就会进行严肃处理,这不仅是对用户的负责,也是对认真做内容的站长们最大的安慰。

后羿算法上线,广大站长将何以应对?

无疑,用户们都喜欢高质量的原创内容。如今,互联网上每天大约会诞生数十万篇的“文章”,但目前中国互联网上由于种种不规范的转载和采集等行为造成的冗余信息规模已经上百亿。这不仅是对互联网资源的一种浪费,也是对原创内容的一种不尊重。

另外,从互联网的发展史看来,能“成大器”的几乎都是那些认认真真做内容、踏踏实实做事儿的网站。这些站点以高质原创内容作为支撑,无论搜索引擎算法如何改进,它们也不会畏惧。反观那些花花肠子多的站点,大多是“火一把死”的状态。

那么,身为站长的我们该如何避免“火一把死”呢?

作为草根站长的我还是希望广大站长们能够踏踏实实做内容:从长远发展考虑,积极完善网站建设,提供更多时效性高、内容丰富的原创内容。网站内容质量提高了,才能从“后羿算法”的更新中获益:网站完善了,站点的收录量也会不断提升。

另外,站长们切勿为了短暂的“好排名”而进行“刻意的链接交换和链接买卖”行为。单纯依赖链接来获取pagerank的方法早已不奏效,甚至优化不当还可能带来“反噬”的风险。真心希望的站长和网站群体们都能把焦点和资源都汇聚到原创和精品内容建设上。

在保证了内容质量的前提下,站长们还可以通过360站长平台主动提报收录缺失的信息。

站长平台反馈中心:http://info.so.com/feedback.html?product=zhanzhang

另外,360官方还建议,站长们如果发现了自己的原创内容被恶意采集,或者对采集判定结果及收录状况存在异议时,也可以通过站长平台的反馈中心及360搜索论坛版主进行反馈。

 360搜索论坛: http://bbs.360.cn/forum-137-1.html

最后附上360站长平台注册地址以及平台使用说明链接:

站长平台注册地址:http://zhanzhang.so.com/

站长平台使用说明请见:http://www.so.com/help/help_3_3.html

总结

互联网的发展离不开高质、稀缺的原创内容,而互联网环境对的“环保”也离不开搜索引擎、站长和用户们的共同努力。一直以来,360搜索都以鼓励互联网原创生态为宗旨,秉承“保护原创+控制采集”的原则。而“后羿算法”的上线也标示着360搜索的“原创和采集识别能力”达到了一个历史的新高度,虽然暂时还无法完全杜绝内容拼接、偷换标题、垃圾广告等地质页面的存在,但从长远来看,无疑是互联网生态建设革命道路上一块至关重要的“里程碑”,相信“杜绝”也只是时间问题。

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:让你忍不住买买买,购物网站会这样设计

下一篇:这类便宜的USB设备,或许是对付账户劫持的最好方法