搜搜吧

搜搜吧 门户 教程 电脑网络 查看内容

网站中了“飓风算法”,老站长带你实战分析

2017-8-29 19:03| 发布者: IT总监| 查看: 162| 评论: 0

摘要: 2017年7月7日,百度正式推出“飓风算法”从官方文档中来看,飓风算法的命中对象是站点,而不是网页;主要是针对以恶劣采集为内容主要来源的网站,而不是所有包含恶劣内容的站点。哪些内容算是恶劣采集?恶劣采集内容, ...

2017年7月7日,百度正式推出“飓风算法”

网站中了“飓风算法”,老站长带你实战分析 经验心得 第1张

从官方文档中来看,飓风算法的命中对象是站点,而不是网页;主要是针对以恶劣采集为内容主要来源的网站,而不是所有包含恶劣内容的站点。

哪些内容算是恶劣采集?恶劣采集内容,一般是指没有花费时间,精力,专业能力,人工整合的内容,或者说对用户没有任何附加价值的内容。

这部分内容有以下几种类型:

1、从其他站点采集的内容

包括整个页面内容都是采集、主题内容是采集,或者多篇采集拼凑成的内容。这种类型内容很容易被识别。

2、采集之后轻度加工的内容

包括修改了部分词语,修改了部分句子,或者使用单词批量替换的形式(部分伪原创工具)。这种类型的识别难度稍微大一点。

3、从某些动态站点采集的内容

包括采集其他搜索引擎的搜索结果,采集新闻feed流。

注意几个要点:主体内容、恶劣采集、附加价值。

哪些内容不算是恶劣采集?

也有朋友问,为什么有些网站也是采集的,但没有受到影响,比如某doc、某浪。其实只要做到某个要点,就不算是恶劣采集,这个要点就是:给用户带来附加价值。

附加价值有站点增益和内容增益两种。这个时候可以引用百度搜索技术博客《浅谈互联网页面价值》的一段内容:

某人发表了一篇针对某新闻事件的原创博客,随后被新浪转载到了新闻频道。从描述的内容上讲,这是一种重复。但这种重复仅仅是主体内容上的重复,一方面它的转载带来了访问速度、稳定性等方面的增益,并且之后的检索用户还有可能用“新闻事件+新浪”来检索此新闻。这可以被称之为站点增益。另一方面,它在转载过程中可能会改变页面的标题,而且依托其受众,在转载页面上,还有可能出现更多的有价值评论和回复等,还有可能存在指向其它相关事件的新闻链接。这些可以被称之为内容增益。因此即使主题内容没有任何变化,新浪的这次转载也是有价值的,其稀缺度也是较高的。

同样,反过来说,如果转载的网站相当不知名,则其无法带来站点名/稳定性/速度的增益。更有甚者,转载之后在页面上加入大量广告妨碍阅读,或者只转载了内容中不完整的一部分,这样的转载,或者说采集,就是纯重复的,与采集源相比,就是没有检索价值的了。

综上所述,对于主体内容重复的页面,我们应该评价其是否存在站点增益和内容增益,只有对于大量完全无增益的重复页面,我们才应该认为其稀缺度较低。

这里的要点是:页面价值、增益

因此说,只要能够带来站点增益,内容增益,给用户带来附加价值,那就表明这个网页有其独特的价值,是不会被飓风算法命中的。

自百度推出“飓风算法”,首先中招的有这些大家熟悉的站。

7月7日中枪网站,大部分是范文类

网站中了“飓风算法”,老站长带你实战分析 经验心得 第2张

7月6日中枪网站,大部分是范文类

网站中了“飓风算法”,老站长带你实战分析 经验心得 第3张

躺枪案例:

网站中了“飓风算法”,老站长带你实战分析 经验心得 第4张

t262.com

网站中了“飓风算法”,老站长带你实战分析 经验心得 第5张

sanwen8.cn

被飓风算法影响怎么办?

针对飓风算法的影响,百度一个朋友透露说:

飓风算法主要是针对没有价值的采集,一旦中招没有任何解法。而被误伤的优质原创可以通过反馈中心申诉。

因此,一旦被飓风算法命中,只要不是明显误伤,短期内都没有办法解决。(被搜素引擎算法命中,一般都是普遍存在的,不被搜素引擎接受的做法,一般没办法申诉,Google也是如此。只有人工处理的能申诉。)

如何避免被飓风算法命中

采集会被算法惩罚,而内容完全原创,成本又非常高。那如何生成内容,而又不被飓风算法惩罚呢。其实还是围绕内容增益上去解决,有几个解决方法:

1、增加用户点评模块

网站中了“飓风算法”,老站长带你实战分析 经验心得 第6张

页面增加用户点评模块,当有用户点评之后,点评内容也会成为网页内容的一部分,产生了额外价值。作为用户,在阅读完内容之后,也希望看一下真实用户的意见,比如这个内容是否属实,信息是否失效,有没有额外的提醒等。

不过要注意的是,点评内容最好是在源码中实现,而不是在JS中(方便搜素引擎识别)。

推荐工具:友言,wumii(不保证内容出现在源码中)

实现难度:★★★

安全程度:★★★★

示例:网易新闻跟帖

2、增加内容推荐模块

网站中了“飓风算法”,老站长带你实战分析 经验心得 第7张

根据网页主题,添加相关的内容模块,比如延伸阅读,之前报道,相关阅读等。作为用户,可以更加详细完整的了解事件的发展,比如关于“张艺兴”的一篇新闻,可以了解他之前参加过什么活动,有什么绯闻,参与的极限挑战的进展情况等。这些对用户来讲,都是非常有价值的。

实现思路:一种是人工编辑;一种是算法实现,比如根据TF-IDF提取出主体关键词,再拿关键词去跟历史内容匹配。

实现难度:★★★★

安全程度:★★★★

示例:网易新闻下的延伸阅读

3、内容整合

网站中了“飓风算法”,老站长带你实战分析 经验心得 第8张

示例:网易 - 香港回归20周年专题

根据主题,将多篇内容整合为一篇。跟之前内容相比,整合后的内容更加丰富,可以满足用户更多需求。比如一篇“梦见老虎”的内容,如果能够添加“梦见老虎吃人”、“梦见被老虎追”等内容,将会更可能命中用户的梦境。

另一种比较常见的就是专题页,将相关主题的内容全部组织起来,按照重要程度安排内容布局。这种专题页有运营小伙伴编辑的,也有程序生成的(使用开源搜索引擎,比如Lucene,Sphinx,Xapian)。

4、申请百度原创

如果确实是优质原创内容,还是推荐加入百度原创保护项目。目前这个项目在内侧阶段,需要百度邀请加入。

如果你的网站已经中了“飓风”,如何恢复网站排名呢?以武汉seo看来,你只能照如此做,然后看百度的反应吧。

1、如果你采集了,请自行删除采集内容,并用robots.txt进行处理,坚持原创,坐等百度老太太给你伸出橄榄枝;

2、警告:如果你的内容都是抄袭的,而且每天发布数量较多(超过100条且没多少原创),即便没采集,估计将来也会中飓风,百度目前的思想是建立一个绿色生态,他老人家并不希望互联网上有大量重复的内容,因为没有价值。

3、随着数据的增加,百度也肯定恼火大量重复内容给搜索引擎带来的困扰,因为你去做搜索引擎,也不希望遇到这种麻烦,成本问题、算法问题、大站建立群站骗取流量问题,都头疼。

4、时代变了,将来能够存活下来的站点,一定是有较多高质量原创内容的网站,内容为王的时代已经开启革命,也只有这样,百度才有玩内容推介的资本,才不会被大量自媒体分走流量和客户,事关存亡,百度不会希望中国也出现一个facebook,微信自媒体、头条等,一个是社交流量,一个是原创生态,都越来越强大。

(本文由武汉seo-www.shuaii.com原创,未经允许不得转载!)

搜搜吧社区温馨提示:
1、在门户或论坛里发表的文章仅代表作者本人的观点,版权都归原作者版权所有与本网站搜搜吧立场无关。
2、门户或论坛的所有内容都不保证准确性,有效性,真实性,时间性。阅读本站内容请自行核对发布者的真实性,本站不承担连带责任。
3、注册会员通过任何手段和方法针对本站门户或论坛进行破坏,我们有权对其行为作出处理,并保留进一步追究其责任的权利。
4、注册会员以及游客请遵守地方法律,请您在发表言论时注意您的言行举止,请勿发表低俗以及违反国家地方法律的文章,违者必将追究法律责任!
5、请勿发表侮辱或者诽谤他人,侵害他人合法权益的、含有军事、色情、药品、赌博、走私、法律、行政法规禁止的其他内容的、违者直接上报公安!
6、本站搜搜吧与全国各地公安机关网监部门以及工商管理部门共同监管,严厉打击禁止从事违法犯罪,损害国家利益的一切非法活动,全网站24小时监控!
7、本站所有帖内以及门户发布的图片均来自互联网,图片设计版权都归原作者版权所有,图片都由发布者自行发布,本站不承担任何盗版的连带责任。
8、本站所有的内容均来自互联网以及第三方作者自由发布、本站不承担任何的法律责任、若有侵权请来信告知,我们在收到举报后的一个工作日内立即删除、
9、搜搜吧删帖,投诉,举报,侵权,账号解封唯一指定快速受理频道,请直接发送邮件到 admin@soso021.com 一个工作日内核实并邮件通知立即删除
版权政策说明:
搜搜吧(www.soso021.com)十分重视网络版权及其他知识产权的保护,针对网络侵权采取如下版权政策:
1、本站有理由相信网友侵犯任何人的版权或作品,(图文,文字,下载,视频,非法传播),本站有权不事先通知即删除涉嫌侵权的作品和内容!
2、本站将采取必要的网络技术手段,确认为侵权作品或内容的用户有权进行警告、屏蔽、删除的行为,尽可能的防止侵权行为的发生!
3、如若您的作品或内容在搜搜吧被侵权,请及时联系我们并提供能证明版权所有的物品,我们将及时进行处理,给您造成不便,敬请谅解!

鲜花

握手

雷人

路过

鸡蛋

最新评论

资讯分类

推荐图文

文章排行

Powered by soso021 X3.2© 2013-2017 搜搜吧社区 小黑屋|手机版|地图|苹果资讯网|搜搜天下事|滴滴打车|会计之家|seo博客|soso吧社区   
《中华人民共和国工业和信息化部网站备案》沪ICP备16027893号-1  全国公安机关互联网站安全服务平台沪公网安备31010702002039号

GMT+8, 2017-10-17 13:45 , Processed in 0.157234 second(s), 21 queries , Gzip On.

返回顶部