SEO技术

当前位置:

百度飓风算法,针对页面内容质量,严厉打击恶劣采集

浏览量:434次

2019-08-08飓风算法3.0,控制跨领域采集及站群问题

以下详细说明飓风算法3.0的相关规则。

一. 跨领域采集:

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。

跨领域采集主要包括下面两类问题:

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。 

问题示例:美食类智能小程序发布足球相关内容 

1.png

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。 

问题示例:智能小程序内容涉及多个领域

2.png

二. 站群问题:

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。

问题示例:多个智能小程序复用同一模板,内容重复度高、内容少且内容稀缺性低

3.png


飓风算法3.0相关问题官方解读

Q1:同一品牌下,分公司的网站/智能小程序都采用相同的模板,是否会被判定为站群,被飓风算法3.0命中呢? 

A1:对于站群问题,算法会根据多个因素综合判断,如页面排版相似度、同一主体下的站点/智能小程序数量、内容质量、内容稀缺性、内容相似度等等。 

如果同一品牌下的网站/智能小程序,使用相同的页面排版,内容相似度较高,这类情况也有可能被判定为站群,存在被算法命中的风险。

问题示例:某品牌下多个智能小程序,使用相同的模板,内容质量低,相似度高 

1 (1).png

Q2:这次飓风算法升级主要打击跨领域采集,那么同领域的采集会被算法覆盖吗? 

A2:此次飓风算法3.0的主要升级点是加强了对跨领域采集和站群问题的覆盖,但以往飓风算法对恶劣采集的控制依然有效。百度搜索算法一直在持续运行,控制伤害用户体验的违规问题,不会因为算法的升级或新增而导致旧算法停止。


Q3:如果站点/智能小程序中有曾经跨领域采集的内容,为了避免被算法命中,需要将以前的跨领域内容删除吗? 

A3:是的,如果站点/智能小程序中曾经发布过与网站/智能小程序所属领域不相关的内容,我们建议您尽快删除跨领域的内容,深耕当前领域,生产满足用户需求的优质内容,提升网站/智能小程序的领域专注度。


Q4:在一个站点下设置不同主题的频道或目录,发布不同领域的内容,这样会被算法命中吗? 

A4:在同一个站点下可以存在不同主题的频道或目录,但每个频道的内容都应当与该站点的领域定位相关,且专注于该领域,频道内容应是满足搜索用户需求的优质内容。


Q5:在同一个主体下开发不同的智能小程序,发布不同领域的内容,这样会被算法命中吗? 

A5:在同一个主体下可以存在不同主题的智能小程序,但每一个智能小程序都应当具有专业的资源、优质的内容、完善的功能,不存在站群行为,且内容应专注于该智能小程序所属的领域。


2018-09-13飓风算法2.0严厉打击四类恶劣采集行为,以及应该怎么做

类型1:采集痕迹明显

详细说明:站点存在大量从其他站点或公众号采集、搬运而来的内容,信息未经整合,排版混乱,部分功能缺失或文章可读性差,有明显采集痕迹,用户阅读感受很差。

示例:采集文章内容中存在超链接不可点、功能缺失问题,采集痕迹明显

1.jpg

建议:对于网站发布的内容,需注意文章的排版和布局,不应出现与文章主旨不相关的信息或不可用的功能,干扰用户的浏览。

 

类型2:内容拼接

详细说明:采集多篇不同文章进行拼接,整体内容未形成完整逻辑,存在阅读不通顺、文章不连贯等问题,无法满足用户需求。

示例:前后内容无关,逻辑不连贯

2.jpg

建议:我们严厉反对利用采集编辑器等工具,随意生产拼接采集内容的行为,请网站多多生产对用户有价值的原创内容。

 

类型3:站点存在大量采集内容

详细说明:网站内容下多数内容均为采集,网站自身无内容生产力或内容生产能力较差,网站内容质量较低。

建议:我们鼓励站点生产原创内容,如若转载需标明出处。(如:新闻、政策类等标明出处的转载内容,不会被认为是采集内容)

 

类型4:跨领域采集

详细说明:站点依靠采集大量与本站领域不一致的内容来获取流量的行为。

示例:教育站点发布美食相关内容

3.jpg

建议:我们鼓励站点生产领域内的文章和内容,通过领域专注度获得更多的搜索青睐。不要尝试采集跨领域的内容来获得短期收益,这样会造成领域专注度的降低,从而影响站点在搜索中的表现。

      

综上,飓风算法2.0旨在保障搜索用户的浏览体验,保护搜索生态的健康发展、对于违规网站,百度搜索会依据问题的恶劣程度有相应的限制搜索展现的处理。

对于第一次违规的站点,改好后解除限制展现的周期为1个月;

对于第二次违规的站点,我们将不予释放。


2017-07-04

 百度搜索于近日推出飓风算法,旨在严厉打击以恶劣采集为内容主要来源的网站,同时百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。

飓风算法会例行产出惩罚数据,同时会根据情况随时调整迭代,体现了百度搜索对恶劣采集的零容忍。优质原创站点如发现站点索引量大幅减少且流量大幅下滑现象,可在反馈中心进行反馈。