【飓风算法】——针对内容采集及站群问题

发布时间:2021-08-06    浏览数:
写在前言
小友blog旨在帮各位跟博主一样做自媒体&网站建设推广的小友答疑解惑,通过定期内容输出让更多干货内容被大家看到,欢迎一起学习交流!
本篇是关于“【飓风算法】——针对内容采集及站群问题”的文章内容,希望以下内容分享对你有帮助。
文章正文
飓风算法3.0【2019-08】
——主要针对跨领域采集以及站群问题
范围:覆盖百度搜索下的PC站点、H5站点、智能小程序等内容
处罚:根据违规问题的恶劣程度,酌情限制搜索结果的展现
一. 跨领域采集:
指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。
跨领域采集主要包括下面两类问题:
第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。 
问题示例:美食类智能小程序发布足球相关内容 
第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。
问题示例:智能小程序内容涉及多个领域
二. 站群问题:
指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。
问题示例:多个智能小程序复用同一模板,内容重复度高、内容少且内容稀缺性低

 
飓风算法2.0【2018-09】
——主要针对采集网站
飓风算法2.0主要打击以下四类恶劣采集行为:
1、采集痕迹明显
存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
2、内容拼接,逻辑不连贯
存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
3、存在大量采集内容
站点内存在大量采集内容,网站自身的内容生产力极差。
4、跨领域采集
站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。

飓风算法1.0【2017-07】
——严厉打击以恶劣采集为内容主要来源的网站
百度搜索将从索引库中彻底清除恶劣采集链接,给优质原创内容提供更多展示机会,促进搜索生态良性发展。

站长建议:
优质原创站点才是王道
 
文章标签
更多关于“排名机制”的百度算法汇总文章