2022最新版百度搜索seo算法盘点大全
一.网站内容质量
1.1飓风算法2.0
百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,并在2018年9月13日公布飓风算法升级为2.0版本。
1
飓风算法2.0主要打击以下四类恶劣采集行为:
1.存在大量从其他站点或公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。
2.存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。
3.站点内存在大量采集内容,网站自身的内容生产力极差。
4.站点内存在大量与本站主题无关的采集内容,领域专注度差,恶意获取流量。例如:科技网站采集大量娱乐八卦、社会新闻等情况。
1.2 飓风算法3.0
百度搜索在2019年8月对飓风算法进行升级,上线飓风算法3.0。
这次算法升级主要针对跨领域采集以及站群问题,将覆盖百度搜索下的PC站点、H5站点、智能小程序等内容。对于算法覆盖的站点/智能小程序,将会根据违规问题的恶劣程度,酌情限制搜索结果的展现。
以下详细说明飓风算法3.0的相关规则。
1
2
3
4
5
一. 跨领域采集:
指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。
1
跨领域采集主要包括下面两类问题:
第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。
第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。
1
2
二. 站群问题:
指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。
1
1.3 细雨算法——针对B2B领域的受益行为
2018年6月,百度搜索发布细雨算法,针对B2B行业的网站受益问题进行规范和引导。
1
细雨算法主要针对以下问题:
1.页面标题作弊及误导,主要有下面四类:
(1)非公司官网,title中包含“官网”等字样,误导搜索用户认为是官网
(2)页面title中堆砌相近关键词;
(3)页面title中穿插火星文字或者特殊符号,影响正常阅读;
(4) 页面title中穿插受益方式。
2.页面正文内容中存在受益信息,主要包括以下三类问题:
(1)正文内容不完整,频繁穿插变形的受益方式。
具体是指:正文内容为无价值内容的拼接或者正文内容不完整,同时采用“英文字母”、“汉字谐音”、“特殊符合”、“全角符合”等方式代替联系方式,穿插在正文内容中。
举例:5992八⑧⑧⑧
举例:13800138000
1
2
3
4
5
(2)文章的配图图片中存在受益联系方式。
具体是指:图片中联系方式水印面积较大,严重损害浏览体验。
1
(3)正文中商品或者服务信息内容为乱采集、拼接而成、排版混乱、用户从页面中无法获得商品或者服务信息。
1.4 细雨算法2.0——针对B2B领域违规低质内容
2019年11月,百度搜索发布细雨算法2.0,针对B2B行业的恶劣违规问题及低质内容。
细雨算法2.0主要针对以下问题:
1
2
一、恶劣违规内容:
1、页面内容恶劣采集。
如:拼接内容、纯采集内容、跨领域采集内容等。
1
2、发布软文信息。
问题示例:利用小程序页面发布软文,页面标题是“垃圾车厂家哪家好“,内容是品牌软文,对用户产生误导
1
3、发布无法满足用户需求的空白页面,对用户完全无价值。
4、商品信息有误。
如:商品详情、价格等与实际情况不符
1
5、功能不可用。
如:交易、联系电话、查看详情等交互功能不可用等情况。
1
二、低质内容:
1、图片内容低质。
如:图片内容与文字描述不一致、图片嵌入电话号码、图片质量极低影响阅读体验等。
1
2、页面内容低质。
如:页面中只有图片无有效信息,或信息提供不完善等情况。
1
1.5 劲风算法——针对恶意构造聚合页问题
2020年2月,百度搜索发布劲风算法,针对恶意构造聚合页面内容来获取搜索排名的行为。
1
恶劣聚合页问题主要包括以下四种类型:
1、页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。
2、页面内容与标题及页面中标记的标签不符。
3、由网站搜索功能生成的静态搜索结果页。
4、空短、无有效信息、失效的聚合页。
1.6 蓝天算法——严厉打击售卖软文、目录行为
2016年11月,百度搜索推出蓝天算法,持续打击新闻类站点售卖软文、目录的行为,还用户一片搜索蓝天。被“蓝天算法”所覆盖的站点将会被降低其在百度搜索系统中的评价。
1
1.7 极光算法——倡导重视落地页时间规范
2018年5月底,百度搜索上线极光算法,旨在倡导资源方重视网站落地页时间规范。落地页时间因子是百度搜索判断网站收录、展示、排序结果的重要参考依据。
为了让用户获得更满意的搜索浏览体验,百度给予符合落地页时间因子要求且时效性较高的网页更多的收录、展现机会,同时减少不符合规定的网站的展现机会。
详见[百度搜索落地页时间因子规范](https://ziyuan.baidu.com/college/articleinfo?id=2210)
1
2
3
2.用户需求满足
2.1 《百度搜索网页标题规范》——严惩网页标题作弊
2017年9月,百度搜索发布清风算法,严惩网站通过网页标题作弊,欺骗用户并获得点击的行为;从而保证搜索用户体验,促进搜索生态良性发展。
2018年11月,百度搜索针对网页标题作弊行为发布[《百度搜索网页标题规范》](https://ziyuan.baidu.com/college/articleinfo?id=2728),对搜索生态下的网页标题进行了严格的规范和要求。不符合《百度搜索网页标题规范》的站点,将会被清风算法1.0覆盖,受到限制搜索展现的处理。
1
2
2.2 清风算法3.0——规范下载行业欺骗下载、捆绑下载等行为
为了规范下载行业站点的欺骗下载、捆绑下载等伤害用户的行为,百度搜索分别于2018年4月、2018年10月发布清风算法2.0、3.0版本,清风算法覆盖的问题范围从标题作弊行为扩展到下载行业站点的欺骗用户行为。
2018年10月,百度搜索发布[《百度搜索下载站质量规范》](https://ziyuan.baidu.com/college/articleinfo?id=2653),对百度搜索范围内下载站的站点行为进行严格要求和控制。不符合此规范的下载站,将会被清风算法3.0覆盖,受到搜索展现的限制。
1
2
2.3 打击虚假诈骗违法违规信息
为了维护安全健康的搜索生态,保障搜索用户的合法权益,2019年2月,百度搜索发布《关于百度搜索严厉打击虚假诈骗等违法违规信息的公告》,打击电信网络中的虚假诈骗、违法交易、黄赌毒等违法违规信息。
1
百度搜索打击的违法违规信息包括但不限于以下内容:
1.虚假、诈骗类信息:
(1)仿冒政府/企业官网、伪造政府/企业联系方式等,或恶意传播相关虚假信息;
(2)售卖或传播诈骗相关的书籍、手法、工具,宣传不正当获利手段;
2.违法交易类信息:
(1)伪造证件:如伪造驾照、身份证、结婚证、银行卡等;
(2)恶意套现交易:如花呗套现、白条套现等;
(3)学术不端:如代发论文、代写论文等;
(4)私家侦探:不符合国家法律规定,恶意探究他人隐私,侵犯他人隐私权等;
(5)违法贷款:未取得政府认可,进行无抵押贷款、黑户贷款、裸贷等;
(6)违规软件:恶意提供软件破解版、游戏外挂、刷赞/刷粉等作弊工具软件;
(7)违规兼职网赚:发布刷单、打字等欺诈类兼职或违法灰色网赚信息,导致网络用户财产受损;
3.黄赌毒信息:
(1)恶意传播色情淫秽内容或擦边信息;
(2)恶意传播非国家认可的彩种信息,引导大众赌博,如时时彩等;
(3)恶意传播赌博微信群、赌博工具、聚众赌博地点等非法内容。
2.4 信风算法——控制翻页诱导
2019年5月,百度搜索发布信风算法,打击网站利用翻页键诱导用户的行为。
1
信风算法主要针对以下情况:
用户点击翻页键时,自动跳转至网站的其他频道页(如目录页、站外广告页等)。
3.搜索恶意竞争
3.1 惊雷算法2.0——打击流量作弊、超链作弊行为
为了保证搜索用户体验,促进搜索生态良性发展,2017年11月,百度搜索发布惊雷算法,严厉打击刷网站点击的作弊行为。2018年5月,惊雷算法升级至2.0版本。
当前,惊雷算法2.0主要针对“恶意制造作弊超链”和“恶意刷点击”的作弊行为。针对作弊的网站,将会受到限制搜索展现、清洗作弊链接、清洗点击的处理,并会将站点作弊行为计入站点历史,严重者将永久封禁。
1
2
4.网站安全问题
4.1 烽火算法2.0
一直以来,百度搜索对于危害用户隐私、恶意劫持站点的行为态度坚定,一经发现一律严惩。2017年2月,百度搜索发出针对恶意劫持行为的公告:《打击劫持 百度移动搜索推出烽火计划》,严惩恶意劫持的行为。2018年5月,百度搜索上线烽火算法2.0,严惩“窃取用户数据”和“恶意劫持”的行为。
1
烽火算法打击的网站劫持有以下两种表现形式:
跳转劫持:用户点击目标网页后,页面直接跳转至另一页面;
后退劫持:用户完成对某网页的浏览,点击“后退”按钮时出现以下几种情况
(1)无法后退,点击后退时页面无反应,内容无变化;
(2)后退到“假百度页面”,搜索结果出现霸屏现象;
(3)后退到用户之前没有访问过的垃圾、作弊等低质网页。
为了能够更好的执行烽火算法,规定算法观察期如下:
1.站点首次被烽火算法覆盖,百度会通过站内信等方式发出站点问题说明及整改期限要求,未在规定时间内完成整改,将会限制站点在搜索结果中的展现,减少对用户的伤害。站点整改之后,经过算法观察期才可解除搜索展现的限制。
解除限制展现的申请条件:按照要求完成所有劫持问题的整改。
算法观察期:一个月
2.第二次发现站点存在劫持问题,百度将限制搜索结果展现,并同步通知到站点。
解除限制展现的申请条件:按照要求完成所有劫持问题的整改。
算法观察期:三个月
3.第三次及以上发现站点存在劫持问题,永久限制站点展现。
4.2 网站被黑情况
2018年3月,为了保证搜索生态安全,保障用户权益,百度搜索发布《网站被黑操作指南》,引导站点排查被黑情况。
网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面。
1
2
以下是几种网站被黑后可能出现的页面:
● 内容非网站发布,内容中含大量博彩网站指向:
● 网站页面直接跳转到博彩网站:
网站被黑表明网站安全存在严重问题或漏洞。
如何防范网站被黑,请参考以下内容:
首先,自查站点是否被黑
1.通过百度搜索资源平台的“网站体检工具”,可以对网站各项指标进行安全检测,排查网站的安全隐患。
2.被黑网站在数据上有一个特点,即索引量和从搜索引擎带来的流量在短时间内数据异常。所以,站长可以利用百度搜索资源平台的索引量工具,观察站点索引量是否有异常;如果发现数据异常,再通过流量与关键词工具查看获得流量的关键词是否与网站有关、是否涉及博彩和色情;
3.通过Site语法查询站点,结合一些常见的色情、博彩类关键词效果更佳,有可能发现不属于站点的非法页面;
4.由于百度流量巨大,有些被黑行为仅针对百度带来的流量予以跳转,站长很难发现,所以在查看自己站点是否被黑时,一定要从百度搜索结果中点击站点页面,查看是否跳转到了其他站点;
5.站点内容在百度搜索结果中被提示存在风险;
6.后续可以请网站技术人员通过后台数据和程序进一步确认网站是否被黑。
其次,被黑之后如何处理
确认网站被黑后,网站运营人员除了要推动技术人员快速修正外,还需要做一些善后和预防的工作;
1.清理已发现的被黑内容,将被黑页面设置为404死链,并通过百度搜索资源平台的死链提交工具进行提交(我们发现有些站点采用了将被黑页面跳转至首页的做法,非常不可取);
2.网站如有变更页面,建议使用链接提交工具向百度提交变更页面数据;
3.立即停止网站服务,避免用户继续受影响以及影响其他站点;
4.排查出可能的被黑时间,和服务器上的文件修改时间相比对,处理掉黑客上传、修改过的文件;除此之外,技术人员还需要检查服务器中的用户管理设置,确认是否存在异常的变化。注:可以从访问日志中,确定可能的被黑时间。不过黑客可能也修改服务器的访问日志。
5.更改服务器的用户访问密码。
6.做好安全工作,排查网站存在的漏洞,防止再次被黑。
最后,给大家一些网站自我防护的建议:
1.多种安全防护同步进行:适合中小型资讯网站
网站程序勤打补丁:现在很多资讯类网站用的系统使用了内容管理系统(CMS),作为比较常见的内容管理系统(CMS),有一个问题,那就是漏洞比较大众化,因为源码是公开的,所以很容易被研究出漏洞,需要对网站程序及时进行漏洞修复。
2.对服务器进行常规的安全防护
(1)在上班时间之外,对服务器上的网站权限做设置,禁止文件修改,后台文件隐藏或迁移到根目录之外。
(2)参考一些网站的安全设置,非限定的IP不能写入到数据库。
3.不使用开源程序默认的robots文件
下图是一个地级市的资讯类站点的robots文件,从robots文件中可以看出,该网站用的是织梦后台,那黑客就可以通过各种针对织梦攻击的软件进行操作,也可以针对织梦网站的常见漏洞进行扫描和针对性攻击。
4.进行HTTPS改造,强化网站安全
HTTPS主要由有两部分组成:HTTP+ SSL / TLS,也就是在HTTP上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过TLS进行加密,所以传输的数据都是加密后的数据。HTTS复杂的加密机制有效的加大了网站的安全性,加密机制与认证机制可以减少网站被劫持和假冒的风险,建议站长们可以通过做HTTPS改造来强化网站安全。
5.落地页体验问题
5.1 冰桶算法5.0
一直以来,百度搜索致力于提升搜索用户的浏览体验,营造健康的搜索生态。2014年8月22日,百度搜索针对低质页面问题发布冰桶算法,经过不断更新迭代,在2018年11月对冰桶算法进行升级,上线冰桶算法5.0。
1
冰桶算法5.0以《百度移动搜索落地页体验白皮书4.0》为标准,对落地页广告、APP调起、展开全文功能等问题进行控制。
5.2 色情广告问题
2019年1月,百度搜索发布《百度搜索将严厉打击色情低俗广告内容》,对存在色情低俗广告的违规站点严厉打击,对色情低俗广告进行屏蔽过滤,并对涉及违规内容的站点采取永久限制搜索展现的处理。
1
此次打击覆盖的色情低俗广告内容主要指:易对青少年构成负面引导的、危害社会公德或者优秀文化传统的广告内容,包括但不限于以下7种类型:
1.广告内容为推广情色动漫、非法性药品、性病治疗、色情淫秽网站和网上低俗信息的链接、图片、文字等;
2.广告内容传播一夜情、换妻、性虐待等有害信息;
3.广告素材中存在表现或隐晦表现性行为、性暗示,具备挑逗性或者侮辱性的内容;
4.广告素材中存在大部分暴露或描写性器官的内容;
5.广告素材中存在侵犯个人隐私性质的走光、偷拍、漏点等内容;
6.广告素材中存在诱导参与赌博等非法行为的内容;
7.广告标题以庸俗和挑逗性内容吸引点击。
5.3 权限问题
为了让用户快捷地从搜索中获取所需内容,减少用户获取信息的成本,百度搜索于2019年4月发布《百度搜索将严格控制搜索中的权限问题》,上线策略进行严厉打击权限问题。
本次策略主要针对以下2种情形:
1、内容获取权限:
用户查看网页中的全部内容时,如:
· 阅读全文
· 查看图片
· 查看论坛帖子
· 观看视频内容
· 其他内容获取
网站强制用户必须完成指定操作后才可进行查看,包括但不限于以下方式:
· 强制用户完成网站注册或登录
· 强制用户下载相关APP
· 强制用户在APP内查看内容
· 强制用户完成其他要求
2、功能使用权限:
用户使用网页中的功能时,如:
· 查看评论详情
· 查看相关推荐
· 拨打电话
· 内容资源下载
· 使用其他功能
网站强制用户必须完成指定操作后才可进行查看,包括但不限于以下方式:
· 强制用户完成网站注册或登录
· 强制用户下载相关APP
· 强制用户在APP内查看内容
· 强制用户完成其他要求
内容来源参考:https://ziyuan.baidu.com/college/documentinfo?id=2797
本文部分内容来自网络,经由游游SEO整理发布,不代表游游seo博客立场,如有侵权,请联系删除。