加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

站点抓取异常存在的几个情况

发布时间:2022-01-15 16:38:27 所属栏目:优化 来源:互联网
导读:1、典型的抓取异常情况 情况一:404页面 站点抓取异常存在的几种情况_www.cuoXin.com 协议死链,用户已无法访问该页面内容,建议通过百度站长平台--死链工具提交死链的方式进行处理,以便搜索引擎更快地发现死链,减少死链对用户以及搜索引擎造成的负面影
  1、典型的抓取异常情况
 
  情况一:404页面
 
  站点抓取异常存在的几种情况_www.cuoXin.com
 
 
  协议死链,用户已无法访问该页面内容,建议通过百度站长平台--死链工具提交死链的方式进行处理,以便搜索引擎更快地发现死链,减少死链对用户以及搜索引擎造成的负面影响。
 
  情况二:IP禁封
 
  限制网络出口IP地址,禁止该IP段的使用者进行内容访问,即为IP禁封。请检查系统服务器是否设置了针对百度spider的IP禁封规则。
 
  情况三:UA禁封
 
  UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份,当网站针对指定UA的访问返回异常页面(如403,500)或跳转到其他页面的情况,即为UA禁封。请检查系统服务器是否设置了针对百度spider的UA禁封规则。
 
  情况四:其他
 
  JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
 
  针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。
 
  针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。
 
  压力过大引起的偶然禁封:百度会根据站点的规模,访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“ServiceUnavailable”),这样百度spider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!