设为首页收藏本站

全球主机交流论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
热搜: discuz
查看: 731|回复: 0
打印 上一主题 下一主题

影响百度爬虫抓取的因素之服务器的连通性

[复制链接]
  • TA的每日心情
    无聊
    2018-8-7 11:23
  • 签到天数: 1 天

    [LV.1]初来乍到

    跳转到指定楼层
    楼主
    发表于 2016-9-9 11:52:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    第一,服务的稳定 ①如果服务器不稳定会有一个什么样的影响那?如果你的服务器是一个间歇性的,是不稳定的,那么百度这边会有系统进行监控的,一般情况下如果两天持续出现这种问题的话,那么一定在你的网站排名上有一些影响。  ②服务器反复重启。这个问题也要注意,当然这个并不是大问题,所以不过多说。   ③服务器在国外的站点。如果你的服务器在国外,同时连通性也得不到保证的话,不但对排名有一定的影响,同时也会对抓取量也有一定的影响,当然在这里更建议大家,验证百度站长平台,有一些这样的问题,百度会进行站内通知,同时也可以使用抓取诊断工具进行查排。
      
    第二,cdn可访问  对于一些大站来说,一般不会有这个问题,但是对于一些中小型的站点,为了提高访问速度,会使用一些cdn的服务,那么有一个值得注重的问题,就是有一些cdn会区别的对待爬虫和用户,比如对待百度的爬虫或者其他搜索引擎的爬虫会设置一个独立的访问ip,所以会产生一个问题,就是用户和爬虫看到的网页并不一样,所以站点如果使用**服务应该注意一下设置的问题,当然最简单的方式是通过诊断工具,看一下是否可以抓取正常。  还有一种是,cdn直接拒绝对爬虫的访问,比如像百度爬虫去cdn上面拿ip的时候,会返回一个超时的显示,而实质上就是拒绝访问。  
     
    第三,运营商选择 ①地域选择,有很多的中小型站点会照顾不到这一点,很可能会出现北京的用户可以访问,而上海的用户却访问不了。  ②可以把百度爬虫,看成是北京的ip访问。   ③网通电信选择的问题,百度爬虫抓取网页的时候,有可能是网通也有可能是电信,这个是随机的。   
    以上就是影响百度爬虫抓取的因素之服务器的连通性的方面如果贵公司有需要美国/香港服务器的需求可以咨询Q858361387
    美国esited自营机房 ,服务器租用与托管, 无需备案 .专业  1:流媒体  音乐小说  2:网站冗余备份  聊天视频 3:挂站 电影  开vps .一手资源 稳定ip ping.值大约160~180ms G口带宽不限流量 站群可免费分不同A/C段 诚招代理 更有优惠机器上架 期待您的咨可随时小窗口抖动我哦
    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
    收藏收藏
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|小黑屋|Archiver|手机版|中国U网    

    GMT+8, 2024-5-21 09:10 , Processed in 0.068998 second(s), 21 queries .

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表