设为首页收藏本站

全球主机交流论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
热搜: discuz
查看: 1006|回复: 1
打印 上一主题 下一主题

2014年新站百度不收录解决方法

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
发表于 2014-9-30 10:48:55 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
1.网站模板是套用的模板,没有做任何的布局或者框架改动,很多网络公司为了省时、省力、省钱。直接给客户套用的模板。导致网络重复率过高,百度不喜欢重复率过高的东西。

  解决方法:

  在套用模板的基础上适当的改一下布局,稀释一下网络相似度,能提高收录的成功率。最好的解决方法就是人工设计网站架构。

  2.网站内容过少,网站刚刚制作出来就上线,百度蜘蛛来爬取之后发现没有任何有用的价值。

  解决方法:

  网站制作完先本地测试或者服务器**域名测试,测试无误后开始添加内容,最起码把内容填充满页面之后再解析域名上线,百度蜘蛛再来抓取能抓取到很多内容。能大大的提高收录几率。

  3.robots.txt设置的问题,robots设置了蜘蛛禁止爬取或者你的站内没有robots文件。

  解决方案:查看你站内是否有robots.txt文件,如果没有,那么你制作一个上传。网站必须要有robots文件。

  查看方法直接在你的域名后面输入:域名/robots.txt能打开就是有,打不开就是没有。

  4.有的robots.txt自动屏蔽动态页面,你的内容是动态的所以导致不收录。

  解决方法:

  ①把你的网站生成静态页面,很多程序自带生成静态页面功能。例如:织梦

  ②把robots禁止抓取动态取消掉即可。

  常规robots.txt的相关写法

  User-agent:*这里的*代表的所有的搜索引擎种类,*是一个通配符

  Disallow:/admin/这里定义是禁止爬寻admin目录下面的目录

  Disallow:/require/这里定义是禁止爬寻require目录下面的目录

  Disallow:/ABC/这里定义是禁止爬寻ABC目录下面的目录

  Disallow:/cgi-bin/*.htm禁止访问/cgi-bin/目录下的所有以”.htm”为后缀的URL(包含子目录)。

  Disallow:/*?*禁止访问网站中所有包含问号(?)的网址

  Disallow:/.jpg$禁止抓取网页所有的.jpg格式的图片

  Disallow:/ab/adc.html禁止爬取ab文件夹下面的adc.html文件。

  Allow:/cgi-bin/这里定义是允许爬寻cgi-bin目录下面的目录

  Allow:/tmp这里定义是允许爬寻tmp的整个目录

  Allow:.htm$仅允许访问以”.htm”为后缀的URL。

  Allow:.gif$允许抓取网页和gif格式图片

  Sitemap:网站地图告诉爬虫这个页面是网站地图

  5.你的内容违反百度规定,例如你的站是灰色行业或者黑色行业。百度当然不会让你收录的。

  解决方法:

  利用heimao技术从代码上骗过百度蜘蛛,认为你是正规行业,而客户访问的时候显示的是你要宣传的产品。

  6.以上五点是新站不收录的主要原因,还有很多次要原因是以下:

  ①服务器不稳定:这个不会是影响首页收录的主要因素,服务器不稳定会影响内页的收录。

  ②过多的js代码:百度不喜欢js代码,如果你站内js代码过多,又加上网站不是很讨人喜欢,那么恭喜你。怎么会给你收录。

  ③域名以前被K过:以前被K过的域名短期内是不会被收录的,注册购买域名的时候需谨慎。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏
回复

使用道具 举报

该用户从未签到

沙发
发表于 2014-10-10 12:10:57 | 只看该作者
谢谢分享,搜索引擎还是更喜欢原创的内容。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|Archiver|手机版|中国U网    

GMT+8, 2024-5-3 21:02 , Processed in 0.074912 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表