前几天有个网友问我,他的站只收录首页,根据了解,一般新站刚收录的时候只收录首页是正常的,但是他告诉我他站已经建站一个多月,却还只收录一个首页,然后我site:sd009.cn百度的确收录只有一个首页面。
对他这个站整体看,的确像一个垃圾站点,文字很密集给人的感觉也不是很好,相信用户体验应该也不会太好,据网上的一些资料显示百度对站点的收录把关是越来越严格了,他们现在多垃圾站点的收录可以检查的更加严格,开始我分析是他站采集的数据过多,同事没有原创性造成的百度收录很少,最后他说虽然有采集的,但是很多文章都是原创的,我想如果原创性的文字一般都很吸引蜘蛛的抓取的,那么这这个判断就不完全的。
然后我从他的频道路线转到列表页,以及最终页的过程查看了下,发现他的频道标题“手机短信内容查询 ”在源代码中根本就检查不到,这次是最后百度只收录他站首页不收录其它页面的最终原因。因为他站可能是使用了iframe框架或者JS调用的导航的url在搜索引擎中屏蔽了,这样搜索引擎是完全抓取不到他们的频道页面以及列表页,到最终页面,当然就不会收录其它页面了。
最后我建议这个网友吧对搜索引擎屏蔽的代码给改成正常的,符合搜索引擎抓取的程序。这个事实说明很多做开发的朋友,虽然他们对程序精通,但是往往会忽略到搜索引擎的爱好,有时候可能是为了程序的方便却弄巧成拙,让网站不能更好的被搜索引擎抓取。
下面说下URL对搜索引擎的影响:
还是拿他这个站点说,他站的频道文字很长,因此他选择用的列表页的目录URL是相当长的全拼,这样也是对搜索引擎抓取是很不利的,一般在抓取URL地址最好控制在60个字母以内,例如千雨日语网列表页:www.qianyuriyu.com/html/peixun/ 这只是列表页地址已经有30个字母,如果是最终页地址,还会在列表页后面继续延伸URL字母就会增长,所以在列表的地址时候就不能像他的那个站一样吧吧频道的url设置的超长,否则最终页URL肯定就超过了60个字母的极限,这个是都搜索引擎的抓取不好的。
下面还有一种只收录一个页面的问题:
例如58的频道页面:以北京房产为例:bj.58.com/house.shtml 这页面其实是使用了静态页面转化对搜索引擎抓取是很友好的,这个页面相当是直接用site:去查收录是查不到的,在静态页面我们一般查收录直接把URL地址放到baidu搜索框中回车就可以看到结果,大家可以拿这个频道页面地址去site发现收录只有一个页面对吧!但是这个是使用了静态的转化,其实收录页面是相当可观的,大家可以打开这个房产频道,里面还包含了“租房频道,求租,日租等等小的类表”大家可以再site:/bj.58.com/zufang/ 这个租房列表的百度收录目前显示的3800000篇,数字是相对很大的,而且这个只是房产频道中的一个小类的收录,房产包含了很多这样的小类,加起来的收录才是房产静态地址的总收录数字,是相当可观。
很多朋友做连接的时候都喜欢看收录越多越好,其实在这里大家可以思考下到底房产静态页面做连接好呢?好是类表中的链接的效果更好呢?呵呵 这里我就不多说了,大家可以自己判断的。
大家可以看见,很多网站只收录一个页面,这种静态页面也是收录一个页面,但是意义完全不同的,在这里还有很多类似的站点只收录一个页面的情况,导航站一般收录篇数普遍是比资讯类型的收录少的,这个大家可以到时候评估下。
以上的这些百度只收录首页或者只收录一个页面的问题都是我平时工作的时候遇到过,进行观察给出了相应的诊断和解答,希望更多的SEOer遇到有不同的网站诊断同样的收录问题,可以给徐倩SEO博客留言http://www.hongren.org。