Google收录页面也有自己的一套的算法,从不同时期不同网站的特点,可以大致推断与以下几个因素有关:
1、网站页面的数量,特别是静态页面的数量。我的一个电子商务网站,有一段时间google只收录了98页。后来应公司要求,在网站上添加了很多“外购产品”,结果收录数量增加到504页。(注:外购产品指的不是本公司生产的产品,是公司从其它生产厂家买进来再放到网站上卖的“产品”。)
要点1:可以理解为:增加网站网页得绝对数量有利于google收录。这还可以从另外一个方面理解,大家知道,任何一个搜索引擎在收录一个网站得时候,绝对不会把网站得所有页面都收进去,这里面有一个百分比,有些搜索引擎只收录网站首页,Google通常可以收录30~40%,(如果网站得pr值高一些,可能收录得更多),这30~40%应该是google 通过对网站链接等因素计算出来相对比较重要的页面,而这里面很有可能考虑到了整个网站的页面数量。所以增加网站的页面数量有利于被google收录更多的网页。
2、网站的google site map。这一点我觉的效果相当明显。4月份我接手1个新网站(就是上面那个),没有做sitemap前收录504页,做了一个sitemap传上去不久,发现被收录了8840个页面,后来便维持在10200个左右。这里有个问题要说一下:制作sitemap 的参数(如更新频率等)一定要设正确;制作sitemap前网站上的死链尽量清除掉,网站界面尽可能看起来专业一些,还有首页面不要超过50k.
3、网站的外部链接。如果前面两点你觉的参考价值不大,就留意一下这一点。这并不是要你去做大量的外部链接。而是要你有选择的做链接。大家知道,Google是根据链接来抓取网页和分析各网页之间的相对重要性的(重要的可能就被收录了,不重要的google就会丢再一边),怎样看出该网页的重要性呢,google通常参考的参数是:该页面被别的网页引用的次数。被引用的越多,说明实用价值更大,(由于网站上几乎所有的页面都有返回首页的链接,所以网站的首页在一个网站中具有不可动摇的中心地位,搜索引擎如果收录你网站,绝对不会忘了首页)由此给我们可以得到几个增加部分页面重要性的办法:A:外部链接链向二级或者三级页面(有的搜索引擎只会爬行网页的url前三级,链接到二级页面就可以让它多往下爬一级)B:外部链接链向你认为重要的页面(而不仅仅是首页)。
4、网站的内部链接。原理同上,网站的内部链接没有规律,或者不够多,google会给网站的整体质量打低分。
5、网站在外的“露脸”次数:这一点指的是你网站网页被别人引用的次数。如果你的网站被其它多个网站多次引用,即使是一个新网站,搜索引擎也会重新认识你网站的价值。
6、首页问题。这个问题是我昨天对比多个网站得出来的:要想让搜索引擎收录某一个页面,一是把这个页面放在比较“浅”的深度(如url 二级),二是要想办法“创造渠道”让搜索蜘蛛多爬行几次。从这一点看,我们要想让它收录很多个页面,就可以采用以下办法:A、首页上放置尽量多的链接 B首页上放置部分本站url最深的链接(举个例子:假设某个网站的url深度为5级,分别为1、2、3、4、5,其中首页为url第1级,如果某个搜索引擎的爬行深度为3级,即1,2,3级有可能被收录,第4级就不可能收录。如果我们在首页上放置第6级的链接,那么蜘蛛就会爬行1,6,5级,即第6,5级可能被收录,同样的道理如果我们要想第4级被收录,可以在首页上放置第3级或第5级的链接)