在网站建设的实际应用中,容易出现很多小小的失误,网站的常规http状态码的表现也是一样,Google无法验证网站几种解决办法,提及到由于404状态页面设置不正常,导致了google管理员工具无法验证的情况,当然,影响的不仅仅是这一方面,影响的更是网站的整体浏览效果。因此,比较清楚详细的了解http状态码的具体含义,对于一个网站站长来说,这是很有必要俱备的网站制作基础条件。
HTTP状态码是用以表示网页服务器HTTP响应状态的3位数字代码。它由 RFC2616 规范定义的,并得到RFC2518、RFC2817、RFC2295、RFC2774、RFC2918等规范扩展。HTTP状态码一共分为五类。状态码的第一个数字代表了响应的五种状态之一。304代码是请求的网页与上次比没有更新。意思是蜘蛛来到你的网站,你网站没有更新内容,并且与上次一样,就会返回304代码。如果每次蜘蛛来你的网站都有新的内容出现,就会反回200代码。404(未找到)服务器找不到请求的网页。例如,对于服务器上不存在的网页经常会返回此代码。如果您的网站上没有robots.txt文件,而您在 Google网站管理员工具"诊断"标签的robots.txt页上看到此状态码,则这是正确的状态码。但是,如果您有robots.txt文件而又看到此状态码,则说明您的robots.txt文件可能命名错误或位于错误的位置(该文件应当位于顶级域,名为robots.txt)。
百度蜘蛛第一次抓取一个URL地址的时候,服务器端返回的状态码会是200,同时会记录页面的Last-Modified属性标记,页面最后修改时间可以用之前在Firefox SEO插件里介绍的HttpFox检测,如在第二次百度抓取这个URL的时候,根据HTTP协议,服务器会先传送If-Modified-Since HTTP头信息给访问端,检查此文件有没有修改,如果未被修改则返回内容为空的304状态码节省传输数据量。对于动态页面做缓存加速,首先要在Response的HTTP Header中增加 Last Modified 定义,其次根据Request中的If Modified Since 和被请求内容的更新时间来返回 200 或者 304 。虽然在返回 304 的时候已经做了一次数据库查询,但是可以避免接下来更多的数据库查询,并且没有返回页面内容而只是一个 HTTP Header,从而大大的降低带宽的消耗,对于用户的感觉也是提高。
如果网页自请求者上次请求后再也没有更改过,您应将服务器配置为返回此响应。服务器可以告诉 Googlebot自从上次抓取后网页没有变更,进而节省带宽和开销。HTTP协议,您会发现从服务器返回的HTTP头里面能定义这样一条命令 Cache-Control:no-cach这个就是解决问题的方法,让我来看看该如何通过 IIS配置管理工具来把这条命令添加到每次服务器的HTTP返回头里吧。
第一步:打开 IIS配置管理工具(Internet信息服务(IIS管理器)选中一个网站(如果您想为所有站点配置,请选择点中“网站”那个图标)点“属性”按钮,会弹出一个配置窗口
第二步:选择“HTTP头”TA B标签,然后您会看到自定义 HTTP头”这么一栏。OK就是这里了终于到
第三步:点旁边的添加(D...按钮,来添加上那条命令。
假如某个304响应指明了当前某个实体没有缓存,那么缓存系统必须忽视这个响应,并且重复发送不包含限制条件的请求。假如接收到一个要求更新某个缓存条目的304响应,那么缓存系统必须更新整个条目以反映所有在响应中被更新的字段的值。当百度蜘蛛访问的结果返回了304状态码的话,那么搜索引擎就不会对我们的页面进行再次抓取了。如果一个网站被搜索引擎抓取的次数以及频率越多那么他是越有利于排名的,这个大家都知道,可是大家知道如果你的网站出现太多的304,那么一定会降低搜索引擎的抓取频率以及次数吗?当搜索引擎每次到你网站一看,都没啥变化,那么很可能它对你就不信任了。它就很少来了。这样的结果就是自己的网站排名比别人落后了。