尽管Google的爬虫的功能越来越强大,但直至目前,它都没有办法像人类那样,能很好地识别视频或Flash动画里的内容。即使对于JS代码,Googlebot也只具有初步的分析能力。用Google的话来形容,那就是Googlebot没有眼睛,它暂时还无法"看"视觉媒体的内容。除了视频外,Flash动画也是网站的常见内容之一。为了让网站能更好地被Googlebot分析及抓取,Google今天向网站管理员及设计者提出了一些建议。
我们先来看一下Googlebot是怎样处理Flash的。Googlebot可以读取Flash文件中的文本及链接,但却无法识别Flash的结构及元素关联性。此外,由于有时候一些文本内容会被做成图像成为Flash的一部分,但Googlebot当前并没有相关的算法去读取这些图像,因此这些文本内容(可能是重要的关键词)就会被Googlebot错过。换言之,即使Googlebot已经成功地将你的Flash文件索引至搜索数据库里,但由于上述原因,Google可能无法识别其中的文字、内容及链接。更糟的是,其它搜索引擎的爬虫对Flash的识别能力还比Googlebot更差。这说明了当你将一些重要的内容做成Flash动画时,这些重要内容很可能无法被Google等搜索引擎识别,失去了获得最佳排名的机会。
为了避免这种情况的出现,Google提出了一些很实用的建议,以使网站在使用Flash时仍然可以将其搜索引擎友好度的损失降至最低:
1.最重要的原则:永远对Googlebot及网站读者返回相同的内容,否则你的网站可能会被判定为作弊。
2.只在必要的时候才使用Flash。只使用Flash作为多媒体表现手段,而网站(页)的主要内容及导航系统仍然以文本为主。如果你不清楚该怎样做,YouTube就是一个极佳的例子。这些不仅使得网站对Googlebot更友好,你的网站内容也更容易被更多的读者获取,包括视障人士在内,因为他们通常会使用读屏器。此外,一些上网速度较慢或正在使用非标准浏览器的读者也可以阅读你的网站内容,因为他们可能略过Flash内容。
3.使用sIFR技术。这样网站的主要内容及导航系统依然基于HTML,无法浏览Flash的读者也可阅读你的网站。
4.提供网站的非Flash版本。比如当你在网站首页里使用一个Flash动画作为欢迎页,请务必在Flash动画之外的地方提供一个HTML链接,并指向网站的非Flash版本,这样读者即使没有安装Flash插件,也可轻松地阅读你的网站内容。
当然,严格地说,无法像抓取和分析文本那样对Flash进行相同的处理,是Google的错,因为技术还不到家。但目前的搜索技术也只能到这种地步了,所以我们只有在设计或更新网站的时候,尽量采纳Google的建议,这样才有利于网站的收录及排名。其实就和图片内容差不多,我们在网页里插入图片或Flash动画时,应该尽可能扼要地将它们的主要内容用文字写一下,这样即使Googlebot无视它们,也能从你的文字描述里了解它们的大概内容。