百度通过一个叫做Baiduspider,一般被称为百度蜘蛛的程序抓取互联网上的网页,百度蜘蛛抓取时先分析内容的质量是否有抓取的必要,如果内容质量太低,百度蜘蛛认为没有抓取的必要,那么百度蜘蛛就不抓取该网页,百度蜘蛛认为有必要抓取,百度蜘蛛才会抓取收录,抓取以后存储在百度抓取数据库,百度进一步考核,过滤抓取数据库的内容,会定期删除低质量的内容,这就造成先收录后删除的情况,经过百度处理后建入索引中。

目前Baiduspider只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、图片中的文字,百度无法识别。因此网站重要信息尽量不要放在flash,图片中,应该以文字形式描述。也不要在flash,图片,Javascript等来显示链接,搜索引擎暂时无法识别Flash、图片、Javascript中的内容,这部分内容无法搜索到;仅在flash、Javascript中包含链接指向的网页,百度可能无法收录。

备注:百度建议

1、尽量使用文字,而不要使用flash,图片,js等显示重要内容和链接。

2、如果必须使用flash和图片制作网页,百度建议同时制作一个文字版,并在flash和图片版网页上使用文本链接指向文字版。

3、Ajax等搜索引擎不能识别,因此不要把重要的内容和链接放在里面。

4、不使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃。