网络蜘蛛虽然不是人,但它同样也有范围,很显然,对于浩瀚如海的网络世界来说,网络蜘蛛要想抓取互联网所有的网页几乎是不可能的。从目前公布的数据来看,容量大的搜索引擎也不过只是抓取了其中的40%而已,有很多网页根本无法被收录。因此要想让网络蜘蛛抓到你,让潜在客户能从搜索引擎中找到你的信息,首先就必须先做好网站收录的工作。
笔者一直都认为网络蜘蛛非常人性化,了解了网络蜘蛛的工作原理,就能从如下7个步骤入手,让网页实现收录。
(1) 向百度提交你的网站
这对新网站而言尤其重要。网络蜘蛛也喜欢认识“新朋友”,向百度提交你的网站就好像你在向百度提交你的“名片”一样,让人家记住你。一般情况下,网络蜘蛛会在1~4周的时间内对你的网站做出收录回应。但要注意的是,提交网站时只要提交网站首页就可以了,没必要提交内容网页,因为只要给网络蜘蛛一个开头,它就会自动爬遍每个“角落”。
百度网站提交网址:http://www.baidu.com/serach/url-submit.html
(2) 适度竞价排名
虽然百度收录只与网页价值有关,与竞价排名等商业因素没多大关系。但如果你的网站还未被百度收录,进行竞价排名不失为一种良策,此时网站犹如在“行贿”一样,提醒百度蜘蛛记住你。
(3) 设置友情连接
这里的友情链接是指有“质量”的友情链接,而不是垃圾链接(垃圾链接太多,反而会让百度蜘蛛生厌,有损网络收录)。这个过程犹如从别人的网页搭“桥”过来,在百度蜘蛛收录别人的同时,顺着“桥”会爬到你的网页中。
(4) 给每个网页加上与正文相关的标题
之所以说百度蜘蛛具有人性,其原因是百度只会收录符合用户搜索体验的网页或网站。给每个网页加上标题,无疑就是为了符合用户的阅读习惯,想想你自己阅读内容的时候,是不是往往先看标题是否感兴趣,再决定是否看内容,在这一点上,蜘蛛其实和你一样。
对于网页标题的设置必须保证标题的关键词与正文有关,如果是网站首页,那么标题好是网站的名称或公司的名称。如果是其余页面,标题好是正文内容的提炼。
(5) 设置容易提取的网页形态
网络蜘蛛能抓取下来的网页有html、doc、pdf、图片、多媒体、动态网页及其他格式。这些文件被抓取下来后,需要把这些文件中的文本信息提取出来。相对而言,doc、pdf等文档比HTML、图片、多媒体等文档更容易提取,静态网页比动态网页更容易提取。
(6) 提高网页的质量
百度蜘蛛更喜欢高质量的网页,因此网页内容好是原创性文章。如果是复制的文章很有可能不会被收录。
(7) 经常保持网站更新
经常更新的网站,网络蜘蛛就会经常光顾,而长期不更新的网站,网络蜘蛛的到访就会减少。同时,网站的更新时间好是在工作日的9点到10点之间,这个时候是网络蜘蛛进行重新梳理的佳时间,因为百度收录除了机器收录之外,还有人工收录的方式。
如果上述工作都做了,还是没有被百度收录,建议你也可以发信息到webmaster@baidu.com去询问或者咨询珍岛专业的
SEO工程师。