2012-06-30 07:33:00 来源:博客
蜘蛛,机器人和爬虫是你的朋友。如果要进行SEO,你不只需要喜欢它们,同时你真的需要特意地把它们吸引到你的网站上来。
SEO中,蜘蛛,机器人和爬虫大体上讲的是同一种东西,但是别过分担忧--它们都没有腿和触角。所以,让我们统一用“爬虫”这个词来称呼它们。请牢记,有时你需要吸引这些机器人,或者把你的网站伪装成“蜘蛛诱饵”。这都属于同一个原则。
那么,什么是爬虫,为什么我们要把它请到我的网站上来呢?
爬虫是一种程序,或者是一段自动化的脚本,它在网上不停辛勤奔跑到各个URL上去。爬虫通过它们浏览的网页上面的链接从一个URL爬到另一个URL
当然,网页会变化。有时,网页和网站的变化周期非常短。除此之外,新的网站和网页随时都在快速出现。这也是为什么爬虫始终都在那里不停的爬行,一遍又一遍的浏览网页,并且建立和更新搜索引擎的索引信息。
搜索引擎引库里面的内容是爬虫浏览网页时看到的内容。爬虫所看到的内容可能和一般的访问者看到的大相径庭。如果你想查看爬虫看到的某个网页的内容是什么,你可以使用IE浏览器来访问它,然后按下全选,并浏览复制下来的内容。或者,你可以借助baidu,点击搜索结果下面的“网页快照”链接,就可以看到爬虫最近对这个网页做的快照了。
首先也是最重要的一点是,爬虫将它们爬过的每个页面的字和词组合起来。它们索引文本和链接。当你在搜索框中输入一个搜索词时,搜索引擎尽量精确地找出和搜索词组最匹配的网页。
所以,任何SEO工作的第一步的重要部分都是让爬虫更容易发现和爬行你的网站。如果你的网站没有被爬虫爬过,它们也就不会建立关于你的网站的搜索引擎索引。如果网页没有在索引当中,搜索者也不会在搜索引擎中找到它,以为搜索引擎认为哪个页面根本就不存在。与此同时,搜索者可能找到其他网页,并且很有可能使你的竞争对手的网页。
创建sitemap:建立sitemap是帮助搜素引擎爬虫抓取网站的最简单的方法之一。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。