莱芜seo优化专业博客

人无我有,人有我优!

影响网站收录的因素有哪些?

影响网站收录的因素有哪些?在这之前,我们先要分析两个问题:网站收录的定义、网站收录的过程

网站收录的定义

网站收录就是与互联网用户共享网址,网站收录前提是网站首页提交给搜索引擎,蜘蛛才会光顾,每次抓取网页时都会向索引中添加并更新新的网站,站长只需提供顶层网页即可,不必提交各个单独的网页。抓取工具能够找到其他网页。符合相关标准提交的网址,会在1个月内按搜索引擎收录标准被处理。

网站收录的过程

首先,我们需要知道,蜘蛛的排名系统分为三大子系统:抓取系统、收录系统、排序系统。其中前两项系统直接决定了网站页面是否能被搜索引擎收录。搜索引擎蜘蛛爬行的过程是这样的,首先检测网站的robots.txt文件,确定哪些内容禁止抓取,哪些内容允许抓取等信息,确定robots.txt允许爬取之后,进入我们网站的首页,然后通过首页的链接爬取到我们网站中的内容页或者栏目页,之后再通过栏目页到达我们的文章页。如果内容有些价值,进入索引库,等待搜索引擎筛选并收录。了解了收录的原理与过程,接下来就要研究如何收录了。

搜索引擎收录流程图

影响网站收录的十大因素

1.网站打开速度。一个网站的打开速度直接决定着是否能被百度收录,如果你的网站在五秒之内都打不开的话,那么90%的顾客就会放弃等待,关闭你的网站,搜索引擎蜘蛛也是一样,试想一下,一个404页面怎么可能会被百度抓取呢?如果抓取都抓取不到的话,更不要说收录了。

2.内链引导。蜘蛛能通过引导性内链进入当前页面,提高抓取几率。还一个重要因素是引导用户点击,增加搜索引擎对网站的信任度。

3.外链引导。要知道,蜘蛛可以通过页面外链访问本页面。比如如果你有很多友情链接,将会大大增加你网页被抓取的几率。前期外链推广包含QQ群推广、QQ空间推广、邮件推广、软文推广、论坛外链推广、平台信息推广。所有能引导来用户点击的推广都可以,当然一定要是良性的推广。因为有点击就会给予点击权重,而网页是具有一定权重以后才会被收录。

4.robots。robots就像我们家中的门,是进入我们网站访问的第一个文件。如果robots文件设置错误,会导致蜘蛛无法抓取相应的链接。

5.页面内容质量。百度是最讨厌无价值页面、欺骗页面等低质量页面的,一般这些页面不会被收录,即使被收录,但是很可能不会有排名。

6.目录层级。如果目录层级过深,会造成蜘蛛抓取困难。

7.网站权重。网站权重是搜索引擎对这个网站信任度的一个体现,如果网站的权重够高,那么搜索引擎抓取的也相应的会比较及时,反之则是网站权重低,搜索引擎对其信任度不高,也许蜘蛛会很久来访问网站一次,相应的抓取频率就很低了。

8.网站地图(sitemap)。网站地图是将网站的所有连接,最直观的反应给搜索引擎,可以提高搜素引擎的抓取效率,同时也为增加网站的收录提供了良好的帮助。

9.内容的原创性。前面有说到原创的内容一定会被收录,只不过是时间的问题而已,不论哪个搜素引擎,都是喜欢原创的内容,网站内容的原创性直接关系到搜索引擎对你网站的信任度,信任度又可以通过权重这个参考来反应出来,所以,网站内容的原创性是网站优化的重中之重。

10.nofollow标签的合理使用。nofollow是一个HTML标签的属性值。这个标签的意义是告诉搜索引擎”不要追踪此网页上的链接”或”不要追踪此特定链接。那么我们所要做的就是,用nofollow来屏蔽掉网站页面重复出现的链接以及对seo没有很高价值的页面,以减少网站权重的分散,并且可以减少搜索引擎重复抓取网站内每个页面的重复链接,以提高搜索引擎抓取效率。

只要做到以上十点没问题,那收录就指日可待了。事实上,收录就是那么简单。只要稍微注意一下这些影响网站收录的因素,收录就没什么大问题了。

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注