
在上一篇文章中我们介绍了网站SEO优化的一些SEO基础知识教程,我们知道了,网站SEO优化我们首先要了解三部分。
详情看这篇文章:SEO优化基础知识介绍
今天我们就从搜索引擎工作原理开始讲解。
上一篇文章中我们讲到,搜索结果从产生到被搜索引擎展现给用户,都需要经过四个过程:抓取,过滤,建立索引和输出结果。
而这个过程是究竟怎么进行的呢?
百度先去域名索引页面,以强尼笔记博客为例,我的域名为www.qiangnibiji.com,百度会爬取到我这个域名,把源码里的所有链接,也就是网页全列出来,进行一个索引。
然后会把这些索引出来的网页,入到一个临时库里面。
为什么叫临时库呢?顾名思义,就是临时的意思,这些索引的页面只是临时索引,并不一定会放出来,需要经过一定的筛选,比如质量,优先级等等。
在临时库里会根据百度规则,过滤一些网页,比如一些不好的网页,不符合规则什么的,就会清理掉。
而符合规则的网页,就会进入索引区,就这样一直进行一个循环工作。
而进入索引区,也就是形成百度快照的第一步,但这个时候虽然形成了百度快照,并不代表,进行搜索的视乎,就能搜索到你的网页。
百度赋予你的快照是由少到多的,不是一蹴而就的。比如索引区一下收录了你几百个网页,但是百度会由少到多,慢慢的给你放出来。
总结一下流程:
通过你的域名,百度蜘蛛前去爬取索引,如果是新网站可以去百度提交一下
索引之后,根据网站的源代码提取站内链接到临时库
在临时库根据网页质量,是否符合规则,以及优先级的筛选,选择是清理还是放回索引区
清理掉垃圾网页,放回索引区形成快照,快照从字面理解就是拍照,代表唯一性。
而快照主要抓取的内容还是从TDK中选取,也就是标题,描述,关键词,这也是网站SEO的三大要素。
而快照也是有多个版本的,百度会根据你的网页是否有变化这样来核对,如果有新的变化,就会形成新的快照,如果没有变化,快照也就不变。
形成快照以后,百度会慢慢放出来,可以从百度搜索展现出来,我们有时候看到快照时间,也就是百度做的一个记录,针对于网页身份标识的记录。