搜索引擎原理详细解析

我们通过百度站长平台做好站点验证提交网址后搜索引擎蜘蛛会来抓取爬行站点,然后对抓取信息进行审查,过滤,整理等过程,判断网页是否合格,给网页进行打分,从而给到一个排名,流程大致分为三个阶段,抓取,收录,排名。

 

搜索引擎工作原理

 

第一、抓取
蜘蛛从数据库出发,抓取已经收录的页面,发现收录的页面有你的链接就会顺着链接爬行到你的网站,这就是发外链的好处,不过外链不是随便发,导致诸多垃圾外链并没有任何用处,这个咱们以后再说,蜘蛛抓取存档录入地址库,这是一个抓取过程,比如说你在新浪博客发布过一篇文章,文章中有你的链接地址,蜘蛛爬行新浪博客文章时就会发现你的链接地址,这样解释起来会更容易理解。

 

第二、收录
百度蜘蛛或者其他搜索引擎蜘蛛爬行你链接经过预处理,会对您的网页进行收录,收录过后并不代表有排名,可能会是在前十页,也有可能翻遍页数都找不到你的网站,收录的关键点在于你网站的权重提升,百度或者360搜狗对你的信任度,做好优质健康的内容是最为重要的,原理很简单,做搜索引擎喜欢的事,避开搜索引擎不喜欢的事。

 

第三、排名
展现有限的页面为760页,你的网站能在这760页排名到哪个阶段?通过预处理使用算法把优质内容展现出来,给出一个排名次序,给出排名如果不太理想不要灰心也不要气馁,用心检查问题到底出在哪里,哪里不足就去优化不足之处,是外链发的不多,没法吸引蜘蛛来抓取,还是有页面死链接,没有做301跳转还是404页面没做,排名不好的原因很多种,所以说做seo做的就是细节,细节做到位了,排名也就有了。

 

搜索引擎的工作原理


搜索引擎工作原理-预处理:
1.提取文字:去除代码,留取文字,蜘蛛抓取代码时会把代码去除掉,只留下源码中的文字。


2.中文分词:做分词处理,搜索引擎如何判断你源码中文字是什么意思呢?第一种方法就是基于词典分词,第二种方法就是基于统计分词,词典分词的意思是通过词典有的词分成一个个的词语,而统计分词的意思就是从前没有过的词突然很多人搜索,这个关键词就会当成一个词,放到搜索引擎词典里方便去分词。
 

3.去停止词:把诸如的、呀、啊之类的词汇去掉,留下名词,以名词为主,举个栗子:搜索引擎的原理,就会把的给去掉,留下搜索引擎和原理二个词
 

4.消除噪声:各页面的重复内容(头部,尾部,分类),像是栏目中分类页下的标题和文章标题去除重复的部分。
 

5.去重:识别出伪原创内容和复制内容,当搜索引擎识别出你的文章内容是抄袭的内容就可能不会进行收录,重新放到数据库当中,当做备胎,像极了爱情。
 

6.正向索引,通过文件找词,例如:通过某一个网址,找其中的内容,也就是说通过一个链接查找到当中的关键词,搜索引擎发现页面当中包含关键词就会把链接放到其关键词数据库中。
 

7.倒排索引,通过词找文件,例如:通过关键词,找到某网页,也就是说你有abc三个页面,a,b页面包含关键词,c页面没有包含关键词,ab页面就会放到关键词的数据库中。
 

8.链接关系计算:
1.导入链接:从其他页面指向你网站的链接,通俗的讲就是反链。
2.导出链接,从你页面指向别人页面的链接,和导入链接的意思相反。
3.锚文本,假如你的锚文本的文字是seo,很多网站都以seo锚文本文字指向你的网站就是对搜索引擎说你seo领域比较优秀,信任投票的意思。


9.质量判断,通过百度或者其他搜索引擎自身的算法对网页质量进行打分判断,也就到了考试分数的评定时刻了。

 

 

首页    seo技术    搜索引擎原理详细解析
1
3
2
4
5
6

网站优化

1
3
2
4
5
6

网络营销

浏览量:0

添加课程免费领取价值1888元推广引流课程与seo技术教程!

客服微信:yxch6688    客服QQ:1140334455

 

创建时间:2019-09-27 00:08

本文为陈晨网络营销研究学院原创文章,如需转载请注明原文地址与出处,感谢大家的支持与厚爱!