搜索引擎工作原理

  • A+
所属分类:SEO百科教程视频
一、首先我们来 认识一下什么是搜索引擎?      
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
      常用的索引擎有:百度,360(soso),搜狗,谷歌
      今天我们来说说百度搜索
引擎工作的原理,在国内我们都知道百度是行业老大;所以今天我们就主要说说

百度搜索引擎工作的原理。

    二、那么什么是搜索引擎工作的原理呢?
      1、简单点来说搜索引擎工作的原理就是:抓取--过滤--收录--排序4个过程。

搜索引擎说明

   1)什么是抓取?
   1】抓取就是蜘蛛会浏览你编辑的文章内容。
   2】什么是蜘蛛:互联网各大搜索开发的程序
3】我们怎么知道
蜘蛛来抓取过呢?

   1)首先我们要知道蜘蛛抓取的原理蜘蛛抓取是以代码形式;比如我们右键查看源代码就是蜘蛛抓取的信息如百度。
   2)我们可以利用百度站长工具查看数据(zhanzhang.baidu.com),查看是否有抓取过:如图:

百度站长平台查看

 

以上是我本人站点的蜘蛛抓取平抓取频次,我们可以看到9月25号蜘蛛来抓取过12次;这就是蜘蛛抓取的纪录数据。
3)没有被抓取过哪行我们如何来让他抓取呢?
    我们这里讲一个常见的方法:可以通过人工操作,吸引蜘蛛的抓取网页抓取,链接提交自动,手动都可以,如果备案新站还有扶持特权;如下图:   
百度站长平台查看数据

2、什么叫过滤?哪些数据是会被过滤掉?
   也是最关键的一步,如果你的文章内容有大量和它已经储存的内容重复,它会把你的文章删除;这就是过滤。比如果我们在选水果一样,我们会把不好的丢掉一样。
说到这里我们要讲到一个百度的临时数据库
1)什么叫临时数据库?
就是蜘蛛会把抓取的文章内容放到它的窝里。
   2)
哪些数据是会被过滤掉?

  百度蜘蛛抓取过后有重复纪录的内容,和一些低质量的内容;这些都会让过滤掉。会在百度的临时数据库中删除掉。
   3、什么是收录?
     页面被Baiduspider发现、分析过
   说到收录这哪么我们也要说到另一个索引。
   1)什么叫索引?
   Baiduspider经初步分析后认为有意义,做建库处理也可以这样理解:蜘蛛会把优质的文章做一个排名,(优质的文章是蜘蛛的储存库里没有这些内容,这个文章有很高的可读性,文章质量高,用户点开后展现时间久,百度就会为他做建库处理存处。)哪么收录和索引有什么区别呢?我们看懂这个图就明白了,也可以去百度站长平台(http://zhanzhang.baidu.com/college/articleinfo?id=806)

一张图看懂搜索引擎


      3、什么是排序
排序就是我们的网站页面让百度收录后展现出来,页面在百度的排名。当用户通过关键词搜索问题时,你的文章被搜索到,展现出来的排名。比如下图:

云秀案例
这是本人自己的网站,关键词搜索,找到了百度收录的页面;我们看到是排在第一位的。(这就是排序)
  • 云秀seo的微信
  • 云秀seo的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
湖南株洲云秀SEO

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: