广州SEO-ZSEO工作室专注广州SEO服务,为您提供专业的公司及企业SEO顾问服务。

搜索引擎工作原理详解

SEO技术 ZSEO 472℃ 0评论

为了取得更好的排名,了解搜索引擎工作原理是我们每个SEOer在进行网站优化之前必须了解的必备知识,只有做到知己知彼,方能让我们的网站符合搜索引擎要求,获得更快的收录和更好的排名。

搜索引擎工作原理

一、什么是搜索引擎

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。[1]
  常见的搜索引擎有:谷歌、百度、雅虎、搜狗、有道、必应等。

二、搜索引擎原理分析

搜索引擎从数据获取到展示的过程,主要包含四个步骤:

  1. 抓取
  2. 过滤
  3. 存储索引库
  4. 展示排序

针对这四个步骤,我们逐一进行分析。

1. 抓取

  抓取主要指搜索引擎基于超链接,访问并获取页面内容,再次解析页面中的超链接,进行不断抓取的过程。
    不同的搜索引擎,抓取程序有不同的策略,这个策略可以决定抓取的范围和工作量,也可以决定抓取顺序的先后。

  (1)增量抓取、批量抓取、垂直抓取是常见的能够决定抓取范围的抓取策略。

增量抓取主要是针对页面更新的内容进行抓取,比如站点地图sitemap中更新时间变动或者新增的内容。

批量抓取主要是定量抓取,可以是一个用户按批次提交给搜索引擎的超链接,搜索引擎基于这些超链接进行直接抓取。

垂直抓取主要是针对某个主题进行抓取,抓取过程中出现非本主题的内容,则过滤不抓取。

  (2)深度优先抓取和宽度优先抓取是常见的能够决定抓取顺序的抓取策略。
 

深度优先抓取,主要是针对页面X中的A/B/C/D四个链接,抓取会先抓取A链接,然后解析A链接得到A1/A2/A3三个链接,当它完成对A链接页面内容的抓取之后,它会优先抓取A链接里的A1,而不是页面X中与A链接平级的B链接。

宽度优先抓取,它与深度优先抓取的区别在于,当它完成对A链接页面内容的抓取之后,它会优先抓取页面X中与A链接平级的B链接,直到页面X中的所有链接都抓取完成之后,才会进行下一层级,即A1/A2/A3的抓取。

  对于搜索引擎的抓取,做SEO过程需要注意到,目前Baiduspider只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、图片中的文字,百度无法识别。[2],因此,对于flash和图片,我们需要增加文字描述信息加以辅助,使得搜索引擎更加清晰地了解页面内容。

2. 过滤

  搜索引擎的过滤过程,主要有两种情况:
    一是对低质量内容的过滤,如采集的价值低的内容,文不对题的内容,空洞拼凑的内容。
    二是对以图片、视频、flash等搜索引擎无法识别的内容为主的网页内容,搜索引擎可能会将其当做垃圾内容过滤掉。

  有些站长在做SEO过程中会发现自己发布的文章长时间得不到收录,其中一个原因可能就是因为被过滤掉了。

3. 存储索引库

  存储索引库,顾名思义,是对信息进行有质量提取与组织建立索引库,便于后续的展示以及排序处理。

4. 展示排序

  展示排序是对存入索引数据库中的页面,通过一系列的算法处理后得到每个页面的权重,并将其进行排序处理,追踪通过搜索引擎查询结果的方式展示给搜索查询的用户。

  能让自己的网站得到良好的排名,那么,我们需要做到两点[3]
    (1)完善基础优化
    基础优化主要包括:

1)网站定位

2)网站结构

3)网站布局

4)网站代码

5)网站内容

  (2)综合数据良好
    综合数据主要包括:

1)用户忠诚度

2)站外推广效果


  1. 搜索引擎_百度百科 
  2. 百度搜索引擎优化指南2.0 
  3. SEO研究中心 打造高流量网站优化秘诀 
喜欢 (1)or分享 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址