当前位置:网络推广外包-微信代运营-高端网站建设首选悟空互动5kol.cn企业内容营销服务商覆盖全生命周期 > 新闻资讯 > 悟空百科 >

学seo从了解搜索引擎工作方式开始

2019-08-22 11:07:58 悟空互动
副标题:【

  一个好的seoer,那必需得清楚的知道搜索引擎是如何工作的?用户在搜索一个关键词的时候,搜索引擎都做了哪些工作?本文就此展开。

  济南网络优化公司本文将讲解以下三个方面的内容,带你了解搜索引擎的工作方式:

  抓取

  索引

  查询

  抓取

  下面的这张图,应该用过搜索引擎的人都非常的熟悉。

  我们重点关注的是红框里面的玩意,我们可以看到,搜索“seo”的时候,百度为我们找到了四千多万的结果。那么这些结果是怎么来的呢?

  在您搜索之前,搜索引擎的抓取工具会从数千亿个网页中收集信息,然后在搜索索引中进行整理,最后展现给用户。

  一般的,搜索引擎在你搜索某个关键词之前啊,都会先派一批小弟在互联网中到处的抓取各种类型的网页,只要能抓到都抓了。那抓取的流程是怎么样的呢?

  抓取流程是从以往所抓取内容的网址列表和由网站所有者提供的站点地图开始的。在访问这些网站时,我们的抓取工具会使用网站上的链接来探索其他网页。该软件会特别关注新网站、对现有网站进行的更改以及无效链接。计算机程序会确定要抓取的网站、抓取频率以及要从每个网站中抓取的网页数量。

学seo从了解搜索引擎工作方式开始

  谷歌的抓取流程百度的也差不多。

  那么抓到的网页放在哪里呢?

  肯定的是放在搜索引擎的服务器上面了。一般的只会存放网页的文字信息,至于其它的资源,比如图片、音视频、js、css这些是不做存储的。只会记录相关的信息。

  注:更详细的内容,将会在后续的重学seo系列课程中详细介绍

  那么抓取到内容只会该怎么处理呢?

  索引

  当抓取工具找到一个网页时,我们的系统就会像浏览器一样呈现该网页的内容。我们会记下关键信号(从关键字到网站新鲜度),然后会在 搜索引擎搜索索引中跟踪所有这些内容。

  搜索索引中包含数千亿个网页,其大小远远超过 1 亿千兆字节。它就像图书后部的索引一样 - 编入索引的每个网页上出现的每个字词都对应着一个条目。在将某个网页编入索引时,系统会将该网页分别添加到其包含的所有字词的对应条目中。

  借助知识图谱,我们将继续超越关键字匹配,以更好地了解您关注的人、地点和事物。为此,我们不仅要整理有关网页的信息,还要整理其他类型的信息。如今, 搜索引擎不仅可帮助您搜索大型图书馆内数百万册图书中的内容,查找当地公交公司的线路和车次安排,还可帮助您浏览世界银行等公开来源的数据。

  注:其实在索引之前还是一个分析的步骤,还有做各种其他很多的工作,比如去重,提取正文,链接分析等等。搜索引擎用到的索引技术主要就是倒排索引技术。更详细的内容,且看后面的系列课程。

  接下来,当我们搜索一个关键词的时候,搜索引擎都干了些什么?

  查询

  第一步:分析你的关键词

  理解搜索字词的含义对于返回优质结果至关重要。因此,为了找到包含相关信息的页面,搜索引擎的第一步就是分析您的搜索查询中的字词的含义。搜索引擎创建了语言模型,试图了解应该使用关键词的哪些部分在索引中进行查询。

  这会涉及到看起来如同解析拼写错误一样简单的步骤,并会扩展到通过将自然语言理解方面的部分最新研究成果付诸应用来尝试理解您输入的查询的类型。

  (错别字纠正)

  第二步:与搜索内容相符

  接下来,搜索引擎会寻找包含与相应查询匹配的信息的网页。当您搜索时,在最基本的层面上,搜索算法会在索引中查询您的搜索关键词以找到适当的网页。这些算法会分析相关关键字在某个网页上(不论是在标题中还是在正文中)的出现频率和显示位置。

  当某个网页中包含与您的搜索查询内容相同的关键字时,这是表示搜索到的信息可能与您要查找的内容相关的最基本信号。如果网页或者文本的标题或正文中出现这些关键字,则表示该信息与您要查找的内容相关的可能性更大了。除了简单的关键字匹配之外,搜索引擎还使用经过汇总和匿名化处理的互动数据来评估搜索结果是否与查询内容相关。搜索引擎会将这些数据转换为信号,以协助机器学习系统更好地评估相关性。


原创文章【学seo从了解搜索引擎工作方式开始
本文链接【https://www.5kol.cn/baike/13510.html】
文章版权归悟空互动所有,转载请注明出处和相关链接

标签:学,seo,从,了解,搜索引擎,工作,方式,开始,一个



扫一扫,获取免费方案


相关搜索