马海祥博客是一个专注于分享SEO优化、网站制作、网络营销和运营思维的自媒体博客!
马海祥博客 > SEO优化 > SEO研究院 > 百度搜索结果展示的基本原理

百度搜索结果展示的基本原理

时间:2013-02-19   文章来源:马海祥博客   访问次数:

我们在百度或者其它搜索引擎上输入一个关键词,点击查询,搜索引擎会从先到后列出大量的结果,看到这些结果,我们常会有疑问:这些结果是怎么来的呢?排序的标准又是什么呢?这个看似简单的问题,却是搜索引擎研究的核心难题之一。

百度搜索结果展示的基本原理-马海祥博客

为了解答这个疑问,马海祥特意写了这篇文章,为大家介绍一下百度搜索结果展示的基本工作原理:

一、页面抓取原理

搜索引擎在抓取到我们网站的前提是必须要有渠道,当你新建一个域名,新建了一个普通页面,页面没有经过任何人的访问,也没有任何地方出现过你的页面,那么搜索引擎是无法正确的抓取到你的页面的,有些页面或网站之所以什么都没有操作,搜索引擎也一样可以抓取和收录,其原因主要是通过以下几个渠道:

1、链接渠道

我们做外链的主要目的是什么,是传递权重还是能够更好的让搜索引擎通过这个链接来抓取我们的站点(具体可查看马海祥博客《外链对网站SEO优化到底有什么作用》的相关介绍)?这是大家都在考虑的一个问题,其实更重要的是让搜索引擎能够通过此链接正确的抓取到我们的网站,这也是SEOER都在说,现在新站建议做外链,老站就没必要的原因之一。

2、提交渠道

80%的站点在建立以后会手动提交到搜索引擎,这是搜索引擎在收录到更多站点的一个重点渠道,当搜索引擎不知道你的站点存在的时候,你提交了你的站点,这就是直接告诉了搜索引擎,你的站点是存在的,值得搜索引擎的收录。

3、浏览器渠道

百度曾报道,360浏览器可根据用户流量的网页进行收集和抓取,也就是说,当用户使用了360浏览器浏览了某一个未被360搜索引擎发现的站点,那么360浏览器将会记录这个网站,然后将这个网站放到搜索引擎去处理,同样,我想百度浏览器也会做类似的事情吧。

二、文章收录原理

一些SEO初学者,刚接触百度收录的时候,总会问:为什么同时发布两篇文章,一篇被收录,还有一篇未收录?为何我在大型网站发布的软文未收录?等等收录问题,其实百度对网站文章收录这一点看的相对严格(具体可查看马海祥博客《百度收录网站文章的现状及原则依据》的相关介绍),所以我们在这一点不能掉以轻心。

当然,收录的原则也没有想象中那么复杂,如果你的网站能够健康的打开,收录基本不是问题,只是时间问题,对于百度搜索引擎的收录工作原理主要有以下3个:

1、对比

当搜索引擎在抓取到你网站的文章页面的时候,会识别你的每一个内页的相同区与不同区,也就是说,你网站的不同区将会被定义为主题内容区域,然后拿着你的主题内容与其他网站的主题内容进行对比,分出你页面主题内容的原创度。

2、分类

通过对你的站点进行对比后,可以直接对你的内容进行分类,如同马海祥博客的一篇关于SEO相关的文章,搜索引擎可直接通过对比来判断,你的网站属于那种类型,是否适合你的站点。

3、用户得分

分类之后,并不是代表搜索引擎就一定会收录你的文章,主要还是要依靠用户的得分,用户的点击率、停留时间判断出此文的价值。

通过以上几点的算法,当文章的综合价值达到搜索引擎的标准值的时候,搜索引擎将会对其网站页面进行收录。

三、页面过滤原理

很多网站页面被百度收录之后,百度认为该页面对用户没有太大的价值,或者是质量度比较低的页面,百度必然就会过滤掉,这也是用户体验好的一种表现。

很多站点以优化为目的,丝毫不考虑用户的体验,例如一些桥页、跳转页面这些就是典型,百度的k站就是一种过滤页面的表现,把那些作弊的站点的页面全部的过滤掉(具体可查看马海祥博客《百度是如何判断网站更有抓取和收录价值的》的相关介绍)。

很多人抱怨百度多次的k站事件,尤其是那些?丝站长们整天在论坛抱怨这个抱怨那个,为什么k你的站,很显然你的站点真的是以用户体验为核心运营站吗?

做SEO的人大多都是为了优化而运营站点,每天写的站内的更新、做外链肯定一部分是为了优化而优化,百度k你的站是牺牲少部分人的利益,更多的用户是从中获益的,要知道每天有上亿人在使用百度,如果搜索出来的信息是你为了优化而运营的站点,低质量的页面,那百度是拿自己未来的前途给你优化站点做铺垫的,所以过滤页面这方面百度非常的严格。

四、页面信息展示原理

一旦搜索引擎抓取到页面,并且进行了收录和过滤后,接下来就需要给用户展示信息了,对此,搜索引擎也需要经过以下2个主要步骤:

1、建立索引

经过了收录页面以及过滤页面的工作之后,百度会对这些页面逐一进行标记和识别,并将这信息进行储存为结构化的数据,储存到百度的搜索的服务器中,这些储存的数据有网页的信息、网页的标题关键词页面描述等标签、网页外链及描述、抓取记录。

还会将网页中的关键词信息进行识别和储存,以便与用户搜索的内容进行匹配,建立完善的索引数据库,方便呈现出最佳的显示信息。

2、显示信息

用户输入的关键词,百度会对其进行一系列复杂的分析,并根据分析的结论在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户,一般显示出的最佳信息,需要关键词匹配最高的相关页面。

五、关键词排名原理

搜索引擎的排名原理是大家最最关心的话题,搜索引擎的排名原理是通过多方面来给出的,不是单一的站内优化做的多好,也不是单一的点击率有多高,而是根据网站的综合得分得出排名,这主要由以下几个点:

1、点击率

从百度站长平台的关键词工具可以看出,当你的网站排名在50页之前的时候,点击率对你的网站有直接影响,这也就是很多网络公司接SEO的单,要求你网站的排名必须是多少的原因之一。

2、体验度

页面的体验度是更具用户的需求来定义的,当用户的重点需求在图片的时候,那么页面的体验度最核心问题就在图片上面,但是这种简单的需求,基本的网站均可满足,重点还需要在简单的需求满足的情况下,在满足其他附加需求。

那么,搜索引擎为何能够知道用户的需求呢?主要原因还是用户在搜索框搜索的内容均被搜索引擎所记录。

当然,遇到同样是图片的站点,排名的好坏还有更多的算法,比如用户在浏览你的图片仅用1秒,而浏览竞争对手的图片用了30秒,这就意味着竞争对手的内容比你做的好,停留时间、PV、跳出率成功了搜索引擎重点考核数据。

3、信用度

信用度的积累可直接让搜索引擎忽略很多细节问题,直接给与排名,这就是我们经常在大站发布的外链软件很容易就获得排名的原理了,一个大型网站,经过与搜索引擎的磨合,早已被搜索引擎加入到了信任用户,所以,后期的软文可以直接让搜索引擎给他一个优势排名。

马海祥博客点评:

搜索引擎是用户和网站之间的桥梁,它起到的永远是传达的作用,用户需要从搜索端获得信息,你可以给搜索端提供信息,只有真正了解搜索端需要什么东西,站长们才能更好的提供信息资源。

对此,马海祥要提醒一下各位站长或SEO人员,要想利用好SEO优化,首先就要了解搜索引擎的习惯,搜索引擎是怎么收录网站的?通过什么算法?哪些内容是搜索引擎乐意展示的?等等,只有把这些基本原理给弄懂了,才能更好的掌握搜索引擎需求,提高网站的整体运营模式。

本文发布于马海祥博客文章,如想转载,请注明原文网址摘自于http://www.mahaixiang.cn/seoyjy/177.html,注明出处;否则,禁止转载;谢谢配合!

相关标签搜索: 百度搜索   搜索结果展示   搜索原理   百度绿萝算法  

上一篇:判断网站被黑的特征表现及解决方法
下一篇:京东商城店铺的搜索排名原理及优化方法汇总

您可能还会对以下这些文章感兴趣!

  • 网站内链是什么?

    内链考验的是网站细节,一个链接、一段代码在SEO优化中可能起不到任何效果,但到100个,200个精准内链的时候,情况就大不同了,你可以通过修改网站的细节,避免网站造成潜在的权重损失。做过SEO的朋友都应该听过这样一句话:“大站做内链,小站做外链”,我们可以理解为……【查看全文

    阅读:2170关键词: 网站内链   内链是什么   什么是内链   内链   日期:2014-07-07
  • 最常用最典型的SEO作弊手段

    作为一名资深SEO工作者,我一直反对SEO作弊行为,始终提倡白帽SEO,因为急功近利采取一些极端的手段,是不可取是要付出巨大代价的,有太多的网站就因为采用了SEO作弊手段而遭到惩罚,最终对SEO这个行业失去的兴起,一个新站想要迅速获得排名,除了积极原创内容,积极提升高质……【查看全文

    阅读:3507关键词: seo   seo手段   日期:2015-11-01
  • 网站运营的八大SEO策略

    一个大型网站的SEO成功,绝不仅仅是依靠单一SEO技术的成功,最重要的还是靠SEO思维策略,并且把这些SEO思维策略融入到网站运营中,才能使其SEO达到最佳的效果!总的来说,SEO策略就通过实践、总结、思考和创新来创造或者组合各种资源来达放大突破SEO效果,区别于SEO技术……【查看全文

    阅读:1666关键词: 网站运营   SEO策略   网站SEO策略   网站SEO   日期:2013-12-27
  • 超链接超文本文档检索系统原理和分析方法

    超文本是用超链接的方法,将各种不同空间的文字信息组织在一起的网状文本。超文本更是一种用户界面范式,用以显示文本及与文本之间相关的内容。一个与根据超链指向的查询索引文档相关,用于检索文档的搜索引擎,它的索引器遍历超文本数据库并寻找包括超链指向的文档地址……【查看全文

    阅读:745关键词: 超链接   超文本   检索原理   日期:2017-02-07
  • 详解搜索引擎的高级搜索语法指令

    作为一名SEOer,我们不但要学SEO的技巧,还要懂得使用一些搜引擎的搜索指令,这些搜索指令普通的用户几乎用不到,但对SEO用来研究竞争对手和查找外部的资源却是非常的有用。一名专业的SEO人员除了在搜索引擎搜索普通的关键词外,还需要使用一些特殊的高级搜索指令来查询……【查看全文

    阅读:3161关键词: 搜索引擎   高级搜索   搜索语法   搜索指令   日期:2014-11-07
  • 影响搜索引擎算法和SEO优化的139个相关因素

    众所周知,网站优化是随着搜索引擎算法的升级不断的探索和寻求效果的优化推广方式,对于网站的SEO优化,也是SEO技术不断提升的一个过程,随着搜索引擎的算法在不断的完善,网站的竞争应该会趋向于网站的内容,网站的内容越好,那么跳出率就不会高,排名也会比较的靠前,……【查看全文

    阅读:907关键词: 搜索引擎   搜索引擎算法   seo优化   seo因素   seo   日期:2014-07-31
  • 什么是长尾关键词?

    网站上非目标关键词但也可以带来搜索流量的关键词,称为长尾关键词。长尾关键词的特征是比较长,往往是2-3个词组成,甚至是短语,存在于内容页面,除了内容页的标题,还存在于内容中。搜索量非常少,并且不稳定。长尾关键词带来的客户,转化为网站产品客户的概率比目标……【查看全文

    阅读:8048关键词: 长尾关键词   关键词   长尾关键词是   关键词是什么   日期:2013-10-12
  • 影响谷歌搜索排名算法的5大趋势

    从2010年开始谷歌的算法调整就非常的频繁,熊猫、企鹅、蜂鸟算法等都是典型的例子,而这些算法都主要是打击那些低质量链接和内容的网站,打击黑帽SEO对互联网带来的不良影响。而那些给用户提供高质量内容的网站将会获得更好的排名,得到更多的访客。这就意味着你的网站需要给……【查看全文

    阅读:526关键词: 谷歌搜索   排名算法   谷歌搜索排名   谷歌搜索算法   日期:2014-05-18
  • 如何通过IIS日志分析网站的隐形信息

    通过IIS日记的记录我们可以更加清楚的分析出搜索引擎蜘蛛在网站上的爬行信息,这些信息包含有蜘蛛的爬行路线以及爬行深度。通过这一些数据信息,我们可以分析近期我们建设的外链效果如何?因为我们知道外链就像是引导蜘蛛爬行的蜘蛛丝,如果外链建设的好的话,蜘蛛爬行……【查看全文

    阅读:1822关键词: iss日志   iss分析   网站分析   iss   网站信息   日期:2014-08-09
  • 史上最全的网站SEO策略方案

    在搜索引擎优化中,一个网站的SEO策略能最终影响到网站未来的优化效果。SEO策略不管对中小网站还是大型网站都是重要的,尤其是对于大型网站,制定一个好的SEO策略就显得尤为重要了。一般的企业网站优化需要考虑的就是排名、长尾、转化率。可是对于大型门户站的seo优化则……【查看全文

    阅读:11545关键词: 网站SEO   SEO策略   SEO方案   SEO   网站SEO策略   SEO策略方案   日期:2013-12-17
↓ 点击查看更多 ↓

互联网更多>>

  • 计算机的开机启动原理 计算机的开机启动原理 计算机从打开电源到开始操作,整个启动可以说是一个非常复杂的过程。总体来说,计算机的整个启动过程分成四个……
  • 移动互联网是什么意思? 移动互联网是什么意思? 移动互联网就是将移动通信和互联网二者结合起来成为一体,是指互联网的技术、平台、商业模式和应用与移动通信……
  • 互联网思维究竟是一种什么样的思维? 互联网思维究竟是一种什么样的思维? 但凡做企业的,不管是创业的还是在互联网冲击下转型升级的传统行业企业家,“互联网思维”已经成为了大家共同……

SEO优化 更多>>

如何以一个用户的角度来做企业门户网站 医疗行业开展品牌推广急需解决的10大问题