马海祥博客是一个专注于分享SEO优化、网站制作、网络营销和运营思维的自媒体博客!
马海祥博客 > SEO优化 > SEO研究院 > 深度解析搜索引擎的原理结构

深度解析搜索引擎的原理结构

时间:2013-08-05   文章来源:www.mahaixiang.cn   访问次数:

对于我们这些做网站优化的来说,如果不懂搜索引擎的原理就来做SEOer,也就相当于说是盲人登山的感觉。所以马海祥觉的只有了解了搜索引擎工作的基础流程与原理,我们才能更好的去针对搜索引擎做出相关优化工作。

搜索引擎(searchengine)也可以说是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。在此,借助马海祥博客的平台,我也来浅谈一下我对搜索引擎原理结构的一些认识

搜索引擎的原理结构框架大概分为三部分,即:数据搜集—>预处理【索引】—>排名。如下图所示:

搜索引擎的原理框架:数据搜集、预处理、排名

一、数据搜集

数据搜集直白的讲,即数据的搜集阶段,将网页从浩如瀚海的互联网世界搜集到自己的数据库中进行存储。搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛(Spider)。搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访问这些网页并抓取文件。搜索引擎通过这些爬虫去爬互联网上的外链,从这个网站爬到另一个网站,去跟踪网页中的链接,访问更多的网页,这个过程就叫爬行。这些新的网址会被存入数据库等待抓取。所以跟踪网页链接是搜索引擎蜘蛛(Spider)发现新网址的最基本的方法。搜索引擎抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。

1、链接跟踪

蜘蛛是顺着链接爬行和抓取页面的。如何快速抓取到对用户来说相对重要的信息以及达到广阔的覆盖无疑是搜索引擎需要重点考虑的问题。由于互联网上无数的网站页面,搜索引擎蜘蛛无法将所有的页面都下载保存到服务器。因此,许多搜索引擎的网络蜘蛛不是所有的页面都抓取的,只是抓取那些重要的网页,而在抓取的时候评价重要性主要的依据是某个网页的链接广泛度及外部链接的数量与质量。所以马海祥觉的在给网站加外链时不要只给首页外链,其他页面也要加(这和外链的随机性也有关)。

2、在抓取网页的时候,搜索引擎蜘蛛一般有两种策略:广度优先和深度优先。

广度优先是指搜索引擎蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让搜索引擎蜘蛛并行处理,提高其抓取速度。

搜索引擎蜘蛛的广度优先策略

深度优先是指搜索引擎蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是搜索引擎蜘蛛在设计的时候比较容易。

搜索引擎蜘蛛的深度优先策略

广度抓取有助于获取到更多的信息,深度抓取有助于得到更全面的信息。搜索引擎蜘蛛在抓取数据时,通常会两种方式都采用,但是想比较来说,广度抓取要多于深度抓取。

这是搜索引擎抓取数据的二大策略,当然其中还夹杂着一些加入了人工智能的策略,比如:

a、热点优先策略:对于爆发式的热点关键词进行优先抓取,而且不需要经过严格的去重和过滤,因为会有新的链接来覆盖以及用户的主动选择。
  b、权威优先策略:搜索引擎会给每个网站分配一个权威度,通过网站历史、网站更新等来确定网站的权威度,优先抓取权威度高的网站链接。
  c、用户点击策略:当大部分搜索一个行业词库内的关键词时,频繁的点击同一个网站的搜索结果,那么搜索引擎会更频繁的抓取这个网站。
  d、历史参考策略:对于保持频繁更新的网站,搜索引擎会对网站建立更新历史,根据更新历史来预估未来的更新量以及确定抓取频率。

3、地址库

为了避免重复爬行和抓取网址,搜索引擎会建立一个地址库,记录已经被发现还没有抓取的页面,以及已经被抓取的页面。地址库中的URL有以下几个来源:

a、人工录入的种子网站。
  b、蜘蛛抓取页面后,从HTML中解析出新的链接URL,与地址库中的数据对比,如果是地址库中没有的网址,就存入待访问地址库。
  c、站长通过搜索引擎网页提交表格提交进来的网址。

蜘蛛按重要性从待访问地址库中提取URL,访问并抓取页面,然后把这个URL从待访问地址库中删除,放进已访问地址库中。大部分主流搜索引擎都提供一个表格,让站长提交网址。不过这些提交来的网址都只是存入地址库而已,是否收录还要看页面重要性如何。搜索引擎所收录的绝大部分页面是蜘蛛自己跟踪链接得到的。可以说提交页面基本上是毫无用处的,搜索引擎更喜欢自己沿着链接发现新页面。

4、文件存储

链接跟踪完毕,需要将跟踪到的信息进行存储。存储的对象,第一是url,第二是页面内容(文件大小、最后一次更新时间、http状态码、页面源代码等等)。

二、预处理【索引】

数据抓取完毕,就需要进行预处理了,一般也叫索引。主要会从提取文字、中文分词、去停止词、消噪、去重、正向索引、倒排索引、链接分析、特殊文件处理等几个方面来进行。

搜索引擎的提取文字、中文分词、去停止词、消噪、去重、正向索引、倒排索引、链接分析、特殊文件等预处理

1、提取文字

这个应该很好理解的,将源代码中的文字提取出来。当然需要注意的是,这里面会包括meta信息以及一些替代文字,除了用户可见的文字信息外,还有代码中的文字信息(例如alt标签)。目前搜索引擎都是以文字为基础。蜘蛛抓取的HTML代码中除了用户在浏览器看到的文字外还有大量HTML格式标签、DIV+CSS标签、JavaScript程序等无法用于排名的内容。所以搜索引擎第一步就是要去除从HTML代码中抓取的标签、程序等,提取可以用于排名处理的页面文字内容。除了可见文字,搜索引擎也会提取一些特殊的包含文字信息的代码,如Meta标签中的文字、alt标签、FLASH文件代替的文字、链接的锚文本等等。

2、分词

中文分词 (Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。我们知道,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂的多、困难的多。分词方法主要包括:基于理解的分词方法、基于字符串匹配的分词方法、基于统计的分词方法。这里就不多说了,分词可以说是搜索引擎最重要的部分。中文分词的框架如下图所示:

中文分词步骤详解

3、去停止词

无论英文还是中文,页面内容中都会有一些出现频率很高,却对内容没有任何影响的词,如“的”、“地”、“得”之类的助词,“啊”、“哈”、“呀”之类的感叹词,“从而”、“以”、“却”之类的介词,这些词被称为停止词,因为它们对页面主要意思没有什么影响。英文中常见的停止词如the,a,an,to,of等。搜索引擎在索引页面之前会去掉这些停止词,使索引数据主题更为突出,减少无谓的计算量。

4、消噪

对搜索引擎来说,并不是网页上的所有部分它都需要抓取,有一些部分对排名计算是没有意义的,比如导航条、版权文字说明、广告等等区块。考虑到搜索引擎需要处理的网页数量非常庞大,这部分无意义内容的绝对量也是非常大的,为了节省计算资源,提升排名计算的速度,搜索引擎在预处理时会将这些内容识别后剔除出去。这个过程就称为消噪。

现在搜索引擎应用的消噪技术可分为三类:基于网页结构的方法,基于模版的方法和基于可视化信息的方法。

A、基于可视化信息的方法:是指利用页面中元素的布局信息,从而能够利用布局信息对页面进行划分,保留页面中间区域,而其它区域则认为是噪音。
  B、基于网页结构的方法:即根据html标签对页面来分区,分出一些页头、导航、正文、广告等等的区块,只抓取正文等重要的部分。
  C、基本模版的方法:指的是从一组网页中提取出相同的模板,而后利用这些模版从网页中抽取有用的信息。

5、SEOer如何人工减噪?

A、搜索引擎会基于可视化信息识别噪音,因此马海祥建议SEO人员在建设网页时应尽量遵循通用的原则,将正文内容安排在页面中间区域,而不要弄一些非常个性化的页面,增加搜索引擎识别噪音的难度。
  B、搜索引擎会基于网页结构识别噪音,因此马海祥建议SEO人员在处理网页结构时建议引入JS代码,将页头、广告、版权声明等内容通过JS调用来实现。当然是一些你不想被抓取的版块,因为这些区块在站内很可能都是重复出现的,特别是广告、版权、评论这些。一旦被收录,很容易造成重复内容堆积,影响整站的内容质量评分。
  C、搜索引擎会基于网页模版识别噪音,因此SEO人员在建设网页时应尽量采用同一套模版,尤其是在改版的时候不要轻易动模版,以帮助搜索引擎识别噪音区块。

6、去重

经过去停顿,去噪之后剩下的词组,已经可以很好的表达出页面的主体意思了。为了便于使得内容不被搜索引擎重复收录,搜索引擎需要一个算法来进行去重处理。比如比较知名且常用的为MD5算法,搜索引擎根据特征关键词计算指纹区分。

7、正向索引

正向索引简称为索引。经过前五步之后,接下来搜索引擎将提取文中关键词,按分词程序划分好的词,同时记录每个词在页面中出现的频率、出现的次数、格式(如加粗、倾斜、黑体、H标签、加颜色、锚文字等)、位置(如页面第一段文字或者最后一段等)。然后把这些词语记录为串关键词集合,那么这些词的相关信息如格式、权重等也会记录在案。实际在搜索引擎中每个关键词也被转换为ID形式记录,然后每个文件ID对应一串关键词ID。这种每个文件ID对应一个串关键词ID这样的数据结构被称之为正向索引。比如文章A对应1、2、3这三个关键词,文章B对应2、4、5这三个关键词。

搜索引擎的正向索引

8、倒排索引

正向索引还不能直接运用到关键词排名,假设用户搜索关键词2,那么搜索引擎讲扫描索引库中所有文件,这样时间太长无法满足用户返回结果的速度,所以这里运用到了倒排索引,把关键词ID映射到文章ID,比如关键词2对应文章A、文章B,如此一来大大缩短搜索引擎扫描索引库中的文件,缩短扫描时间。

9、链接算法

在此阶段,各个页面之间的链接关系也会被搜集。页面中有哪些导入链接,这些链接都指向哪里,哪些链接又指向这个页面,链接用的是URL还是锚文字,这些复杂的链接关系网就形成了页面的链接权重,此时锚文本将被作为重要排名依据,当量广泛的锚文本将被列入计算关键词排名的步骤中。

10、特殊文件的处理

除了HTML 文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如PDF、Word、WPS、XLS、PPT、TXT 文件等,我们在搜索结果中也经常会看到这些文件类型。但搜索引擎目前还不能很好的处理图片、视频、Flash 这类非文字内容,也不能执行脚本和程序。

三、排名

索引文件建立完毕之后,接下来要做的就是排名了。

搜索引擎工作的基础流程与原理

1、搜索词的处理

这一步和前面的预处理一样也要中文分词、去停止词。还要进行指令处理,拼写错误矫正,整合搜索触发等。这个上面基本是一样的。

2、文件匹配

从上面我们看到搜索引擎的蜘蛛是无时无刻的都在爬行和抓取,另外不断对抓取的数据进行整理归纳以及存储。这些过程并不是用户在搜索的时候进行的,而是在搜索之前就预处理好的,真正当用户搜索某个关键词时,搜索引擎只需要在自己的数据库中进行查找,而不是实时的对互联网上所有的网站进行查找。搜索引擎就会在和该关键词对应的所有文件中进行简单的计算和匹配,找到匹配页面。

3、初始子集选择

为了更加快速的满足用户的需要,搜索引擎需要从所有的相关页面中进行选择,只计算权重稍高的页面返回给用户,这个过程就是常说的初始子集的筛选。大家可以试想,当我们搜索某个关键词时,往往包含这个关键词的页面数量是巨大的,甚至几十万、上百万。如果搜索引擎从这么大的数据中进行匹配的话时间显然更长,为了更好的满足用户的需求,实际中搜索引擎只会选择哪些权重高的页面去匹配(大概1000个左右)。

4、相关性计算

(1)、关键词常用程度

经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。举个例子,假设用户输入的搜索词是“马海祥博客”。“博客”这个词常用程度非常高,在很多页面上会出现。它对“马海祥博客”这个搜索词的辨识程度和意义相关度贡献就很小。找出那些包含“博客”这个词的页面,对搜索排名相关性几乎没有什么影响,有太多页面包含“博客”这个词。而“马海祥”这个词常用程度就比较低,对“马海祥博客”这个搜索词的意义贡献要大得多。那些包含“马海祥”这个词的页面,对“马海祥博客”这个搜索词会更为相关。常用词的极致就是停止词,对页面意义完全没有影响。
  所以搜索引擎对搜索词串中的关键词并不是一视同仁地处理,而是根据常用程度进行加权。不常用的词加权系数高,常用词加权系数低,排名算法对不常用的词给予更多关注。我们假设A、B两个页面都各出现“博客”及“马海祥”两个词。但是“博客”这个词在A页面出现于普通文字中,“马海祥”这个词在A页面出现于标题标签中。B页面正相反,“博客”出现在标题标签中,而“马海祥”出现在普通文字中。那么针对“马海祥博客”这个搜索词,A页面将更相关。

(2)、词频及密度

一般认为在没有关键词堆积的情况下,搜索词在页面中出现的次数多,密度越高,说明页面与搜索词越相关。当然这只是一个大致规律,实际情况未必如此,所以相关性计算还有其他因素。出现频率及密度只是因素的一部分,而且重要程度越来越低。

(3)、关键词位置及形式

就像在索引部分中提到的,页面关键词出现的格式和位置都被记录在索引库中。关键词出现在比较重要的位置,如标题标签、黑体、H1等,说明页面与关键词越相关。这一部分就是页面seo所要解决的。

(4)、关键词距离

切分后的关键词完整匹配地出现,说明与搜索词最相关。比如搜索“呼叫中心”时,页面上连续完整出现“呼叫中心”四个字是最相关的。如果“呼叫”和“中心”两个词没有连续匹配出现,出现的距离近一些,也被搜索引擎认为相关性稍微大一些。

(5)、链接分析及页面权重

除了页面本身的因素,页面之间的链接和权重关系也影响关键词的相关性。其中最重要的是锚文字。页面有越多以拽索词为锚文字的导入链接,说明页面的相关性越强。链接分析还包括了链接源页面本身的主题、锚文字周围的文字等。

5、排名过滤及调整,过滤一些作弊等

通过各种算法(例如近期百度的绿萝算法石榴算法)的调整,过滤一些作弊的网站,通过算法规则或人工调整给予违规网站的降权,提取展示优质网站的信息。

6、搜索缓存

搜索引擎的搜索缓存也即cache,是计算机领域非常常用的一种技术,我们最熟悉的,恐怕就是浏览器的缓存。搜索引擎的缓存可以这样简单描述:在高速内存硬件设备开辟一块数据存储区,用来存储搜索用户的查询、索引数据、搜索的中间结果或者最终的搜索结果。缓存的大小是有限度的,不可能无限存储数据。因此搜索引擎会采取缓存更新策略和缓存淘汰策略管理维护缓存区存储的数据。搜索引擎缓存的价值搜索引擎缓存具有两个价值:a、加快响应搜索用户查询的速度,提高搜索用户体验;b、减少搜索引擎后台的计算量,节省计算资源。

7、排名结果显示

根据信息的有效性、原创性、信息的认可度和网站自身权重给予相应的排名显示。并查询及点击日志,对搜索用户的搜索做统计,最后根据该用户搜索习惯给出相应结果。

本文发布于马海祥博客文章,如想转载,请注明原文网址摘自于https://www.mahaixiang.cn/seoyjy/246.html,注明出处;否则,禁止转载;谢谢配合!

相关标签搜索: 搜索引擎   搜索引擎原理   搜索原理结构  

上一篇:Enlister―基于机器学习的百度知道问题推荐系统
下一篇:通过搜索引擎结果页来分析百度近期调整变化意图

您可能还会对以下这些文章感兴趣!

  • 百度排名算法规则及SEO优化要点总结

    做SEO目的其实就是为访客服务,满足用户的需求,想方设法的为了用户提供他们想要看的内容,而不是一味的最求最大利益化,其实百度只是一个展示的平台,只要你有了用户的青睐,你想达到的目标,自然也就水到渠成了,做SEO的核心就是要挖掘用户的力量,只有挖掘用户的力量……【查看全文

    阅读:3006关键词: 百度   百度排名   百度算法   seo优化   日期:2015-12-31
  • 《百度搜索优质内容指南》全文解读

    今日,《百度搜索优质内容指南》在百度搜索学院悄悄地上线了,这是百度近两年,再次重新深度定义什么是百度搜索优质内容,对于SEO人员而言,特别是对于新站长而言,具有非常积极的指导意义,以免造成过多的资源浪费,给予了明确的指导规范的建议。百度搜索2020年全新发布了面向全网内容生产者的《百度搜索优质内容指南》,详细讲述了优质内容的标准,希望给广大内容生产者在生产优质内容时提供参考。关于优质内容的详细标准,请查看以下……【查看全文

    阅读:345关键词: 百度搜索   优质内容   百度指南   日期:2020-04-01
  • SEO链轮是什么?

    SEO链轮(SEO Link Wheels)是从国外引入国内的,一种比较新颖的SEO策略,是一种比较先进的网络营销方式。SEO链轮是指通过在互联网上建立大量的独立站点或是在各大门户网站上开设博客,这些独立站点或是博客群通过单向的、有策略、有计划紧密的链接,并都指向要优化的目标……【查看全文

    阅读:1139关键词: seo   seo链轮   日期:2016-02-24
  • 网站SEO优化的分析诊断报告包含了哪些内容

    SEO优化是针对搜索引擎规则做出优化以提高网站排名为目的的优化手段。其所需时间往往是长久性的,包括从网站域名、服务器、程序选取、网站结构、行业分析、竞争分析而切入的优化过程。而SEO诊断,在时间的要求上恰与其截然相反,所求目的完全与优化过程一致:提高网站友……【查看全文

    阅读:7211关键词: 网站seo   seo优化   seo分析   seo诊断   seo报告   seo   日期:2014-09-15
  • 如何分析网站是否真的被降权惩罚及解决方法

    对于混迹于国内站长圈的朋友来说,每天起早贪黑发外链的网站被百度惩罚似乎在这几年已经是司空见惯的事了,所以很多时候网站流量、排名或者是收录有小幅度波动时,站长都会认为网站又被惩罚了,有到处的去抱怨。其实,很多情况都只是站长自己太过于敏感了而已,网站被百……【查看全文

    阅读:2958关键词: 网站分析   网站被惩罚   网站降权   日期:2014-04-24
  • linux系统或windows+iis系统设置404页面方法

    404页面通常是为用户访问了网站上不存在或已删除的页面,服务器返回404错误页面,告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开,消除用户的疑虑。网站设置404页面后,如果网站出现死链接,搜索引擎蜘蛛爬行这类网址……【查看全文

    阅读:169关键词: 404   linux   系统   window   iis   404页面   日期:2018-11-22
  • 百度索引量下降的原因及解决方法

    作为一名专业的SEO人员,我们很多的时候都在研究站点中有多少页面可以作为搜索候选结果,也就是一个网站的索引量,所谓网站索引量,就是搜索引擎抓取你网站的数量,这能影响到网站收录率,是一个非常重要的SEO因素,索引量是流量的基础,索引量数据的每一个变动都拨动着……【查看全文

    阅读:5771关键词: 百度索引量   百度   索引量   百度索引   日期:2015-05-21
  • 搜索引擎判定相似文章网页的原理

    余弦相似性是指通过测量两个向量内积空间的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是 -1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值……【查看全文

    阅读:1384关键词: 搜索引擎   判定相似文章   相似文章原理   文章判定原理   日期:2013-10-13
  • Google搜索质量小组专业解答的25个SEO问题

    2013年对于众多站长和SEO可以说是最为波折的一年,这一年百度出台了百度绿萝算法、百度石榴算法和百度绿萝算法2.0,而google也相继出台了谷歌EMD算法、熊猫算法、企鹅算法2.0和蜂鸟算法。作为一个站长或SEOer,你是否对这些算法还存在很多的疑惑,尤其对于靠做外贸产品……【查看全文

    阅读:692关键词: Google   Google搜索   搜索质量   解答SEO问题   SEO问题   日期:2013-11-22
  • 百度最新调整后的算法规则

    最近闹得沸沸扬扬的百度6.22和6.28的K站事件到目前已经告一段落了,K站的主要原因已经渐渐明朗,以及百度将会对哪些类型的网站会做降权处理,现在也已经明朗化。针对各大站长漫长的着急等待,以及愤恨的心情,百度目前已经给出了较为明确的答案,那么百度规则和算法调整……【查看全文

    阅读:1586关键词: 百度最新算法   百度算法规则   百度最新调整   日期:2012-08-17
  • 反向链接是什么意思

    反向链接又叫导入链接(Backlinks),外部链接,是指外部网站有你的网址指向你的网站,其实就是在目标文档(网页)内部进行声明,要求目标文档指向自己(网页)的链接,通俗点讲,网页A上有一个链接指向网页B,则网页A上的链接是网页B的反向链接,换言之,常规链接在文……【查看全文

    阅读:2048关键词: 反向链接   日期:2012-08-14
  • 揭秘搜索引擎中的反SEO作弊研究

    从搜索引擎优化服务开始,分析了现在所存在的搜索引擎优化的作弊手段;然后提出了四种方法用来预防、破解作弊,并结合现实总结提出逐级分层审查刮度;最后结合Google搜索引擎,讨论并分析了Google搜索引擎的反作弊方法及其中的PR值算法……【查看全文

    阅读:687关键词: 搜索引擎   反SEO作弊   SEO研究   日期:2012-10-15
  • 落地页体验白皮书5.0解读:如何合理设置展开全文功能

    本文解读文章深度剖析展开全文功能的设置要求。白皮书5.0提到”展开全文的设置必须具有文字标示,且功能实际可用;展开全文功能最多只能出现一次,但不可出现在落地页的首屏内容中(列表页除外);展开全文与广告等引导性内容要设置一定距离间隔,避免干扰用户操作。”如何设置展开全文按钮才更符合用户的体验习惯呢?这篇文章将为你答疑解惑。百度搜索用户研究团队的用户调研发现,搜索用户进入落地页的诉求是浏览页面全部内容,展开……【查看全文

    阅读:115关键词: 落地页   白皮书   展开功能   日期:2020-04-19
  • 落地页体验白皮书5.0解读:什么样的顶部嵌入广告符合体验标准

    《百度APP移动搜索落地页体验白皮书5.0》对页面广告的内容、形式、位置和面积的要求都做出了详细的说明,受到了全网开发者的广泛关注。关于白皮书5.0中最新提出的顶部嵌入广告标准”落地页首屏顶部允许嵌入不超过一屏面积10%的优质广告”,不少开发者对此提出疑问和反馈,本篇文章将对顶部嵌入优质广告要求做出具体解读:落地页首屏顶部允许嵌入优质广告的总体要求如下:面积:顶部嵌入广告面积必须小于首屏面积的10%。标识:广告位上有明……【查看全文

    阅读:89关键词: 落地页   白皮书   广告   广告标准   日期:2020-04-17
  • 网站最新SEO优化公式解析

    网站seo优化公式 SEO=Clock=C1+L2+K3+O4 1、是一个积分符号,C=content,L=link,K=keywords,O=others。SEO就是一个长期的对时间积分过程,内容是核心; 2、C1丰富的内容是第一位的要素,按照原创、伪原创、转载依次排列内容的重要性满足用户体验; 3、L2链接的合理与……【查看全文

    阅读:2119关键词: seo   seo优化公式   网站seo   网站优化   seo公式   日期:2012-08-06
  • 2011-2012年百度历次大更新数据分析

    本篇文章记录了百度从2011年到2012年中旬百度大更新记录的文章。以下数据分析以站长之家官方提供的网站监控分析数据为蓝本,结合优词网等站点观察数据和一些 优秀SEO站长工具和软件的收集,并佐以自己手上二十几个站点作参考进行综合分析,基于统计学分析原理,以大量站……【查看全文

    阅读:636关键词: 百度大更新   数据分析   日期:2012-08-09
  • 百度移动搜索落地页体验白皮书4.0全文解读

    进入移动互联网时代,百度搜索致力于提升搜索用户的浏览体验,营造健康的搜索生态。过去一年中,在百度搜索和全网资源提供者的共同努力下,移动搜索落地页广告问题已经得到了明显的改善。现在,百度搜索发布《百度移动搜索落地页体验白皮书4.0》,旨在继续与各内容生产……【查看全文

    阅读:153关键词: 移动搜索   落地页   白皮书   日期:2018-08-15
  • 基于用户投票的六大排名算法研究

    随着互联网的发展,网站的数量也在随着成倍的增加着,就中国的互联网来说,根据中国互联网信息中心的数据显示,目前中国的网站数量每半年都会以接近10%的数量增长。这些大量的网站涌现,也就意味着我们已进入了信息大爆炸的时代。 而如今用户担心的已不再是信息太少,而……【查看全文

    阅读:4660关键词: 用户投票   排名算法研究   排名算法   用户投票算法   日期:2013-12-28
  • 404 Not Found错误页面的解决方法和注意事项

    404页面就是当用户访问某网站时,点击了错误的链接时,所返回的页面。最常见的出错提示:404 Not Found。其目的就是告诉浏览者其所请求的页面不存在或链接错误,同时引导用户使用网站其他页面而不是关闭窗口离开。错误页面的文字可以自定义,有些网站没有设置404错误页面,或……【查看全文

    阅读:96618关键词: 404页面   404错误   404   日期:2014-02-16
  • 百度快照更新是什么意思?

    最近发现有很多刚入SEO行业的新手对网站seo的技巧有很多的误区,比如网站快照不更新就代表网站被惩罚。关于这个观点我们先看看什么是百度快照,百度快照的作用是什么?我们有该如何让百度快照持续更新呢?快照即为Web Cache,可以翻译为网页缓存,当搜索引擎派出蜘蛛去对网站……【查看全文

    阅读:9777关键词: 百度快照   百度快照更新   快照更新   日期:2014-03-17
↓ 点击查看更多 ↓

互联网更多>>

SEO优化 更多>>

百度冰桶算法4.5:发力打击Landing Page恶劣广告 如何通过IIS日志分析网站的隐形信息