马海祥博客是一个专注于分享SEO优化、网站制作、网络营销和运营思维的自媒体博客!
马海祥博客 > SEO优化 > SEO研究院 > 如何通过IIS日志分析网站的隐形信息

如何通过IIS日志分析网站的隐形信息

时间:2014-08-09   文章来源:马海祥博客   访问次数:

在网站的SEO优化过程中,并不是说所有的站点问题都可以直接从站长工具上得到信息,在马海祥看来,往往站长工具上得到的信息都是在站点出现问题后才能察觉到。

作为一名SEOer,我们更需要学会如何查看网站的隐性信息,例如,这几天做的外链效果怎样?我们的内容那些方面更加容易受到搜索引擎蜘蛛的喜爱?搜索引擎蜘蛛对于我们站点的爬行积极度如何?……,这些都是隐藏在站点内部的一些关键信息。

虽说这些信息通过站长工具很难分析出来什么结果,可这些信息恰恰可以从我们的站点IIS日志上找到答案,那么,我们该如何通过IIS日志分析网站的隐形信息呢?

如何通过IIS日志分析网站的隐形信息-马海祥博客

一、为何IIS日志在分析站点隐性信息中如此重要

1、通过IIS日记的记录我们可以更加清楚的分析出搜索引擎蜘蛛在网站上的爬行信息,这些信息包含有蜘蛛的爬行路线以及爬行深度。

通过这一些数据信息,我们可以分析近期我们建设的外链效果如何?因为我们知道外链就像是引导蜘蛛爬行的蜘蛛丝,如果外链建设的好的话,蜘蛛爬行的自然而然频繁,而且我们可以记录下从哪一个“入口”进入蜘蛛的频率高。

2、网站的内容更新与蜘蛛爬行存在一定的关系,一般只要我们更新稳定频繁,蜘蛛的就会爬行得更加的勤,对此,马海祥建议你可以借助日志中的蜘蛛来访频率对网站内容的更新频率做一个细调。

3、通过日志我们可以发现空间存在的一些故障,这些故障可能是一些站长工具无法察觉到的。

比如曾经很火的美橙空间因为技术员误操作robots文件导致空间屏蔽了百度了蜘蛛事件(正确写法可参考一下马海祥博客的《robots协议文件的写法及语法属性解释》相关介绍),假如站长们事先分析一下分析一下空间日志,或许可以发现这一错误。

二、如何获得日志文件以及应注意的事项

1、IIS日志,它是一个文件文件,扩展名为.log,在默认状态下,服务器每天都会在这些目录下创建日志文件,并用日期给日志文件命名(例如,exYYMMDD.log)。我们查看他的方法很简单,就是将其从FTP中下载下来,然后放到桌面,用记事本文件就可以打开了。

2、要获得该日志文件我们的空间需要有iis日志记录的功能,假如我们的空间有这一功能的话,一般该日志文件会记录在weblog或Logfiles文件夹中,有的也叫log文件夹中,我们可以直接从这一文件夹中下载我们站点的日志文件。

3、在使用这一功能时我们需要注意日志的生成时间设置,马海祥的建议是如果站点是一个小型的站点可以让它一天生成一次,假如是比较大的站点我们可以让其每小时更新,以免生成的文件出现过大的情况。

三、如何分析解读蜘蛛行为

那找到并下载了IIS日志文件,这个时候我们该怎么查看呢?有些朋友会抱怨不知道怎么去查看,看不懂代码,不知道如何去分析,事实上IIS的日志代码分析很简单的,都是一些固定的东西,接下来,马海祥就为你简单的介绍一下:

1、如何查看IIS日志文件?

我们可以记事本的方式打开我们站点的日志文件,使用记事本的搜索功能搜索百度和谷歌的蜘蛛,分别是BaiduSpider和Googlebot(更多的搜索引擎蜘蛛标识可通过马海祥博客的《解读IIS日志中搜索引擎蜘蛛名称代码及爬寻返回代码》相关介绍来查询)。

(1)、查看百度蜘蛛的记录

如何通过IIS日志分析网站的隐形信息-马海祥博客

(2)、查看谷歌蜘蛛的记录

如何通过IIS日志分析网站的隐形信息-马海祥博客

我们可以分段对这个IIS日志进行分析:

2012-04-5 00:47:10 是在这一个事件点蜘蛛爬进了我们的站点。

116.255.169.37 这个ip是指我们的站点。

GET紧跟其后的就是蜘蛛爬行的页面,从这边我们可以了解近期我们的什么页面被爬行过。

200 0 0代表的是网页正常的状态码,当然还有其他不同数值的状态码,如500表示服务器超时等等。我们可以借由这些状态码来分析站点空间近来的表现情况。

220.187.51.144这一IP搜索引擎蜘蛛的ip地址,当然这边就可能会出现真假两种地址。

2、如何识别这一个地址是真的蜘蛛还是伪装的呢?

马海祥也为大家分享一个自己的小方法,我们可以打开命令窗口,在窗口中执行nslookup+这一个所谓蜘蛛的地址。加入是货真价实的蜘蛛,那么就会有自己的服务器,反之则是无法找到信息。

(1)、真蜘蛛

如何通过IIS日志分析网站的隐形信息-马海祥博客

(2)、假蜘蛛

如何通过IIS日志分析网站的隐形信息-马海祥博客

3、为什么IIS日志中会有伪造的蜘蛛呢?

原因就是有其他站点伪造成假蜘蛛来爬行抓取你的站点内容,如果任由这些假蜘蛛横行的话,会对站点的服务器消耗造成一定的影响(具体可查看马海祥博客的《抓取网站的搜索引擎蜘蛛是不是越多越好》相关介绍)。

对此,我们需要通过一些方法找到并屏蔽他们,当然我们还需要细心处理,否则把真蜘蛛拒之门外就不好了!

最后,我们可以分析日志文件中蜘蛛最常光顾的几个页面,记录下来,并且找到为何会受到蜘蛛青睐的内外部原因。

马海祥博客点评:

作为SEO或站长,大多数人可能比较熟悉那些直观的数据,如:流量、收录、反链等等的数据分析,对于日志文件的分析可能较为生疏。

但IIS日志对于网站优化分析却至关重要,查看网站IIS日志可让我们知道网站的死链接,404,301,502等等,可让我们知道网站那些链接是搜索引擎经常爬取的?每天那些页面是被搜索引擎爬取过?也可以用于分析网站为什么不收录?或者网站快照为什么不更新?隐藏在站点内部的一些关键信息。

本文发布于马海祥博客文章,如想转载,请注明原文网址摘自于http://www.mahaixiang.cn/seoyjy/733.html,注明出处;否则,禁止转载;谢谢配合!

相关标签搜索: 网站分析   iss日志   iss   网站信息   iss分析  

上一篇:抓取网站的搜索引擎蜘蛛是不是越多越好
下一篇:深度解读百度搜索引擎网页质量白皮书

您可能还会对以下这些文章感兴趣!

  • 网站内链是什么?

    内链考验的是网站细节,一个链接、一段代码在SEO优化中可能起不到任何效果,但到100个,200个精准内链的时候,情况就大不同了,你可以通过修改网站的细节,避免网站造成潜在的权重损失。做过SEO的朋友都应该听过这样一句话:“大站做内链,小站做外链”,我们可以理解为……【查看全文

    阅读:2170关键词: 网站内链   内链是什么   什么是内链   内链   日期:2014-07-07
  • 影响搜索引擎算法和SEO优化的139个相关因素

    众所周知,网站优化是随着搜索引擎算法的升级不断的探索和寻求效果的优化推广方式,对于网站的SEO优化,也是SEO技术不断提升的一个过程,随着搜索引擎的算法在不断的完善,网站的竞争应该会趋向于网站的内容,网站的内容越好,那么跳出率就不会高,排名也会比较的靠前,……【查看全文

    阅读:907关键词: 搜索引擎   搜索引擎算法   seo优化   seo因素   seo   日期:2014-07-31
  • 详解搜索引擎的高级搜索语法指令

    作为一名SEOer,我们不但要学SEO的技巧,还要懂得使用一些搜引擎的搜索指令,这些搜索指令普通的用户几乎用不到,但对SEO用来研究竞争对手和查找外部的资源却是非常的有用。一名专业的SEO人员除了在搜索引擎搜索普通的关键词外,还需要使用一些特殊的高级搜索指令来查询……【查看全文

    阅读:3161关键词: 搜索引擎   高级搜索   搜索语法   搜索指令   日期:2014-11-07
  • 如何通过IIS日志分析网站的隐形信息

    通过IIS日记的记录我们可以更加清楚的分析出搜索引擎蜘蛛在网站上的爬行信息,这些信息包含有蜘蛛的爬行路线以及爬行深度。通过这一些数据信息,我们可以分析近期我们建设的外链效果如何?因为我们知道外链就像是引导蜘蛛爬行的蜘蛛丝,如果外链建设的好的话,蜘蛛爬行……【查看全文

    阅读:1822关键词: iss日志   iss分析   网站分析   iss   网站信息   日期:2014-08-09
  • 网站运营的八大SEO策略

    一个大型网站的SEO成功,绝不仅仅是依靠单一SEO技术的成功,最重要的还是靠SEO思维策略,并且把这些SEO思维策略融入到网站运营中,才能使其SEO达到最佳的效果!总的来说,SEO策略就通过实践、总结、思考和创新来创造或者组合各种资源来达放大突破SEO效果,区别于SEO技术……【查看全文

    阅读:1666关键词: 网站运营   SEO策略   网站SEO策略   网站SEO   日期:2013-12-27
  • 什么是长尾关键词?

    网站上非目标关键词但也可以带来搜索流量的关键词,称为长尾关键词。长尾关键词的特征是比较长,往往是2-3个词组成,甚至是短语,存在于内容页面,除了内容页的标题,还存在于内容中。搜索量非常少,并且不稳定。长尾关键词带来的客户,转化为网站产品客户的概率比目标……【查看全文

    阅读:8048关键词: 长尾关键词   关键词   长尾关键词是   关键词是什么   日期:2013-10-12
  • 史上最全的网站SEO策略方案

    在搜索引擎优化中,一个网站的SEO策略能最终影响到网站未来的优化效果。SEO策略不管对中小网站还是大型网站都是重要的,尤其是对于大型网站,制定一个好的SEO策略就显得尤为重要了。一般的企业网站优化需要考虑的就是排名、长尾、转化率。可是对于大型门户站的seo优化则……【查看全文

    阅读:11545关键词: 网站SEO   SEO策略   SEO方案   SEO   网站SEO策略   SEO策略方案   日期:2013-12-17
  • 超链接超文本文档检索系统原理和分析方法

    超文本是用超链接的方法,将各种不同空间的文字信息组织在一起的网状文本。超文本更是一种用户界面范式,用以显示文本及与文本之间相关的内容。一个与根据超链指向的查询索引文档相关,用于检索文档的搜索引擎,它的索引器遍历超文本数据库并寻找包括超链指向的文档地址……【查看全文

    阅读:745关键词: 超链接   超文本   检索原理   日期:2017-02-07
  • 影响谷歌搜索排名算法的5大趋势

    从2010年开始谷歌的算法调整就非常的频繁,熊猫、企鹅、蜂鸟算法等都是典型的例子,而这些算法都主要是打击那些低质量链接和内容的网站,打击黑帽SEO对互联网带来的不良影响。而那些给用户提供高质量内容的网站将会获得更好的排名,得到更多的访客。这就意味着你的网站需要给……【查看全文

    阅读:526关键词: 谷歌搜索   排名算法   谷歌搜索排名   谷歌搜索算法   日期:2014-05-18
  • 最常用最典型的SEO作弊手段

    作为一名资深SEO工作者,我一直反对SEO作弊行为,始终提倡白帽SEO,因为急功近利采取一些极端的手段,是不可取是要付出巨大代价的,有太多的网站就因为采用了SEO作弊手段而遭到惩罚,最终对SEO这个行业失去的兴起,一个新站想要迅速获得排名,除了积极原创内容,积极提升高质……【查看全文

    阅读:3507关键词: seo   seo手段   日期:2015-11-01
↓ 点击查看更多 ↓

互联网更多>>

  • 互联网思维究竟是一种什么样的思维? 互联网思维究竟是一种什么样的思维? 但凡做企业的,不管是创业的还是在互联网冲击下转型升级的传统行业企业家,“互联网思维”已经成为了大家共同……
  • 计算机的开机启动原理 计算机的开机启动原理 计算机从打开电源到开始操作,整个启动可以说是一个非常复杂的过程。总体来说,计算机的整个启动过程分成四个……
  • 移动互联网是什么意思? 移动互联网是什么意思? 移动互联网就是将移动通信和互联网二者结合起来成为一体,是指互联网的技术、平台、商业模式和应用与移动通信……

SEO优化 更多>>

如何以一个用户的角度来做企业门户网站 医疗行业开展品牌推广急需解决的10大问题