网站日志是什么,引用百度百科的定义“网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志。”通过这个定义可以了解到网站日志记录了最全的网站运行信息,主要包括访客信息(比如访客ip、用什么浏览器、操作系统、访问时间等等)、蜘蛛对网站的抓取情况(抓取了哪些目录、都有哪些蜘蛛等等)、运行错误信息(主要是看一些HTTP状态码)。
http://www.yixiin.com/news/
那这么多信息,我们需要重点关注的有哪几个点呢?
一、蜘蛛抓取情况
1、都有哪些蜘蛛来访问
看一下主流的蜘蛛是否有访问网站,如果没有的话,可能是被网站屏蔽了,可以检查下网站的robots文件设置。
2、抓取了哪些目录
统计蜘蛛对网站目录的抓取情况,网站各层级目录是否抓取正常,一些需要重点推广的目录是否有抓取,如果没有抓取的话则需要对网站内链进行调整或者增加外链,提升栏目权重,引导蜘蛛抓取。另外,蜘蛛可能会抓取一些无意义的目录,比如我们不希望搜索引擎了解的信息,这时候就可以把这些目录屏蔽掉。
3、抓取了哪些页面
统计蜘蛛对网站页面的抓取情况,通过一段时间的观察你会发现蜘蛛经常抓取的一些页面,分析蜘蛛为什么喜欢这些页面,这些页面跟其它页面相比有什么不同,有没有其它页面可以借鉴的地方。此外,还可以通过分析页面抓取情况,了解到网站的一些问题,比如重复页面问题、url规范化问题等等。
4、蜘蛛访问次数、停留时间、抓取量
蜘蛛频繁访问网站,说明喜欢网站,经常来看看网站内容是否有更新,对网站来说是一件好事。如果十天半个月才来一次,那网站内容可能得更新勤快点了,另外还要多增加一些外链,引导蜘蛛访问网站。停留时间长短可以反映蜘蛛对网站的喜欢程度,需要注意的一点是,如果停留时间长,但是抓取量低的就有问题了,可能是蜘蛛对网站内容抓取困难,或者网站内容质量偏低导致的。这三个指标要综合起来看,才会得到比较有价值的信息。
二、http状态码
主要关注的有404、500、302之类的。404就不用说了,最好定期整理死链接,并提交到站长平台。如果经常出现500,可能是服务器的问题,比如内容太多,服务器无法满足需求,超负荷运转了,就会出现超时、无法访问的情况。302是暂时重定向,这个要具体看下是什么问题,搜索引擎比较喜欢301,如果可以的话就做成301的。
三、网站安全情况
通过日志分析,还可以及时了解到网站是否安全,像作者本人优化的一个站点,是通过日志分析才发现被挂了黑链的。分析日志的时候如果发现一些不存在的目录,或者一些奇怪的页面,就要仔细去分析一下,很可能就是有问题的。
以上就是作者本人在网站日志分析方面的一些心得体会,希望能够帮助到大家。网站日志分析是需要长期坚持的工作,一朝一夕可能发现不了问题,贵在坚持。
题外话:网站日志分析肯定少不了日志分析工具,该如何选择日志分析工具呢,个人认为主要还是得用着顺手的,一些主流的日志分析工具基本都可以满足需求,工具不分好坏,各有千秋,我就比较喜欢金花跟光年一块用,各取所长嘛。http://www.yixiin.com/brand/
站长基础说说之搜索引擎的内外部优化你知道多少呢?
搜索引擎的内外部优化你知道多少呢?郑州seo索引擎优化告诉你。如下:一、内部优化(1)META标签优化:例如:TITLE,KEYWORDS,DES
0评论2019-05-03278
站长基础说说之网站百度收录需要注意的问题
1.时间问题:网站是新站,百度对于新站的考察时间是1-3个月.在这三个月中,我们site自己的网站经常会出现网站有时间可以查询到一个
0评论2019-05-03279
站长基础说说之网站改版后的降权处理方法有哪些?
网站出现降权的情况很多,这也是每个优化师不想看到的问题,一但网站出现降权对排名的影响还是比较大的,情况稍好的话可能会轻微
0评论2019-05-03271
站长基础说说之seo优化应该从seo的原理上出发才能做好优化
seo这个行业从开始的混乱无比变得井然有序,让很多从事seo行业的朋友心中有了一个底。可是咱们做seo这么长的时间有没有真的去了
0评论2019-05-02253
站长基础说说之SEO优化如何判定一个外链的价值!
对于外链为皇,内容为王这一句话,我想对做SEO优化的人来说耳朵已经听出茧来了。不过随着百度搜索引擎的算法更新后,很多人就放
0评论2019-05-02134
站长基础说说之百度图片的热门目录收录规则有哪些?
百度图片的热门目录: 爆笑趣图、精品推荐、MM明星、卡通动漫、精美壁纸、电影电视、风景名胜、新闻图片、壁纸。百度图片会根据
0评论2019-05-02123