全球主机交流论坛

标题: 教你如何解读日志文件 [打印本页]

作者: 佛山高防IDC 时间: 2015-12-28 16:52
标题: 教你如何解读日志文件

网站服务器会把每一个访问信息、每一个服务器动作、每一个文件调用自动记录下来，存在服务器原始日志文件上。所以，日志中的信息是相对准确的、全面的。有些seo需要知道信息在流量分析软件中很少的支持，必须直接查看日志，如服务器返回的状态码。

　　原始文件就是一个纯文本文件，只要用文字编辑软件如WordPad或Notepad打开就可以。一般主机商会在控制面板提供日志文件下载。

　　下面我就举个例子，让我们看一下它包括哪些信息：

　　121.11.255.42--[31/Aug/2010:20:44:36+0800]"GET/seoblog/HTTP/1.1"

　　20052778"http://www.baidu.com/s?wd=seo""Mozilla/4.0(compatible;MSIE

　　6.0;WindowsNT5.1;SV1;360SE)"

　　用户IP地址：

　　121.11.255.42

　　这是访问用户所在的IP地址，显示出访问的人来自什么地理位置。在IP地址信息服务查一下这个IP所在位置，如截图可以看到这位访客来自广东

　　31/Aug/2010:20:44:36

　　这是文件被访问的准确时间。和IP地址结合起来，查看多条日志记录就可以跟踪到某一个特定的用户从一个网页到另一个网页的访问顺序和网站上的活动。

　　时区：

　　+0800

　　相对格林威治时间差。中国、新加坡处于东8区。

　　服务器动作：

　　“GET/seoblog/http/1.1"

　　服务器要做的动作要么是GET，要么是POST。除了一些CGT脚本外，通常都应该是GET，也就是从服务器上获得某个文件，可以使HTML、图片、CSS等。

　　例子里的这段记录时间就是，按HTTP/1.1协议获得URL/seoblog/处的文件。这里的URL相对地址，已经省去了域名部分，所以/seoblog/指的就是博客首页。

　　上面的例子是访问一个页面时的记录。在日志中，。每个图片、JS脚本等文件的访问也都会有一行记录。如：

　　58.63.31.46--[31/Aug/2010:21:52:23+0800]"GET/seoblog/wp-content/themes/mistylook/style.cssHTTP/1.1"2009450

　　"http://www.chinamyhosting.com/seoblog/""Mozilla/4.0(compatible;MSIE6.0;WindowsNT5.1;SV1;CIBA;,NETCLR2.0.50727;360SE)"

　　这行日志代表获取的是博客模版的CSS文件。

　　服务器代码：

　　200

　　服务器返回的状态码。200指成功获取了文件，一切正常。如果返回404，就是文件不存在/没有找到。

　　文件大小：

　　52778

　　指的是所获取文件的大小，例子中式52778字节。

　　来路：

　　“http//www.baidu.com/s?wd=seo"

　　显然访问者是从哪里来到当前网页，也就是来到这个网页之前访问的那个网页URL。来路可能是同一个网站的其他页，有可能是其他网站，也有可能是搜索引擎的结果页面，如上面所示的例子。

　　来路是搜索引擎结果页面时，URL中包含一个对SEO意义重大的信息，就是用户搜索的关键词。例子里的来路是百度搜索，搜索关键词是“seo”。

　　浏览器类型：

　　"Mozilla/4.0(compatible;MSIS6.0;WindowNT5.1;SV1;360SE)"

　　最后一段显示的是浏览器和用户电脑的一些信息。

　　例子里这段信息表示用户使用的是：

　　1.与Netscape兼容的Mozilla浏览器。实际上大部分浏览器UserAgent都使用Mozilla/为开头，所以并不能区别浏览器。

　　2.浏览器是IE6.0，或者IE6.0为内核。

　　3.WindowNT操作系统。

　　4.360浏览器(360浏览器是以IE6为内核的)。

欢迎光临全球主机交流论坛 (http://bbs.cuwww.com/)