通过网站日志分析网站是SEO工作者每天必备的工作内容,无论是服务器的IIS日志还是主机空间的Apache日志,都记录着来访者的信息、用户和搜索引擎蜘蛛对网站的访问行为。所以网站日志对每个网站优化者非常的重要,这点同时也可方便网站优化人员查看网站的具体情况。
我们通过分析查看网站日志可以让我们了解网站的死链接,301,202等等,可让我们知道网站哪些链接是搜索引擎经常爬取的,每天那些页面是被搜索引擎爬取过,可以分析出网站是否被降权、哪些页面被收录等等,今天,巨推传媒就跟大家分享一下如何查看分析网站日志。
什么是网站日志文件分析?
日志文件分析是从服务器下载日志文件并通过SEO日志文件分析工具打开日志文件的过程。通过日志文件分析工具,你可以查看有关网站“点击率”的所有信息 – 包括机器人和人工点击,以帮助你制定明智有效的SEO策略,将你的网站带到百度搜索引擎结果页面的先进页。
虽然日志文件分析是一项艰巨的任务,但它大大帮助SEO专家找到并发现了以任何其他方式无法找到的重要技术SEO问题。对于我们了解搜索引擎抓取工具如何在其网站内移动以及它们在数据库中存储的具体信息,日志文件包含的数据对于网站管理员和搜索引擎优化是准确,有用和重要的。但是,在我们进入分析日志文件的整个过程之前,我们必须首先了解所使用的日志类型。
日志文件类型
最常见的日志有3种类型。最常见的是Apache。其他日志包括弹性负载平衡和W3C。最后一种类型是自定义日志文件,通常可用于较大的站点。因此,在了解了类型后,这些日志文件是什么样的?
它们通常由5部分组成:
首先是抓取工具访问过的网页的网址。
第二个是时间戳 – 抓取工具发出请求的日期和时间。
第三个是远程主机或IP地址
他们访问过的页面的响应/状态代码。
最后,用户代理。对于我们的SEO,最重要的用户代理是Baiduspider、Googlebot之类的蜘蛛机器人。
网站日志文件如何查看?
网站放在服务器使用的是宝塔面板可以通过宝塔控制面板进入-文件根目录去下载查看网站日志文件,如果用的是空间也可以通过FTP进入下载日志文件。
网站日志如何分析?
当我们知道了网站日志的具体位置,我们就可以去下载分析网站日志了,那么,我们该如何分析网站日志呢?
1、如何查看网站日志信息
网站日志通常都可以用日志分析工具去大概的查一查,工具都会大概的呈现一些简单信息给我们,不会把详细的信息给我们,工具分析只是简单的告诉我们一个大概,下面我们就举例一条网站日志信息分析看下图:
我们下面可以对这段日志进行分析。
110.85.5.77 是搜索引擎蜘蛛的IP;
[06/Jun/2018:17:38:56 +0800] 表示的是时间;
GET是网站请求内容(post是上传内容);
HTTP/1.1 http协议是1.1版本;
200 是访问成功的返回代码;
Baiduspider/2.0是百度的蜘蛛;
Mozilla/5.0 是访问的客户端浏览器、操作系统。
连在一起就是2018.06.06的下午5点38分56秒的时候一个通过Mozilla/5.0系统浏览器的蜘蛛进入网站成功访问并下载了5816B的数据。
2、用excel表格分析网站日志
①先打开WPS表格,点击数据,导入数据。
②选择数据源(注意选择所有文件),选择之前的网站日志文本。
③选择下一步,然后选择“分割符号”再点击下一步,勾选空格再点下一步、下一步就完成了。
④网站的日志就这样用wps表格拆分出来,之后自己再调整一下表格内容的名字分类,就可以看到如下图所示了。
如上制作出的表格,我们可以更方便的分析网站的日志。我们可以通过表格标注我们想要知道的参数,删除和隐藏无关项的参数,然和使用筛选功能去进一步分析,通过IP筛选发现异常IP频繁访问我们的页面,我们可以利用命令在.htaccess文件中使用(Order Deny,AllowDeny from X.X.X.X)禁止不让其再次访问我们网站;通过状态码筛选发现是否有死链、错误链接(404),是否有服务器抓取异常问题(5xx),进而来了解蜘蛛对我们网站的抓取情况,抓取了哪些页面。
日志文件分析作用
日志文件分析的主要目标之一是帮助你了解有关蜘蛛的更多信息并优化你的抓取预算和页面优化。在抓取预算时,这是指搜索引擎将其网站抓取到你的网站的次数。以下是使其适用于你并建立更有效的SEO过程的方法:
评估时间范围,速度,资源和流量频率
页面流量是我们在评估SEO策略时始终跟踪的常量统计数据之一。这意味着检查流量频率,当发布新内容时往往更加明显,导致蜘蛛更频繁地执行网站抓取。这意味着要考虑蜘蛛执行其操作的具体时间范围。查看几个月,几周和几天将有助于你查看网站爬网,从而可以在创建较佳策略时利用它。
专注于移动
移动搜索已成为SEO中最重要的元素之一。随着移动互联网越来越容易被广大受众所接受,利用这种流量非常重要。这意味着为移动用户优化你的网站,包括允许响应式设计和AMP,从而实现更好的查看和更快的加载速度。搜索引擎速度更新还意味着移动加载速度现在是排名因素,这意味着蜘蛛可能会将你的移动性能考虑在内。
优化导航
通过导航,你不仅可以浏览所有网页,还可以让蜘蛛进行网站抓取。内部链接允许抓取这些网页,使其显示在搜索中并获得更多流量。确保与以前的许多文章进行内部链接,这一过程为我们提供了更多流量到达我们的网站,让更多人看到我们的内容。
评估页面错误
监控站点爬网还允许你查找未响应或具有相应301,400或500错误的页面。这些页面中的每一页都值得一看,因为你需要重定向并修复它们才能让蜘蛛抓取到正确的位置。找到它们还会就如何解决这些问题提出更多问题,因为清理它只会为你的网站流量带来更多好处,让你的SEO策略更有效地生效。
从索引中删除页面
从索引中删除网页并删除重复内容有助于你的抓取预算,因为它可以优化导航,从而可以将用户引导到正确的位置。这也可以帮助你找到丢失的内容,允许这些错过的网页获得更多流量,从而导致蜘蛛进行抓取。
SEO教程点评:
每个SEO专家和网站管理员都想知道他们网站上发生了什么。通过日志文件分析,我们可以了解百度如何查看我们的网站以及抓取工具正在关注哪些网页。知道发生了什么,努力检查所有资源和页面,清理你看到的错误和重复。