GoAccess轻量nginx日志分析工具
off999 2025-01-21 20:36 18 浏览 0 评论
什么是GoAccess
GoAccess 是一款开源、实时,运行在命令行终端下的 Web 日志分析工具。
该工具提供快速、多样的 HTTP 状态统计。
分析结果,可以通过 XShell 等客户端工具查看,并且可以生成 Html 报告。
GitHub 地址:https://github.com/allinurl/goaccess
官网地址:http://goaccess.io/
安装GoAccess
测试环境, centos7
# yum -y install glib2 glib2-devel ncurses ncurses-devel GeoIP GeoIP-devel
# wget http://tar.goaccess.io/goaccess-1.2.tar.gz
# tar -xzvf goaccess-1.2.tar.gz
# cd goaccess-1.2/
# ./configure --enable-geoip --enable-utf8
# make && make install
默认配置文件在
vi /usr/local/etc/goaccess.conf
time-format %H:%M:%S
date-format %d/%b/%Y
log-format
接下来我们测试一下。现在就需要根据nginx的日志格式来写goaccess的规则
goaccess -f /usr/local/nginx/logs/access.log -a > /root/test/report.html
网络上大部分的文章和介绍都只适合没任何修改的nginx日志格式,对自定义的log format都不怎么涉及。如果你采用的自定义的nginx日志格式,那么此处就需要特别注意,一旦log-format配置不对,goaccess分析的结果会差很大。
以我nginx日志格式为例:
log_format main '$server_name $remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent" "$http_x_forwarded_for" $upstream_addr $request_time $upstream_response_time;
按照goaccess预设的log format,这样的日志是没法分析的,所以我们需要自定义log format。 我的log format为:
log-format %^ %h %^ %^ [%d:%t %^] “%r” %s %b “%R” “%u” “%^” %^ %T %^
$server_name ---> %h ---> 主机(客户端IP地址,IPv4和IPv6)
[$time_local] ---> [%d:%t %^] ---> 时间
$request ---> "%r" ---> 客户机的请求,这需要具体分隔符在请求(单引号、双引号或其他)解析。如果没有,我们必须使用特殊的格式说明符的组合%m %U %H。
$status ---> %s ---> 发送客户端的状态码
$body_bytes_sent ---> %b ---> 给客户端返回大小
$http_referer ---> %R ---> “Referrer”HTTP请求头
$http_user_agent ---> "%u" ---> UA
$http_x_forwarded_for --->
$request_time ---> %T ---> 服务请求的时间,以秒或毫秒。注意:%D将优先于%T如果都使用。
为了设置正确的log format,踩了不少坑,先列出来避免大家重复碰到。 (1) log format默认是按照空格分隔日志信息的,所以,对于包含了特殊字符如空格等信息的字段,必须包含在“”里面。如字段request http_user_agent等 (2) nginx日志格式里面,采用空格分隔,但是此处一定注意,只能用一个空格。当时我有个地方用了两个空格,直接导致goaccess结果出错。 (3) nginx日志中的每一个字段都要和log format中的一一对应,如果log format中不需要nginx中的某一个信息,则用%^跳过该信息。 (4) 对于nginx日志中的每一个 - log format都需要一个%^来跳过, 如果是“-”, 则用“%^” (5) 如果nginx日志信息中有:, 则需要在log format中也显示出来。例如nginx日志中$time_local就包含了:,所以在log format的相应位置也是 [%d:%t %^]
希望这些能帮助使用goaccess的朋友。
goaccess -f log [-c][-r][-m][-h][-q][-d][-g][-a][-o csv|json][-e IP_ADDRESS][...]
自定义参数及其对应nginx的accesslog中的fromat
%x 匹配替代time_format和date_format的设定,可以同时调用两个的全局设置(时间戳) %t 匹配替代 time-format 的设置 %d 匹配替代 date-forma 的设置 %h 客户端ip $remote_addr %r 请求方法 $request %m 请求算法 相当于$request中的 post或get的匹配 %U 请求的URL路径(包括任何查询字符串) 相当于$request中的 URL匹配 %H 请求的协议 相当于$request中的 HTTP/1.1 %s 服务端返回客户端的状态code $status %b 返回客户端的body size $body_bytes_sent %R refer $http_referer %u user-agent $http_user_agent %D 服务请求的时间,以微秒为单位 $request_time %T 服务请求的时间,以秒为单位 $request_time %L 服务请求的时间,以毫秒为单位 $request_time %^ 忽略官方没有对应参数的区域
以上是官方给出的所有匹配参数,原版见
http://www.goaccess.io/man
以下是我自定义的nginx日志格式:
log_format main_zdy '$request_time - IP:$remote_addr - RealIP:$http_x_forwarded_for - [$time_local] $request - $status - $http_user_agent - $host - from:$http_referer';
记录日志:
0.000 - IP:3.3.3.3 - RealIP:1.1.1.1, 2.2.2.2 - [28/Jul/2017:16:04:15 +0800] POST /site/index.html HTTP/1.1 - 200 - Apache-HttpClient/UNAVAILABLE (java 1.4) - www.111111111.com - from:http://www.111111111.com
0.216 - IP:4.4.4.4 - RealIP:5.5.5.5, 6.6.6.6 - [28/Jul/2017:15:53:04 +0800] GET /client/serverlist?jsonpCallback=jQuery18206177038959697163_1501228347875&gid=163&wid=196&_=1501228353156 HTTP/1.1 - 200 - Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727) - www.111111111.com - from:http://www.1111111111111.com/
goaccess的格式:
log-format %T %^ IP:%^ %^ RealIP:~h{," } %^ [%d:%t %^] %m %U %H %^ %s %^ %u %^ %^ %^ from:%R
%x 一个匹配时间格式的日期和时间字段和日期格式变量。这是时使用时间戳是给定的日期和时间而不是在两个独立的变量。 %t time字段匹配时间格式的变量。 %d date字段匹配日期格式的变量。 %v The服务器名称根据规范名称设置块(服务器或虚拟主机)。 %e 用户标识的人请求文档由HTTP身份验证。 %h host(客户端IP地址,IPv4和IPv6) %r 请求从客户端。这需要在请求特定的分隔符(单引号、双引号等)解析。否则,结合使用等特殊格式说明符%m %U %q 和 %H解析单个字段。注意:使用 %r 得到完整的请求或 %m %U %q 和 %H形成你的请求,不同时使用。请求方法让
%m 请求的方法。 %U 请求URL路径。注意:如果查询字符串在%U,没有必要使用%q。然而,如果URL路径,不包括任何查询字符串,可以使用%q和查询字符串将被附加到请求。
%q 查询字符串。
%H 请求协议。 %s 服务器发送给客户机的状态代码。 %b 服务器发送发送给客户端的大小。 %R 来源 %u 用户代理HTTP请求头。 %D 服务请求的时间,以微秒为单位 $request_time %T 服务请求的时间,以秒为单位 $request_time %L 服务请求的时间,以毫秒为单位作为一个十进制数。 %^ 忽略这个领域。 %~ 前进通过日志字符串直到找到(!isspace)字符进行技术改造。 ~h 主机(客户端IP地址,IPv4和IPv6)在X-Forwarded-For(XFF)领域。
For XFF, GoAccess uses a special specifier which consists of a tilde before the host specifier, followed by the character(s) that delimit the XFF field, which are enclosed by curly braces (i.e., ~h{,"}). For example, ~h{," } is used in order to parse "11.25.11.53, 17.68.33.17" field which is delimited by a double quote, a comma, and a space.
XFF,GoAccess使用特殊说明符由波浪号主机之前,紧随其后的是字符(s)划入XFF字段,由花括号封闭(即~ h { })。 例如,h ~ { }的使用是为了解析”11.25.11.53,17.68.33.17”字段由一个双引号分隔,逗号,和空间。
goaccess -f /www/logs/nginx.log -a > /data/wwwroot/web/test/report1.html
-f 指定nginx日志文件
-p 指定日志格式文件
-o 输出到指定html文件
--real-time-html 实时刷新
--ws-url 绑定一个域名
生成HTML展示
将生成的文件用web服务器展示在浏览器上
goaccess -f /root/www.7477.com-access1000.log -a > /data/wwwroot/web/zabbix/1111/reporta1.html
goaccess -f /root/test.log -a > /data/wwwroot/web/zabbix/1111/reporta6.html
goaccess -f /root/www.7477.com-access181.log -a > /data/wwwroot/web/zabbix/1111/report.html goaccess -f /root/www.7477.com-access1000.log -a > /data/wwwroot/web/zabbix/1111/report1.html
goaccess -f /root/www.funet8.com-access.log -a > /data/wwwroot/web/zabbix/1111/funet1.html
goaccess -f /root/1000.log -a > /data/wwwroot/web/test/report1.html
相关推荐
- 「Python条件结构」if…else实现判断奇偶数
-
功能要求用户从键盘上输入一个整数,判断该数是奇数还是偶数。说明:能被2整除的整数叫偶数,不能被2整除的叫奇数;即该数除以2后余数为0时该数为偶数,否则该数为奇数。求余数运算符为“%”。实例代码num...
- Python if else条件语句详解
-
前面我们看到的代码都是顺序执行的,也就是先执行第1条语句,然后是第2条、第3条……一直到最后一条语句,这称为顺序结构。但是对于很多情况,顺序结构的代码是远远不够的,比如一个程序限制了只能成年人使用,儿...
- python基础篇: python中的流程控制,你都了解吗?
-
在之前的文章中大致的介绍过python中的流程控制语句,今天通过一些案例来详细了解一下python中的流程语句。目前python中流程控制语句,包含如下,如有遗漏欢迎留言补充。在python中条件判断...
- python中if语句
-
if语句用来判断,当不同的条件成立去做与之对应事情;格式如下:if条件:执行代码条件为True才会去做执行代码布尔类型(bool)说到布尔类型,就像开关只有两个值一样,布尔类型的值只有两个...
- python中的循环语句到底难不难
-
好多初学者会有一种这样的心里:循环难不难?该怎么学习?下面来给大家分析下.Python中的循环语句并不难,但需要理解其核心逻辑和应用场景。以下是针对零基础学习者的清晰解析,通过对比、示例和常见误...
- Python6大基础运算符,看完这篇之后会让你有一个彻底认识
-
昨天我们准备好了Python程序所需要的的东西,那么今天我们开始了解Python的各种基础运算符,这些要是不熟悉下来你后面的路也会走的很艰难Python支持基础运算符,常见的算术运算符有+、-、*、/...
- Python基础:条件语句和循环语句
-
下面会详细讲解一下Python关于条件语句和循环语句,会包含一些示例代码。我们首先来介绍条件语句(if-else),然后再讨论循环语句(for和while循环)。条件语句(if-else)在Pytho...
- Python合集之Python循环语句(一)
-
在上一节的合集中,我们了解了Python流程控制语句中if语句的嵌套及条件表达会的相关知识,本节我们将进一步了解一下Python循环语句中的while语句的相关知识。在日常生活中很多问题都无...
- Python“三步”即可爬取,毋庸置疑
-
声明:本实例仅供学习,切忌遵守robots协议,请不要使用多线程等方式频繁访问网站。#第一步导入模块importreimportrequests#第二步获取你想爬取的网页地址,发送请求,获取网页内...
- 「Python条件结构」if…else实现三角形判断
-
功能要求编写程序,判断输入的三个数是否能构成三角形的三个边。如果可以,打印“可以构成三角形”;如果不可以,打印“不可以构成三角形”。构成三角形的条件是:三条边都等于0,且任何2条边的边长之和都大于第三...
- Python中检查对象是否具有某个属性的方法
-
技术背景在Python编程中,经常会遇到需要检查一个对象是否具有某个特定属性的情况。例如,在调用对象的属性之前,需要先确认该属性是否存在,以避免引发AttributeError异常。以下将介绍几种常见...
- Python条件语句:从入门到精通
-
导语条件语句是编程中的基础概念,它允许我们根据不同的条件执行不同的代码块。在Python中,条件语句的灵活性和易读性使其成为编写逻辑判断和流程控制的强大工具。本教程将带您深入了解Python条件语句的...
- 简单学Python——条件语句if
-
条件语句是用来判断给定的条件是否满足(表达式值是否为0或False),并根据判断的结果(真或假)决定执行的语句。Python条件语句用的是if或if和else、elif等搭配实现的。代码执行的过程:i...
- Python合集之Python跳转语句(一)
-
在上一节的合集中,我们了解了Python循环嵌套语句的相关知识,本节我们将进一步了解一下Python跳转语句中的break的相关知识。当循环条件一直满足时,程序会一直执行下去,如果希望在中间离开循环...
- 新手学Python避坑,学习效率狂飙! 八、Python 布尔值判断
-
布尔值判断系统知识在Python里,布尔类型仅有两个值:True和False,它们常被用于条件判断。下面从几个方面展开介绍:1.布尔运算逻辑与(and):只有当两个操作数都为True时,...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (54)
- python安装路径 (54)
- python类型转换 (75)
- python进度条 (54)
- python的for循环 (56)
- python串口编程 (60)
- python写入txt (51)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python qt (52)
- python人脸识别 (54)
- python斐波那契数列 (51)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- centos7安装python (53)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)