百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

logging:足够好用的Python日志标准库

off999 2025-07-07 22:16 36 浏览 0 评论

尽管调试的手法有很多,如 print、pdb(断点)、ipython(动态交互) 等,但唯一的王道手法,就是日志。因为,开发环境可以玩各种花样,生产环境则唯有日志可以依靠。为了确保生产环境的日志是完备的,开发环境则应该充分使用日志来调试。

在别的语言,往往需要第三方的日志工具,才能达到生产环境的实用标准。但是在 Python,标准库自带的 logging,就足够好用。

官网:logging --- Python 的日志记录工具 — Python 3.12.10 文档

基本概念

Python 的 logging 模块是一个灵活且强大的日志管理工具,其核心概念包括 Logger、Handler、Filter、Formatter 和 LogRecord。

  • Logger(日志记录器):应用程序直接调用的接口,用于生成日志。有继承性和传播性,根 Logger 名为 ''(空字符串),其它 Logger 名称随意,可以通过 . 来分割,如 'app.module' 。
  • Handler(处理器):决定日志的输出位置(如控制台、文件、网络等),可独立设置级别、过滤器和格式。
  • Formatter(格式器):使用格式字符串(类似 printf 风格),定义日志的输出格式,包括时间、级别、消息等信息。
  • Filter(过滤器):提供更细粒度的日志过滤(而非单纯的日志级别)。
  • LogRecord(日志记录对象):由 Logger 自动创建的类,封装日志的元数据和内容(如时间、级别、消息、文件名等)。它是整个日志系统的输入,也是核心的过程数据,但不是结果;结果往往是一行字符串。

此外,还有一个概念叫日志级别,定义日志的严重程度,用于控制日志的输出粒度。级别从低到高依次为:

  • DEBUG:调试信息,适用于开发阶段。
  • INFO:常规信息,如程序运行状态。
  • WARNING:潜在问题,但程序仍可运行。
  • ERROR:严重错误,影响部分功能。
  • CRITICAL:致命错误,可能导致程序终止。

(对不同语言,会有类似而不同的设计。比如,某些语言高级里没有 CRITICAL,某些语言低级里会多个TRACE。)

以上概念,虽然是针对 Python 标准库的 logging 模块进行介绍,但相关概念,在其它日志库,乃至其它语言的日志库,都是通用的,可以找到相同、或至少相似的东西。

基本使用

在使用时,分两件事。一是如何调用日志,二是如何配置日志。

有很多方法,但我个人仅推荐如下一种:

from logging import getLogger

LOG = getLogger(__name__)

LOG.debug('Hello world!')

msg = 'world'
LOG.info('Hello %s!', msg)

尽管有人直接使用 logging.debug 这样的形式,但个人不推荐,因为这样会只使用根Logger。也有人会全局只创建一个 Logger,也行,但我也不推荐,因为这会为日志的扩展处理带来额外的麻烦。我推荐在每个需要日志的 Python 文件前面,都加上这两句:

from logging import getLogger

LOG = getLogger(__name__)

然后,这个 LOG 就可以在这个文件中任你使用。它的 name,就是 __name__,也即你当前文件的完整模块名,例如 app.module.submodule.util 。

尽管具体在什么情况下使用 debug 或 info,什么情况下使用 warning 或 error,里面有很深的门道,单独可以写几万字。但是如果没有实践,理解起来会很困难。我只给一个简单的建议:没事的时候,多在本地欣赏一下你写的日志。没错,不是定位问题,就单纯的欣赏。无论角度是好看,还是好用,自己多看两眼。只要作为开发者的你,真正在意它,那几万字的注意事项,你可以自己慢慢悟出来。

基本配置

怎么调用,门槛很低、易会难精。而怎么配置,则是门槛略高、但易精难会。

前面的示例代码,如果在标准环境单独运行,则什么显示都没有。因为默认只显示 warning 级以上。

至少有两种配置方法,这里只推荐一种,dictConfig:

from logging import getLogger
from logging.config import dictConfig

LOGGING = {
    'version': 1,
    'disable_existing_loggers': False,
    'formatters': {
        'verbose': {
            'format':
            '{asctime} {module}.{funcName} {lineno:3} {levelname:7} => {message}',
            'style': '{',
        },
    },
    'handlers': {
        'console': {
            'class': 'logging.StreamHandler',
            'formatter': 'verbose',
        },
        'file': {
            'class': 'logging.handlers.RotatingFileHandler',
            'formatter': 'verbose',
            'filename': '/tmp/django.log',
            'maxBytes': 4194304,  # 4 MB
            'backupCount': 10,
            'level': 'DEBUG',
        },
    },
    'loggers': {
        '': {
            'handlers': ['console', 'file'],
            'level': 'DEBUG',
        },
        'django': {
            'handlers': ['console', 'file'],
            'level': 'INFO',
            'propagate': False,
        },
    },
}
dictConfig(LOGGING)

LOG = getLogger(__name__)


def main():
    LOG.debug('Hello world!')
    msg = 'world'
    LOG.info('Hello %s!', msg)

    log = getLogger('django')
    log.debug('Hello world from django!')  # 不会显示
    log.info('Hello world from django!')


main()

dictConfig 的优点是,把所有关键概念全部都串起来。所以,在配置上很方便。

以上内容,写入文件 log.py 中,运行可以得到以下结果:

$ python log.py 
2025-04-27 20:57:13,818 log.main  46 DEBUG   => Hello world!
2025-04-27 20:57:13,818 log.main  48 INFO    => Hello world!
2025-04-27 20:57:13,818 log.main  52 INFO    => Hello world from django!

以上 LOGGING 这个字典的配置,是我个人的常用配置(精简版)。它实现了同一行日志,既可以在前台打印,又可以写入日志文件(示例中是 /tmp/django.log)。

这个配置省略了 Filter 的配置(配置中没有 'filters'),因为在绝大部分时候,这一层都不需要。主要的花样,都是在 Handler 这一级(配置中的 'handlers')实现的。

在 Logger 这一级,可以为不同名称的日志,选择不同的 Handler 和日志级别。这里给根日志(也就是 ''),选择了 DEBUG 级别,而给 'django' 日志,选择了 INFO 级别,因此有一条日志被“吃”了,没打出来,符合预期。这个配置,不仅仅对 'django'有效,而是对 'django.*' 都有效。通过这一级的配置,不仅可以掌控自研模块的日志,也能对第三方库的日志,进行调控。

另外,可以看出,这是面向 Django 服务的一个日志配置示例。在Django 的 settings.py 文件中,只需要配置 LOGGING 这个模块常量即可完成配置。而对于其它类型的 Python 程序,要确保 dictConfig(LOGGING) 这行代码,在程序的主要功能运行前执行,例如放到 app.py、main.py等入口文件的最前面。

最后,这个示例给出的配置是死的,但由于它是 Python 代码,因此具备灵活的动态性。如果需要其中的什么内容可配置,可以自行开发。

其它配置手法

尽管都不推荐,但也稍微介绍一下其它三种日志配置手法:

  1. 代码配置:直接操作日志的各种类,用Python的语法,把这个构造出来,加到那个里面去。过于繁琐,极端情况下可以作为 dictConfig 的补充。
  2. 文件配置:在文件里写一个和 dictConfig 同构的配置。太死板了,而且写错了内容后,调试困难。
  3. 网络配置:看上去灵活性很高,似乎适合大规模微服务,实际上根本没有这种需求,也千万不要给自己埋雷。

更多日志配置内容,见官网:logging.config --- 日志记录配置 — Python 3.12.10 文档

Handler简介

由于主要的花样,都在 Handler 这一级,因此需要多了解 Handler。

Handler 名称

作用

用途

特点

StreamHandler

将日志输出到流(如 sys.stderr、文件对象)。

控制台日志输出或自定义流。

默认输出到 sys.stderr;支持任何具有 write() 方法的流对象。

FileHandler

将日志写入磁盘文件。

持久化存储日志。

继承自 StreamHandler;支持文件编码和追加模式。

RotatingFileHandler

基于文件大小轮换日志(自动分割和备份)。

防止单个日志文件过大。

需指定 maxBytes 和 backupCount;多进程环境下需谨慎使用。

TimedRotatingFileHandler

基于时间间隔轮换日志(如每天、每小时)。

按时间分割日志文件。

参数 when 支持秒/分/时/日/周;interval 控制间隔;backupCount 限制备份数。

WatchedFileHandler

监视文件状态,外部修改后重新打开文件(如 logrotate)。

配合外部日志轮换工具使用。

自动检测文件变化(inode 或设备号变更)。

SocketHandler

通过 TCP 套接字发送日志到远程主机。

集中式日志管理(日志服务器)。

日志以 Pickle 序列化传输;需接收端启动 TCP 服务。

DatagramHandler

通过 UDP 数据报发送日志到远程主机。

低延迟、不可靠的日志传输。

类似 SocketHandler,但使用 UDP 协议。

SysLogHandler

将日志发送到 Unix syslog 服务。

集成到 Unix 系统日志。

支持本地 /dev/log 或远程 syslog 服务器。

NTEventLogHandler

将日志写入 Windows 事件日志系统。

记录 Windows 系统事件日志。

仅限 Windows;需注册事件源(如 win32evtlog)。

SMTPHandler

通过电子邮件发送日志。

错误告警或关键日志通知。

需配置 SMTP 服务器、发件人/收件人;默认不支持 SSL/TLS(需扩展)。

HTTPHandler

通过 HTTP GET/POST 发送日志到 Web 服务器。

提交日志到 Web 接口。

需服务器支持接收;使用较少,需自定义参数。

MemoryHandler

缓冲日志记录,触发条件后传递给目标 Handler。

批量处理或触发式发送(如错误发生时)。

需指定 capacity 和 target;支持按日志级别刷新。

NullHandler

不执行任何操作的空 Handler。

作为库的默认 Handler,避免干扰应用日志配置。

防止库未配置 Handler 时出现警告。

QueueHandler

将日志记录放入队列供其他线程/进程处理。

多进程/线程环境下的安全日志记录。

需配合 QueueListener;避免竞争条件,提升性能(Python 3.2+)。

更多内容可参考官网:logging.handlers --- Logging handlers  Python 3.12.10 文档

这些是标准库自带的,而如果还不满意,则可以自己去扩展。通过继承某个类,很容易扩展出需要的功能。

总结

如开篇所说,日志,是生产环境唯一的调试手段。因此,相关内容其实很多,几万字也写不完。

但就功能来讲,logging 这个标准库,已经足够好用。最多需要进行一些手动配置,乃至开发扩展。

后续会再介绍 Python 生态中的一些第三方日志库。

相关推荐

Linux 网络协议栈_linux网络协议栈

前言;更多学习资料(包含视频、技术学习路线图谱、文档等)后台私信《资料》免费领取技术点包含了C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,Z...

揭秘 BPF map 前生今世_bpfdm

1.前言众所周知,map可用于内核BPF程序和用户应用程序之间实现双向的数据交换,为BPF技术中的重要基础数据结构。在BPF程序中可以通过声明structbpf_map_def...

教你简单 提取fmpeg 视频,音频,字幕 方法

ffmpeg提取视频,音频,字幕方法(HowtoExtractVideo,Audio,SubtitlefromOriginalVideo?)1.提取视频(ExtractVi...

Linux内核原理到代码详解《内核视频教程》

Linux内核原理-进程入门进程进程不仅仅是一段可执行程序的代码,通常进程还包括其他资源,比如打开的文件,挂起的信号,内核内部的数据结构,处理器状态,内存地址空间,或多个执行线程,存放全局变量的数据段...

Linux C Socket UDP编程详解及实例分享

1、UDP网络编程主要流程UDP协议的程序设计框架,客户端和服务器之间的差别在于服务器必须使用bind()函数来绑定侦听的本地UDP端口,而客户端则可以不进行绑定,直接发送到服务器地址的某个端口地址。...

libevent源码分析之bufferevent使用详解

libevent的bufferevent在event的基础上自己维护了一个buffer,这样的话,就不需要再自己管理一个buffer了。先看看structbufferevent这个结构体struct...

一次解决Linux内核内存泄漏实战全过程

什么是内存泄漏:程序向系统申请内存,使用完不需要之后,不释放内存还给系统回收,造成申请的内存被浪费.发现系统中内存使用量随着时间的流逝,消耗的越来越多,例如下图所示:接下来的排查思路是:1.监控系统中...

彻底搞清楚内存泄漏的原因,如何避免内存泄漏,如何定位内存泄漏

作为C/C++开发人员,内存泄漏是最容易遇到的问题之一,这是由C/C++语言的特性引起的。C/C++语言与其他语言不同,需要开发者去申请和释放内存,即需要开发者去管理内存,如果内存使用不当,就容易造成...

linux网络编程常见API详解_linux网络编程视频教程

Linux网络编程API函数初步剖析今天我们来分析一下前几篇博文中提到的网络编程中几个核心的API,探究一下当我们调用每个API时,内核中具体做了哪些准备和初始化工作。1、socket(family...

Linux下C++访问web—使用libcurl库调用http接口发送解析json数据

一、背景这两天由于一些原因研究了研究如何在客户端C++代码中调用web服务端接口,需要访问url,并传入json数据,拿到返回值,并解析。 现在的情形是远程服务端的接口参数和返回类型都是json的字符...

平衡感知调节:“系统如人” 视角下的架构设计与业务稳定之道

在今天这个到处都是数字化的时代,系统可不是一堆冷冰冰的代码。它就像一个活生生的“数字人”,没了它,业务根本转不起来。总说“技术要为业务服务”,但实际操作起来问题不少:系统怎么才能快速响应业务需求?...

谈谈分布式文件系统下的本地缓存_什么是分布式文件存储

在分布式文件系统中,为了提高系统的性能,常常会引入不同类型的缓存存储系统(算法优化所带来的的效果可能远远不如缓存带来的优化效果)。在软件中缓存存储系统一般可分为了两类:一、分布式缓存,例如:Memca...

进程间通信之信号量semaphore--linux内核剖析

什么是信号量信号量的使用主要是用来保护共享资源,使得资源在一个时刻只有一个进程(线程)所拥有。信号量的值为正的时候,说明它空闲。所测试的线程可以锁定而使用它。若为0,说明它被占用,测试的线程要进入睡眠...

Qt编写推流程序/支持webrtc265/从此不用再转码/打开新世界的大门

一、前言在推流领域,尤其是监控行业,现在主流设备基本上都是265格式的视频流,想要在网页上直接显示监控流,之前的方案是,要么转成hls,要么魔改支持265格式的flv,要么265转成264,如果要追求...

30 分钟搞定 SpringBoot 视频推拉流!实战避坑指南

30分钟搞定SpringBoot视频推拉流!实战避坑指南在音视频开发领域,SpringBoot凭借其快速开发特性,成为很多开发者实现视频推拉流功能的首选框架。但实际开发中,从环境搭建到流处理优...

取消回复欢迎 发表评论: