百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

python中configparser读取配置文件的大小写和重复项问题

off999 2024-09-27 13:53 32 浏览 0 评论

使用配置文件控制程序的运行是一种非常常见的编程技巧,因此配置文件的解析是所有编程语言中都不可缺少的模块。在Python中,通常使用configparser模块进行配置文件解析。但是configparser解析配置文件有几个常见问题:读取当前项目下某个位置的配置文件、重复配置项的处理以及大小写配置项的读取。本文将描述如何解决这三个问题。

  • 一、测试环境
    • 1.1、硬件环境
    • 1.2、操作系统版本
    • 1.3、python版本
    • 1.4、项目结构
    • 1.5、配置文件内容
  • 问题一:读取当前项目下某个位置的配置文件
  • 问题二、configparser读取重复配置项的处理
  • 问题三、大小写配置项的读取

一、测试环境

测试环境如下:

1.1、硬件环境

CPU:Intel(R) Core(TM) i5-8600K CPU @ 3.60GHz 3.60 GHz
内存:32.0 GB(其中一个还是国产长鑫内存颗粒的16G,效果不错,哈哈哈)

1.2、操作系统版本

windows10 21H1

1.3、python版本

3.7(2.X的版本不建议用了,3.X的版本也建议升级到3.8以上使用,毕竟安全和新特性还是要关注)

1.4、项目结构

F:/OneDrive/Programs
|-python_ai
    |-test
        |-config_parser_test.py
    |config.ini

本项目名称是python_ai,路径在F:/OneDrive/Programs下,项目中包含一个包路径test,下面有一个config_parser_test.py文件,还包含一个配置文件config.ini,与test包同级别。

1.5、配置文件内容

配置文件内容如下:

[test]
config = a
CONFIG = b

这里我们提供的分类配置,包含一个test节点,该节点下包含两个配置项:config1与CONFIG,这两个配置项完全一样,只是大小写不同。

下面我们看问题。

问题一:读取当前项目下某个位置的配置文件

一般来说,配置文件都放在项目中某个位置,所以一般都是获取项目目录之后再根据项目结构来读取配置文件。但是项目位置我们一般不会固定,所以最好的思路是根据当前执行文件所在的位置来确定项目位置。在python中,可以在不同的其实位置执行python脚本,这些会影响到当前项目或者当前目录的获取,但是脚本的绝对路径是不会错的,所以我们先获取脚本绝对路径,再根据项目目录获取配置文件路径是比较可靠的。

因此,本例中读取项目配置文件真实地址代码如下:

import os
from os.path import dirname

# __file__是python内置的获取当前文件所在路径的变量,但是返回的有时候是相对路径,有的时候是绝对路径,使用os.path.realpath可以获取绝对路径
script_path = os.path.realpath(__file__)

# 根据项目结构我们知道本脚本在test包下,因此项目路径是父目录的父目录,需要两个dirname()
project_path = dirname(dirname(script_path))

# 根据项目结构,获取配置文件路径
config_path = os.path.join(project_path, "config.ini")

print(f"script filepath: {script_path}")
print(f"project filepath: {project_path}")
print(f"config filepath: {project_path}")

本项目中,上述打印结果:

script filepath: F:\OneDrive\Programs\python_ai\test\config_parser_test.py
project filepath: F:\OneDrive\Programs\python_ai
config filepath: F:\OneDrive\Programs\python_ai

问题二、configparser读取重复配置项的处理

默认情况下,configparser读取配置文件的时候是不允许重复项存在的。在本例中,我们特意在test下构造了两个重复的配置项(默认情况下,配置项的key大小写是被忽略的,所以我们这里目前默认可以当作是两个相同的配置项)。直接采用configparser解析这个文件会报错:

# 代码接着前面
import configparser

config = configparser.ConfigParser()
config.read(config_path)

运行这段代码会报错:

Traceback (most recent call last):
  File "F:/OneDrive/Programs/python_ai/test/config_parser_test.py", line 17, in <module>
    config.read(config_path)
  File "D:\Program Files\Python3.7\lib\configparser.py", line 696, in read
    self._read(fp, filename)
  File "D:\Program Files\Python3.7\lib\configparser.py", line 1091, in _read
    fpname, lineno)
configparser.DuplicateOptionError: While reading from 'F:\\OneDrive\\Programs\\python_ai\\config.ini' [line  3]: option 'config' in section 'test' already exists

它提示,在test下面,config配置项已经存在了,现在读取到2个,会报错。如果不希望报错,直接采用新的配置项覆盖,那么需要在configparser.ConfigParser(strict=False)方法中strict参数设置未False,改成如下代码:

config = configparser.ConfigParser(strict=False)

这样可以顺利读取包含重复配置项的文件,当然,这个配置项的输出是b,因为b是最新的会覆盖旧的。当然,这个参数还是控制是否允许小节的出现的。这不是本文重点。不说了。这个配置项在python3.2之前是默认False的,但是由于安全等原因,现在都是默认True。

问题三、大小写配置项的读取

大小写配置项也是一个非常容易被忽略的问题。configparser默认是将所有的key转换成小写的,读取的时候,也会默认将任何要获取的key转换成小写进行。所以以下几种情况,只有一种会出现问题:


代码循环key大写

代码循环key小写

配置文件key大写

出错

正常

配置文件key小写

正常

正常

这里的代码循环key大写是什么意思呢?比如有如下一种情况,你需要通过配置项获取对数据中每一列的处理,配置项中的key表明是列名,value表示对这列的处理。默认情况下,例如pandas.DataFrame对列名是大小写敏感的。这时候你要循环configparser读取的列,且列名是大写,进行处理就会报错。因为,configparser读取了配置项之后所有的key都是小写了,这时候你要是通过key读取配置还是能获取到对应的value,但是如果你想循环读取configparser中的key,那么所有的key都是小写。我们用如下代码测试:

config = configparser.ConfigParser(strict=False)
config.read(config_path)

for config_key in config["test"]:
    print(f"{config_key}:{config['test'].get(config_key)}")

我们循环输出test节点下的key,可以看到只会打印出config一个小写的key。

config:b

尽管我们配置项如下:

[test]
config = a
CONFIG = b

尽管这个config[“test”].get(“CONFIG”)还会输出b,尽管config[“test”].get(“config”)也是输出b(首先这里用第二个config覆盖了第一个,同时它将CONFIG大写转成小写,所以这两个输出都是b),但实际上循环key的时候是娶不到CONFIG原始的大写的。

如果你希望区分大小写应采用如下写法:

config = configparser.ConfigParser(strict=False)
# -----------加上这下面一行就可以区分大小写-----------
config.optionxform = str
# -----------加上这上面一行就可以区分大小写-----------

config.read(config_path)

for config_key in config["test"]:
    print(f"{config_key}:{config['test'].get(config_key)}")

这时候输出如下:

config:a
CONFIG:b

以上就python中configparser的三个简单却很实用的小问题。欢迎关注https://www.datalearner.com/ 获取最新的编程、人工智能、学术信息。

相关推荐

Linux 网络协议栈_linux网络协议栈

前言;更多学习资料(包含视频、技术学习路线图谱、文档等)后台私信《资料》免费领取技术点包含了C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,Z...

揭秘 BPF map 前生今世_bpfdm

1.前言众所周知,map可用于内核BPF程序和用户应用程序之间实现双向的数据交换,为BPF技术中的重要基础数据结构。在BPF程序中可以通过声明structbpf_map_def...

教你简单 提取fmpeg 视频,音频,字幕 方法

ffmpeg提取视频,音频,字幕方法(HowtoExtractVideo,Audio,SubtitlefromOriginalVideo?)1.提取视频(ExtractVi...

Linux内核原理到代码详解《内核视频教程》

Linux内核原理-进程入门进程进程不仅仅是一段可执行程序的代码,通常进程还包括其他资源,比如打开的文件,挂起的信号,内核内部的数据结构,处理器状态,内存地址空间,或多个执行线程,存放全局变量的数据段...

Linux C Socket UDP编程详解及实例分享

1、UDP网络编程主要流程UDP协议的程序设计框架,客户端和服务器之间的差别在于服务器必须使用bind()函数来绑定侦听的本地UDP端口,而客户端则可以不进行绑定,直接发送到服务器地址的某个端口地址。...

libevent源码分析之bufferevent使用详解

libevent的bufferevent在event的基础上自己维护了一个buffer,这样的话,就不需要再自己管理一个buffer了。先看看structbufferevent这个结构体struct...

一次解决Linux内核内存泄漏实战全过程

什么是内存泄漏:程序向系统申请内存,使用完不需要之后,不释放内存还给系统回收,造成申请的内存被浪费.发现系统中内存使用量随着时间的流逝,消耗的越来越多,例如下图所示:接下来的排查思路是:1.监控系统中...

彻底搞清楚内存泄漏的原因,如何避免内存泄漏,如何定位内存泄漏

作为C/C++开发人员,内存泄漏是最容易遇到的问题之一,这是由C/C++语言的特性引起的。C/C++语言与其他语言不同,需要开发者去申请和释放内存,即需要开发者去管理内存,如果内存使用不当,就容易造成...

linux网络编程常见API详解_linux网络编程视频教程

Linux网络编程API函数初步剖析今天我们来分析一下前几篇博文中提到的网络编程中几个核心的API,探究一下当我们调用每个API时,内核中具体做了哪些准备和初始化工作。1、socket(family...

Linux下C++访问web—使用libcurl库调用http接口发送解析json数据

一、背景这两天由于一些原因研究了研究如何在客户端C++代码中调用web服务端接口,需要访问url,并传入json数据,拿到返回值,并解析。 现在的情形是远程服务端的接口参数和返回类型都是json的字符...

平衡感知调节:“系统如人” 视角下的架构设计与业务稳定之道

在今天这个到处都是数字化的时代,系统可不是一堆冷冰冰的代码。它就像一个活生生的“数字人”,没了它,业务根本转不起来。总说“技术要为业务服务”,但实际操作起来问题不少:系统怎么才能快速响应业务需求?...

谈谈分布式文件系统下的本地缓存_什么是分布式文件存储

在分布式文件系统中,为了提高系统的性能,常常会引入不同类型的缓存存储系统(算法优化所带来的的效果可能远远不如缓存带来的优化效果)。在软件中缓存存储系统一般可分为了两类:一、分布式缓存,例如:Memca...

进程间通信之信号量semaphore--linux内核剖析

什么是信号量信号量的使用主要是用来保护共享资源,使得资源在一个时刻只有一个进程(线程)所拥有。信号量的值为正的时候,说明它空闲。所测试的线程可以锁定而使用它。若为0,说明它被占用,测试的线程要进入睡眠...

Qt编写推流程序/支持webrtc265/从此不用再转码/打开新世界的大门

一、前言在推流领域,尤其是监控行业,现在主流设备基本上都是265格式的视频流,想要在网页上直接显示监控流,之前的方案是,要么转成hls,要么魔改支持265格式的flv,要么265转成264,如果要追求...

30 分钟搞定 SpringBoot 视频推拉流!实战避坑指南

30分钟搞定SpringBoot视频推拉流!实战避坑指南在音视频开发领域,SpringBoot凭借其快速开发特性,成为很多开发者实现视频推拉流功能的首选框架。但实际开发中,从环境搭建到流处理优...

取消回复欢迎 发表评论: