百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

信不信?5分钟学会Python处理.docx和.xlsx文件

off999 2024-10-08 06:16 19 浏览 0 评论

MS Office文档可能是最不结构化的数据源之一。但在现实生活中,MS Office文档,特别是Excel和Word,几乎在每个公司,单位中都在使用。仅仅因为它是一个灵活而简单的工具,任何人都可以使用。所以也是为什么需要学习用pythonl来处理的重要原因。#python

word文件的真相-------您可以轻松编辑没有任何库的.docx文件。从技术上讲,它只是一个zip存档。因此,您可以解压缩它,在document.xml文件中进行替换并再次压缩它。它比处理旧的二进制.doc文件要好得多。但是还有更优雅的方式。

本5 分钟教程任务是从.xlsx文档中读取数据并根据现有模板生成.docx文件。要使用.xlsx文件,将使用openpyxl python库。

openpyxl库用于处理.xlsx文件

首先安装库并打开了input / table.xlsx文件:

#sudo pip install openpyxl

#sudo pip2 install openpyxl
import openpyxl
wb = openpyxl.load_workbook(filename = 'input/table.xlsx')
现在可以选择工作表并获取某些单元格的值:
ws = wb.worksheets[1]
print(ws["A1"].value)

输出:

Username

表头怎么处理?如果我们在表中有9列,我们可以这样做:

for col in range(1, 10):

print(ws.cell(column=col, row=1).value)

输出:

Username

Surname

Attribute1

Attribute2

Attribute3

Attribute4

Attribute5

Attribute6

Attribute7

如果想要阅读整个表(没有头),我们可以这样做:

first_cell_value = "1"
row = 2
table = dict()
while first_cell_value != None:
if not ws.row_dimensions[row].hidden:
table[row] = dict()
for col in range(1, 10):
table[row][col] = ws.cell(column=col, row=row).value
row += 1
first_cell_value = ws.cell(column=1, row=row).value

请注意,略过隐藏的行。

从这样的表格结构中,可以获得分析所需的一切。

用于处理.docx文件的python-docx库

然后让我们弄清楚如何使用.docx文件。安装了python-docx库并打开了.docx模板文件:

#sudo pip install python-docx
#sudo pip2 install python-docx
import docx
document = docx.Document(docx = 'input/template.docx')

以下是如何遍历doc文件中的段落,找到关键字" USERNAME "并将其替换为所需的值"John":

import re

for paragraph in document.paragraphs:

if "USERNAME" in paragraph.text:

paragraph.text = re.sub("USERNAME", "John", paragraph.text)

如果需要读取或编辑.docx文件中的表怎么办?你可以这样读表:

for table in document.tables:
for row in table.rows:
for cell in row.cells:
for paragraph in cell.paragraphs:
print(paragraph.text)

要将行插入表中,我们的行为如下:

rows_to_add = dict()
rows_to_add[1] = ['1','2','3','4']
for table in document.tables:
for row in rows_to_add:
cells = table.add_row().cells
for n in range(0,len(rows_to_add[row]), 1):
cells[n].text = rows_to_add[row][n]

最后,将修改后的模板保存到新文件中:

document.save('output/john_smith.docx')

本文标签:

docx,Microsoft,MS Excel,MS Office,MS Word,openpyxl,python,python-docx,xlsx 。

老规矩,有问题问公众号“python_dada"。

相关推荐

pip的使用及配置_pip怎么配置

要使用python必须要学会使用pip,pip的全称:packageinstallerforpython,也就是Python包管理工具,主要是对python的第三方库进行安装、更新、卸载等操作,...

Anaconda下安装pytorch_anaconda下安装tensorflow

之前的文章介绍了tensorflow-gpu的安装方法,也介绍了许多基本的工具与使用方法,具体可以看Ubuntu快速安装tensorflow2.4的gpu版本。pytorch也是一个十分流行的机器学...

Centos 7 64位安装 python3的教程

wgethttps://www.python.org/ftp/python/3.10.13/Python-3.10.13.tgz#下载指定版本软件安装包tar-xzfPython-3.10.1...

如何安装 pip 管理工具_pip安装详细步骤

如何安装pip管理工具方法一:yum方式安装Centos安装python3和python3-devel开发包>#yuminstallgcclibffi-develpy...

Python入门——从开发环境搭建到hello world

一、Python解释器安装1、在windows下步骤1、下载安装包https://www.python.org/downloads/打开后选择【Downloads】->【Windows】小编是一...

生产环境中使用的十大 Python 设计模式

在软件开发的浩瀚世界中,设计模式如同指引方向的灯塔,为我们构建稳定、高效且易于维护的系统提供了经过验证的解决方案。对于Python开发者而言,理解和掌握这些模式,更是提升代码质量、加速开发进程的关...

如何创建和管理Python虚拟环境_python怎么创建虚拟环境

在Python开发中,虚拟环境是隔离项目依赖的关键工具。下面介绍创建和管理Python虚拟环境的主流方法。一、内置工具:venv(Python3.3+推荐)venv是Python标准...

初学者入门Python的第一步——环境搭建

Python如今成为零基础编程爱好者的首选学习语言,这和Python语言自身的强大功能和简单易学是分不开的。今天千锋武汉Python培训小编将带领Python零基础的初学者完成入门的第一步——环境搭建...

全网最简我的世界Minecraft搭建Python编程环境

这篇文章将给大家介绍一种在我的世界minecraft里搭建Python编程开发环境的操作方法。目前看起来应该是全网最简单的方法。搭建完成后,马上就可以利用python代码在我的世界自动创建很多有意思的...

Python开发中的虚拟环境管理_python3虚拟环境

Python开发中,虚拟环境管理帮助隔离项目依赖,避免不同项目之间的依赖冲突。虚拟环境的作用隔离依赖:不同项目可能需要不同版本的库,虚拟环境可以为每个项目创建独立的环境。避免全局污染:全局安装的库可...

Python内置zipfile模块:操作 ZIP 归档文件详解

一、知识导图二、知识讲解(一)zipfile模块概述zipfile模块是Python内置的用于操作ZIP归档文件的模块。它提供了创建、读取、写入、添加及列出ZIP文件的功能。(二)ZipFile类1....

Python内置模块pydoc :文档生成器和在线帮助系统详解

一、引言在Python开发中,良好的文档是提高代码可读性和可维护性的关键。pydoc是Python自带的一个强大的文档生成器和在线帮助系统,它可以根据Python模块自动生成文档,并支持多种输出格式...

Python sys模块使用教程_python system模块

1.知识导图2.sys模块概述2.1模块定义与作用sys模块是Python标准库中的一个内置模块,提供了与Python解释器及其环境交互的接口。它包含了许多与系统相关的变量和函数,可以用来控制P...

Python Logging 模块完全解读_python logging详解

私信我,回复:学习,获取免费学习资源包。Python中的logging模块可以让你跟踪代码运行时的事件,当程序崩溃时可以查看日志并且发现是什么引发了错误。Log信息有内置的层级——调试(deb...

软件测试|Python logging模块怎么使用,你会了吗?

Pythonlogging模块使用在开发和维护Python应用程序时,日志记录是一项非常重要的任务。Python提供了内置的logging模块,它可以帮助我们方便地记录应用程序的运行时信息、错误和调...

取消回复欢迎 发表评论: