百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

信不信?5分钟学会Python处理.docx和.xlsx文件

off999 2024-10-08 06:16 15 浏览 0 评论

MS Office文档可能是最不结构化的数据源之一。但在现实生活中,MS Office文档,特别是Excel和Word,几乎在每个公司,单位中都在使用。仅仅因为它是一个灵活而简单的工具,任何人都可以使用。所以也是为什么需要学习用pythonl来处理的重要原因。#python

word文件的真相-------您可以轻松编辑没有任何库的.docx文件。从技术上讲,它只是一个zip存档。因此,您可以解压缩它,在document.xml文件中进行替换并再次压缩它。它比处理旧的二进制.doc文件要好得多。但是还有更优雅的方式。

本5 分钟教程任务是从.xlsx文档中读取数据并根据现有模板生成.docx文件。要使用.xlsx文件,将使用openpyxl python库。

openpyxl库用于处理.xlsx文件

首先安装库并打开了input / table.xlsx文件:

#sudo pip install openpyxl

#sudo pip2 install openpyxl
import openpyxl
wb = openpyxl.load_workbook(filename = 'input/table.xlsx')
现在可以选择工作表并获取某些单元格的值:
ws = wb.worksheets[1]
print(ws["A1"].value)

输出:

Username

表头怎么处理?如果我们在表中有9列,我们可以这样做:

for col in range(1, 10):

print(ws.cell(column=col, row=1).value)

输出:

Username

Surname

Attribute1

Attribute2

Attribute3

Attribute4

Attribute5

Attribute6

Attribute7

如果想要阅读整个表(没有头),我们可以这样做:

first_cell_value = "1"
row = 2
table = dict()
while first_cell_value != None:
if not ws.row_dimensions[row].hidden:
table[row] = dict()
for col in range(1, 10):
table[row][col] = ws.cell(column=col, row=row).value
row += 1
first_cell_value = ws.cell(column=1, row=row).value

请注意,略过隐藏的行。

从这样的表格结构中,可以获得分析所需的一切。

用于处理.docx文件的python-docx库

然后让我们弄清楚如何使用.docx文件。安装了python-docx库并打开了.docx模板文件:

#sudo pip install python-docx
#sudo pip2 install python-docx
import docx
document = docx.Document(docx = 'input/template.docx')

以下是如何遍历doc文件中的段落,找到关键字" USERNAME "并将其替换为所需的值"John":

import re

for paragraph in document.paragraphs:

if "USERNAME" in paragraph.text:

paragraph.text = re.sub("USERNAME", "John", paragraph.text)

如果需要读取或编辑.docx文件中的表怎么办?你可以这样读表:

for table in document.tables:
for row in table.rows:
for cell in row.cells:
for paragraph in cell.paragraphs:
print(paragraph.text)

要将行插入表中,我们的行为如下:

rows_to_add = dict()
rows_to_add[1] = ['1','2','3','4']
for table in document.tables:
for row in rows_to_add:
cells = table.add_row().cells
for n in range(0,len(rows_to_add[row]), 1):
cells[n].text = rows_to_add[row][n]

最后,将修改后的模板保存到新文件中:

document.save('output/john_smith.docx')

本文标签:

docx,Microsoft,MS Excel,MS Office,MS Word,openpyxl,python,python-docx,xlsx 。

老规矩,有问题问公众号“python_dada"。

相关推荐

python基础模块三剑客:sys、os、shutil(增加示例代码)

注:上个篇由于不熟悉头条号编辑器,导致示例代码丢失。现在全部以图片的形式加回。有同学问了个问题:在python里如何复制、删除、重命名文件?有个同学知道os.system(),就回答说:os.syst...

Python常用文件操作库使用详解(python 对文件操作)

Python生态系统提供了丰富的文件操作库,可以处理各种复杂的文件操作需求。本教程将介绍Python中最常用的文件操作库及其实际应用。一、标准库核心模块1.1os模块-操作系统接口主要功能:文件...

你知道Python 如何进行高效的代码重构吗?

点赞、收藏、加关注,下次找我不迷路写出高质量的代码是每个程序员的追求。而代码重构作为提升代码质量的重要手段,却常常被新手忽视。很多新手在编写代码时,只关注功能是否实现,却不注重代码的结构和可维护性,...

Python常用内置模块介绍——文件与系统操作详解

Python提供了多个强大的内置模块用于文件和系统操作,下面我将详细介绍最常用的几个模块及其核心功能。1.os模块-操作系统交互os模块提供了与操作系统交互的接口,包括文件/目录操作、进程管理、环...

Python的tarfile模块解压缩.tar/.tar.gz等文件

python中的标准库tarfile模块可以帮助我们快速压缩或者解压后缀为.tar/.tar.gz/.tar.bz2/.tar.xz的文件。01、tarfile核心类与函数介绍使用方法因为tarfil...

批量重命名工具,Bulk Rename Utility软件体验

平常在电脑上处理电子文件,经常在得到文件本身时,没有空闲和精力去为文件重命名,像是一张图片,要作为下一个步骤的素材。而处理完事过后就不理它了,顺手直接丢回收站或者放在硬盘里。但是想把文件存档和提交给上...

照片怎样重命名?方法有四种(照片怎么可以重命名)

照片怎样重命名?照片在我们日常生活中扮演着越来越重要的角色,但是有时候,我们需要对照片进行重命名,以便更好地组织和查找它们,这样也可以大大提高我们的效率。在这篇文章中,我们将介绍四种简单的方法,让你轻...

你需要批量创建文件夹并命名吗,给你推荐几个方法

小李是一家设计公司的项目经理,最近接了一个大项目,需要整理大量的设计稿。每个设计稿都需要单独创建一个文件夹,以方便团队成员协作。手动创建文件夹效率太低,而且容易出错。小李在网上搜索了各种方法,尝试了P...

怎样批量重命名一个工作簿中的所有工作表

上篇文章,Python数据的选取和处理,阅读量93,收藏15,没有评论。目前正在复习Python+Excel实现办公自动化,有兴趣的可以一起讨论,共同提高。花了近4个小时终于把6个分部的统计工作表做好...

Windows如何批量修改文件后缀名(电脑如何批量修改文件后缀名)

在Windows系统中药批量修改文件后缀名的方式非常多,每个方法的优缺点各有不同,下面通过几个常见的方式给大家介绍下,Windows如何批量修改文件后缀名的。给有需要的朋友几个参考。方法一:使用文件资...

Python3+ 变量命名全攻略:PEP8 规范 + 官方禁忌 + 实战技巧,全搞懂!

Python3+变量命名规则与约定详解一、官方命名规则(必须遵守)1.合法字符集变量名只能包含:大小写字母(a-z,A-Z)数字(0-9)下划线(_)2.禁止数字开头合法:user_age,...

python代码实现读取文件并生成韦恩图

00、背景今天战略解码,有同学用韦恩图展示各个产品线的占比,效果不错。韦恩图(Venndiagram),是在集合论数学分支中,在不太严格的意义下用以表示集合的一种图解。它们用于展示在不同的事物群组之...

python学习第二天:用Pycharm新建的第一个程序

分享第一次使用Pycharm学到的内容第一次打开得到上面图片projects:项目customize:自定义plugins:插件learn:学习newproject新建项目聪明如我在插件那里找到了汉...

如何编写第一个Python程序(python第一个代码)

一、第一个python程序[掌握]python:python解释器,将python代码解释成计算机认识的语言pycharm:IDE(集成开发环境),写代码的一个软件,集成了写代码,...

Python文件读写操作详解:从基础到实战

Python文件的读写操作在Python中,文件操作非常常见,可以通过内建的open()函数进行文件的读取、写入、创建等操作。理解文件操作的模式和with语句对于确保代码的简洁性和效率至...

取消回复欢迎 发表评论: