Python自动化之Docx文档处理(一)(python办公自动化word)
off999 2025-07-07 22:17 86 浏览 0 评论
1 基本概念
1.1python-docx模块
相信大家在日常工作中,免不了要处理word文档,今天就介绍一个能通过python处理word文档的模块,python-docx[1]。
安装python-docx模块
pip install python-docx然后通过官方的python代码例子来了解python-docx的功能
from docx import Document
from docx.shared import Inches
document = Document()
document.add_heading('Document Title' , 0)
p = document.add_paragraph('A plain paragraph having some')
p.add_run('bold').bold = True
p.add_run(' and some ')
p.add_run('italic.').italic = True
document.add_heading('Heading, level 1', level=1)
document.add_paragraph('Intense quote', style='Intense Quote')
document.add_paragraph(
'first item in unordered list', style='List Bullet'
)
document.add_paragraph(
'first item in ordered list', style='List Number'
)
#document.add_picture('touxiang.jpg', width=Inches(1.25))
records = (
(3, '101', 'Spam'),
(7, '422', 'Eggs'),
(4, '631', 'Spam, spam, eggs, and spam')
)
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
for qty, id, desc in records:
row_cells = table.add_row().cells
row_cells[0].text = str(qty)
row_cells[1].text = id
row_cells[2].text = desc
document.add_page_break()
document.save('singless.docx')代码解析
- document = Document():打开一个基于默认模板的空白文档
- add_heading:增加标题函数,text用于定义标题名,level表示标题等级。标题等级限制在0~9。
- add_paragraph:新增段落,style指定段落前的编号类似。List Bullet 2表示2级无序段落。List Number 2表示2级有序段落[2]。
- add_run:往段落后添加内容。该函数有两个属性,bold和.italic,作用分别是加粗和使用斜体。注意添加文本时可以按需要在文本前后要添加空格,add_run不会自动添加空格。
- add_picture:新增图片,width指定宽度、height指定高度。指定高度和宽度需要从docx.shared中导入Inches
- add_table:创建一个表格,rows为行, cols为列
- table.rows[0].cells:读取第一行的所有内容。下标从0开始。table.rows[0]表示第一行,cells用来获取第一行中的所有单元格。要确定表格有几行几列可以通过len函数来确认。len(table.rows)、len(table.columns)
- hdr_cells[0].text:前面已经把第一行赋值给了hdr_cells,text可以用来填充单元格里的内容。这里的hdr_cell[0]指第一行的第一列
- add_row:新增一行
- add_page_break:新增一个分页符
- save:保存word文档
运行代码,该文档最终展现形式如下
2 段落操作
word操作,最多的就是对段落的操作,下面介绍下一些常用的操作在python中如何实现。
2.1 字体格式调整
我们直接通过python代码进行演示如何调整字体格式,字体颜色等
from docx import Document
from docx.enum.text import *
from docx.oxml.ns import qn
from docx.shared import Pt, RGBColor
from docx.text.paragraph import Paragraph
doc = Document()
paragraph1 = doc.add_paragraph("这是第1个段落")
run1 = paragraph1.add_run(" 追加的文字")
run1.bold = True # 加粗
run1.italic = True # 斜体
run1.underline = True # 下划线
paragraph2 = doc.add_paragraph("这是第2个段落")
run2 = paragraph2.add_run(" 这是第2段追加的文字")
run2.font.name = "Times New Roman" # 将段落里的西文设置为新罗马字体
run2.element.rPr.rFonts.set(qn('w:eastAsia'), '宋体') # 设置段落中的中文为宋体
run2.font.size = Pt(30) # 字体大小
run2.font.bold = False # 是否加粗
run2.font.italic = False # 是否斜体
run2.font.underline = False # 是否下划线
paragraph3 = doc.add_paragraph("这是第3个段落")
run3 = paragraph3.add_run(" 这是第3段追加的文字")
run3.font.shadow = True # 是否阴影
run3.font.strike = True # 是否删除线
# run.font.double_strike = True # 是否双删除线
run3.font.color.rgb = RGBColor(56, 36, 255) # 字体颜色
# run1.font.color.rgb = RGBColor.from_string("ff0056") # 字体颜色
run3.font.highlight_color = WD_COLOR_INDEX.YELLOW # 文本高亮颜色,此次设置为黄色
doc.save('singless1.docx')运行代码后,word文档效果如下
2.2 段落格式调整
首行缩进,行间距,段前段后距离调整
from docx import Document
from docx.oxml.ns import qn
from docx.shared import Pt
document = Document()
paragraph1 = document.add_paragraph()
# paragraph.line_spacing_rule = WD_LINE_SPACING.EXACTLY # 行距固定值
# paragraph.line_spacing_rule = WD_LINE_SPACING.MULTIPLE # 多倍行距
# paragraph1.paragraph_format.line_spacing = 1.5 # 行间距,1.5倍行距
paragraph1.style.font.size = Pt(10.5) ##设置字体大小为10.5磅
paragraph1.paragraph_format.first_line_indent = paragraph1.style.font.size * 2 ##首行缩进两个字符
paragraph1.paragraph_format.line_spacing = Pt(20) # 行间距,固定值20磅
paragraph1.paragraph_format.first_line_indent = Pt(22) # 首行缩进22磅
paragraph1.paragraph_format.space_before = Pt(30) # 段前30磅
paragraph1.paragraph_format.space_after = Pt(15) # 段后15磅
run1 = paragraph1.add_run("美猴王享乐天真,何期有三五百载。一日,与群猴喜宴之间,忽然忧恼,堕下泪来。众猴慌忙罗拜道,“大王何为烦恼?”猴王道,“我虽在欢喜之时,却有一点儿远虑,故此烦恼。”")
run1.font.name = "Times New Roman" # 设置西文是新罗马字体
run1.element.rPr.rFonts.set(qn('w:eastAsia'), '宋体') # 设置段落中的中文为宋体
paragraph2 = document.add_paragraph("众猴又笑道:“大王好不知足!我等日日欢会,在仙山福地,古洞神洲,不伏麟辖,不伏风凰管,又不伏人王拘末,自由自在,乃无量之福,为何远虑而忧也?”猴王道,“今日虽不归人王法律,不惧禽兽威服,将来年老血衰,暗中有间王老子管着,一旦身亡,可不枉生世界之中,不得久注天人之内?”")
document.save('singless2.docx')运行结果如下
段落对齐,左、右对齐、居中对齐
from docx import Document
from docx.enum.text import *
document = Document()
paragraph1 = document.add_paragraph("这是居中对齐段落")
paragraph1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER # 居中对齐
document.add_paragraph("这是左对齐段落").alignment = WD_PARAGRAPH_ALIGNMENT.LEFT # 左对齐
document.add_paragraph("这是右对齐段落").alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT # 右对齐
document.add_paragraph("这是两端对齐段落").alignment = WD_PARAGRAPH_ALIGNMENT.JUSTIFY # 两端对齐
document.add_paragraph("这是分散对齐段落").alignment = WD_PARAGRAPH_ALIGNMENT.DISTRIBUTE # 分散对齐
document.save('singless3.docx')运行结果如下
运行通过上面两个例子,我们了解了如何通过python代码完成对docx文档的常见操作。不过平常我们更常会遇到的场景可能是建立一个word模板,将通过python对数据进行处理填充到模板中,下一节介绍如何创建模板,并通过python填充数据。
3 参考资料
- [1]https://python-docx.readthedocs.io/en/latest/user/quickstart.html
- [2] https://python-docx.readthedocs.io/en/latest/user/styles-understanding.html
关注公众号 singless,获取更多有价值的文章
相关推荐
- 万界系统txt下载(万界系统林萧txt)
-
超级败家子,万界之大佬都是我儿子,类似的有系统的小说主角大多都能穿越万界穿越时空位面玩转次元位面次元位面主系统无限之时空大盗最强掠夺系统位面电梯我的房间有扇任意门大无限神戒《儒道至圣》《佛本是道》《...
- 腾讯qq密码怎么改(腾讯qq密码修改中心)
-
因腾讯视频是使用微信或者QQ帐号登录的,没有独立的腾讯视频账号密码,想修改登录密码,请通过QQ或者微信个人中心进行更改即可。QQ密码修改:进入手机QQ->左上角个人头像->设置->帐...
- win10安全模式根本进不去(windows10安全模式进不去怎么办)
-
win10安全模式启动不了的解决教程:1、按下【win】+【R】,打开运行窗口,然后输入【msconfig】。点击确定。2、然后切换到【引导】界面。将【安全引导】和【最小】进行勾选,点击【确定】。3、...
- win8激活密钥2025(win8激活密钥永久激活码)
-
1不存在永久激活密钥,但可以使用一些有效期长的密钥去激活Win10专业版。2Windows10的激活方式是基于数字权利,当你购买Windows10时,系统会将您电脑的硬件信息和购买记录绑定在一起...
- windows远程桌面(远程桌面app安卓版)
-
要在WindowsServer2016上开启远程桌面服务,您可以按照以下步骤操作:1.**打开服务器管理器**:您需要登录到您的WindowsServer2016系统。2.**启用远程桌面...
- 网盘app下载安装(雀云网盘app下载安装)
-
因为这时的文件只是下载到云盘里,并没有下载到手机里,而在云盘里是不能执行安装程序的,需要把云盘里的安装包,下载到手机内存里面,才可以执行安装命令。现在相当于,你的快递已经在驿站签收了,随时都可以拿回来...
- 隐藏文件夹不显示(隐藏文件夹不显示出来)
-
如果,可能是文件被删除或移动到其他位置。隐藏文件是指在文件系统中设置了隐藏属性的文件,通过更改文件夹的设置可以显示或隐藏这些文件。如果文件夹显示隐藏文件的设置已经开启,但仍然找不到文件,可能是因为文件...
- 强制修改密码软件下载(强制密码修改器)
-
1.首先找回账户密码(适用于Android设备):如果您的设备与账户关联,可以访问账户的“找回密码”功能,通过重置密码来修改锁屏密码。2.使用其他登录方式(适用于iOS设备):如果您启用了Touch...
- 苹果ipad充不进电怎么办(苹果ipad充不进去电什么原因)
-
如果你发现你的iPad不能充电,那么你这样试一下,你看是不是充电的温度太低,你给他拿到一个比较温暖的房间里去,第2个就是你换一个充电器试一试,是不是那个充电器坏了,如果还不行的话,你可以把iPad重新...
- 无法正常启动0xc000005(无法正常启动你的电脑0xc0000001)
-
如果手机下载安装的第三方应用出现问题,无法正常使用,三星手机一般建议进行以下步骤排查及处理:1.关闭重新启动该应用。2.建议将此软件卸载重新安装尝试。3.更换其他版本尝试。4.更新下手机系统版本后安装...
- 无线网登录(无线网登录入口)
-
1.打开手机浏览器,访问192.168.0.1,输入用户名和密码就可以进入路由器管理界面。2.手机wifi连接路由器信号之后,会弹出对话框,需要输入用户名和密码(有的路由器只需要密码)。3.正确的输入...
- 恢复精灵免费版(恢复精灵app软件下载)
-
一般都是收费的。建议选择正规的软件。推荐你用《安易》数据恢复软件。聊天恢复精灵不需要电脑。因为聊天恢复精灵是属于线上的应用程序,只需要在电子设备里面下载安装聊天恢复精灵软件就可以直接使用不靠谱手机数据...
- 苹果系统官网下载地址(iphone官网ios下载)
-
PP助手、同步推等手机助手都可以下载已经下架的应用,这类助手有很多,一搜一大把,而且就我知道的PP助手还能选择下载历史版本,当然也有部分应用是没在商店上架的,他们是通过企业证书公布自己的应用,需要到官...
-
- win10桌面切换(w10系统桌面切换)
-
win10桌面1和桌面2快速切换方法:1.按住win按键按键盘的【win】按键。2.再按Tab按键同时按下【tab】按键。3.点击桌面选项点击界面的桌面选项完成切换。具体方...
-
2025-12-19 23:51 off999
-
- 下载qq号安装(下载qq安装包)
-
QQ不能更新和下载,可尝试一下办法:1,使用数据线,将手机和电脑连接,然后从电脑端下载,保证你不闪退,不掉线。2,将你手机桌面的QQ图标删除,彻底删除.从AppStore里下载.注:在你不联机的状态下,你可能用别的助手会闪退问题,推荐从...
-
2025-12-19 23:03 off999
欢迎 你 发表评论:
- 一周热门
-
-
抖音上好看的小姐姐,Python给你都下载了
-
全网最简单易懂!495页Python漫画教程,高清PDF版免费下载
-
Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!
-
飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
python入门到脱坑 输入与输出—str()函数
-
宝塔面板如何添加免费waf防火墙?(宝塔面板开启https)
-
Python三目运算基础与进阶_python三目运算符判断三个变量
-
(新版)Python 分布式爬虫与 JS 逆向进阶实战吾爱分享
-
失业程序员复习python笔记——条件与循环
-
系统u盘安装(win11系统u盘安装)
-
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)
