百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python操作Word文档神器:python-docx库从入门到精通

off999 2025-07-07 22:16 3 浏览 0 评论

Python操作Word文档神器:python-docx库从入门到精通


动动小手,点击关注,感谢您的阅读,您的关注是我最大的动力!!!!


在办公自动化场景中,处理 Word 文档是常见需求。python-docx库让你无需手动操作,即可通过 Python 代码轻松创建、修改和解析 Word 文档(.docx 格式)。本文将带你掌握其核心功能,并通过实用案例提升你的办公效率!

一、基础操作:创建与打开文档

1. 创建新文档

核心函数

  • Document():创建一个空白的 Word 文档对象。
  • add_heading(text,level=1):添加标题。level从0到9,默认为1;0为文章标题,大于1的为小标题。
  • add_paragraph(text):添加段落。
  • save(path):保存文档。生成的文件为.docx 格式,而非 .doc。

案例:创建简单的文档

from docx import Document

# 创建文档对象
doc = Document()

# 添加标题(级别1)
doc.add_heading('欢迎使用Python生成文档', level=1)

# 添加段落
doc.add_paragraph('这是使用python-docx库自动生成的文档。')
doc.add_paragraph('下面将展示更多功能...')

# 保存文档
doc.save('python-doc.docx')

2. 打开并修改现有文档

核心函数

  • Document('path.docx'):打开现有文档。
  • 属性paragraphs:获取所有段落对象(不是段落的内容)到列表,可通过段落对象的text属性获取段落内容,并支持修改内容。

案例:在已有文档中添加内容

from docx import Document

# 打开现有文档
doc = Document('python-doc.docx')

# 添加新段落
doc.add_paragraph('新增内容:这是后续添加的段落。')

# 修改第一段内容
doc.paragraphs[0].text = '更新后的标题:Python办公自动化'

# 保存修改
doc.save('updated.docx')

闭坑指南

操作前确保文档未被其他程序(如 Word)打开,否则会抛出权限错误。

二、文本格式化:段落、字体与样式

1. 段落格式化

核心函数

  • add_paragraph(text):添加段落。
  • add_run(text):在段落中添加文本块(可单独设置格式)。
  • alignment:设置段落对齐方式(0 = 左对齐,1 = 居中,2 = 右对齐)。

可以引用from docx.enum.text import WD_PARAGRAPH_ALIGNMENT,对应属性值如下:

案例:创建带格式的段落

from docx import Document
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT

doc = Document()

# 添加居中对齐的标题
title = doc.add_heading(level=1)
title_run = title.add_run('居中标题')
title.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER  #设置CENTER居中

# 添加带格式的段落
p = doc.add_paragraph()
p.add_run('加粗文本').bold = True #设置为加粗
p.add_run(' 普通文本 ')
p.add_run('斜体文本').italic = True   #设置为斜体

# 右对齐段落
p.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT  #设置RIGHT靠右

doc.save('formatted.docx')

2. 字体样式设置

核心函数

函数 / 属性

功能描述

font.name

设置字体名称(如:'宋体'、'微软雅黑'、'黑体'、'Arial')

font.size

设置字体大小(单位:磅,如:Pt(12))

font.bold

设置加粗(True/False)

font.italic

设置斜体(True/False)

font.underline

设置下划线(True/False 或线型样式)

font.color.rgb

设置字体颜色(如:RGBColor(255, 0, 0),初始化3个int值(0-255),分别代表红,绿,蓝)

font.strike

设置删除线(True/False)

font.subscript

设置下标(True/False)

font.superscript

设置上标(True/False)

1. 基础字体设置

from docx import Document
from docx.shared import Pt
from docx.shared import RGBColor

doc = Document()
p = doc.add_paragraph()

# 添加文本并设置字体
run = p.add_run('这是宋体,16磅,加粗,红色')
run.font.name = '宋体'
run.font.size = Pt(16)
run.font.bold = True
run.font.color.rgb = RGBColor(255, 0, 0)

# 添加另一段文本,设置不同字体
run = p.add_run(' 这是Arial,12磅,斜体,蓝色')
run.font.name = 'Arial'
run.font.size = Pt(12)
run.font.italic = True
run.font.color.rgb = RGBColor(0, 0, 255)

doc.save('font_example.docx')

2. 混合字体样式(上标、下标、下划线)

from docx import Document
from docx.shared import Pt

doc = Document()
p = doc.add_paragraph()

# 上标示例:X^2
p.add_run('X').font.size = Pt(12)
sup = p.add_run('2')
sup.font.superscript = True
sup.font.size = Pt(8)

p.add_run(' + ')

# 下标示例:HO
p.add_run('H').font.size = Pt(12)
sub = p.add_run('2')
sub.font.subscript = True
sub.font.size = Pt(8)
p.add_run('O')

# 下划线示例
p.add_run(' 这是下划线文本').font.underline = True

doc.save('font_special.docx')

3.批量设置多个 Run 的字体

from docx import Document
from docx.shared import Pt

def set_font(run, font_name, size, bold=False, italic=False):
    run.font.name = font_name
    run.font.size = Pt(size)
    run.font.bold = bold
    run.font.italic = italic
    return run

doc = Document()
p = doc.add_paragraph()

# 批量设置
set_font(p.add_run('标题1'), '黑体', 16, bold=True)
p.add_run('\n')  # 换行
set_font(p.add_run('正文内容...'), '宋体', 12)

doc.save('batch_font.docx')

4. 读取并修改现有文档的字体

from docx import Document
from docx.shared import Pt

doc = Document('existing.docx')

# 遍历所有段落和Run,修改字体
for p in doc.paragraphs:
    for run in p.runs:
        run.font.name = '宋体'
        run.font.size = Pt(12)

doc.save('modified_font.docx')

PS:

段落与 Run 的区别:段落(Paragraph)是文档的基本结构单位,而Run是段落内具有相同格式的文本块。若直接对段落设置字体,会影响整个段落:

p = doc.add_paragraph() p.style.font.name = '宋体' # 整个段落使用宋体

体颜色设置:使用RGBColor时,值范围为 0-255。常见颜色的 RGB值:

颜色名称

RGB 值(Red, Green, Blue)

黑色

(0, 0, 0)

白色

(255, 255, 255)

红色

(255, 0, 0)

绿色

(0, 255, 0)

蓝色

(0, 0, 255)

黄色

(255, 255, 0)

青色

(0, 255, 255)

品红色

(255, 0, 255)

灰色

(128, 128, 128)

橙色

(255, 165, 0)

紫色

(128, 0, 128)

字体大小单位:使用Pt()指定磅值,而非像素(如:Pt(12) 对应Word中的12号字体)。

三、表格与列表操作

1. 创建表格

核心函数

  • add_table(rows, cols):创建表格。
  • cell(row, col).text:设置单元格文本。
Document.add_table(rows, cols, style=None)

参数说明:rows:表格的行数(整数),cols:表格的列数(整数),style:表格样式(可选,如'Table Grid')

返回值:返回一个Table对象,可用于后续操作(如填充数据、设置格式)。

from docx import Document

doc = Document()

# 创建4行4列的表格
table = doc.add_table(rows=4, cols=4, style='Table Grid')

# 填充表头 table.rows[0]表示第1行,table.rows[0].cells表示第1行的列对象
hdr_cells = table.rows[0].cells
hdr_cells[0].text = '姓名'  #填充第1列的内容
hdr_cells[1].text = '年龄'  #填充第2列的内容
hdr_cells[2].text = '性别'  #填充第3列的内容
hdr_cells[3].text = '职业'  #填充第4列的内容

# 填充数据
data = [
    ('张三', 25, '男', '工程师'),
    ('李四', 30, '女', '设计师'),
    ('王五', 28, '男', '产品经理')
]

for row_idx, row_data in enumerate(data, 1):
    row_cells = table.rows[row_idx].cells
    for col_idx, cell_data in enumerate(row_data):
        row_cells[col_idx].text = str(cell_data)

doc.save('simple_table.docx')

程序执行后,打开docx文档,表格如下:

1). 合并单元格

# 合并第1行的前两列
table.cell(0, 0).merge(table.cell(0, 1))
table.cell(0, 0).text = '个人信息'

2). 设置单元格格式

from docx.shared import RGBColor

# 设置字体颜色
cell = table.cell(1, 0)  # 第2行第1列
cell.paragraphs[0].runs[0].font.color.rgb = RGBColor(255, 0, 0)  # 红色文本
cell.paragraphs[0].alignment = WD_PARAGRAPH_ALIGNMENT.CENTER         #居中
cell.paragraphs[0].runs[0].font.bold = True                      #加粗
 

3). 添加图片到表格

from docx.shared import Inches

# 在表格中插入图片
cell = table.cell(1, 3)  # 第2行第4列
cell.paragraphs[0].add_run().add_picture('photo.jpg', width=Inches(1.0))

以上几个场景,在主场景中增加后,执行结果如下:

2. 添加列表

核心函数

  • add_paragraph(text, style='List Bullet'):添加无序列表。
  • add_paragraph(text, style='List Number'):添加有序列表。

案例:创建购物清单

from docx import Document

doc = Document()
doc.add_heading('购物清单', level=2)

# 无序列表
doc.add_paragraph('水果', style='List Bullet')   #1级
doc.add_paragraph('苹果', style='List Bullet 2') #2级 
doc.add_paragraph('香蕉', style='List Bullet 2') #2级 

# 有序列表
doc.add_paragraph('步骤', style='List Number')
doc.add_paragraph('选择商品', style='List Number 2')
doc.add_paragraph('结账付款', style='List Number 2')

doc.save('shopping_list.docx')

四、高级操作:插入图片与页面设置

1. 插入图片

核心函数

  • add_picture(image_path, width, height):插入图片并设置尺寸。

案例:创建产品介绍文档

from docx import Document
from docx.shared import Inches

doc = Document()
doc.add_heading('产品介绍', level=1)

# 添加文本说明
doc.add_paragraph('这是我们的最新产品,具有以下特点:')

# 添加图片
doc.add_picture('product.jpg', width=Inches(4), height=Inches(3))

# 添加产品特性列表
features = ['高性能', '低功耗', '易操作', '长寿命']
for feature in features:
    doc.add_paragraph(feature, style='List Bullet')

doc.save('product_intro.docx')

2. 页面设置

核心函数

  • section.page_height:设置页面高度。
  • section.page_width:设置页面宽度。
  • section.orientation:设置页面方向(纵向 / 横向)。

案例:创建横向页面文档

from docx import Document
from docx.enum.section import WD_ORIENT

doc = Document()

# 获取第一个节(默认只有一个节)
section = doc.sections[0]

# 计算横向页面尺寸(交换宽高)
new_width, new_height = section.page_height, section.page_width
section.orientation = WD_ORIENT.LANDSCAPE
section.page_width = new_width
section.page_height = new_height

# 添加内容
doc.add_heading('横向页面示例', level=1)
doc.add_paragraph('这是一个横向页面的文档。')

doc.save('landscape_page.docx')

5、总结

python-docx 库为Word 文档自动化提供了强大支持,无论是简单的文本处理,还是复杂的表格、图片操作,都能轻松应对。通过本文的案例,你可以快速上手并应用到实际工作中,提升办公效率! 其他请参考官方文档:
https://python-docx.readthedocs.io/

相关推荐

用Python编制生成4位数字字母混合验证码

我们登录一些网站、APP的时候经常会有验证码,这个为了防止有人不停的去试探密码,还有发送短信验证之前,输入验证码就可以减少误点,错误操作等等。可以提高安全性,我们可以生成数字,也可以生成字母,也可...

Python电子发票管理工具4:前后端业务逻辑实现

用一系列文章介绍如何用python写一个发票管理小工具。在前面的文章中前端页面和后端框架已经实现,本文将介绍功能实现的代码。数据库操作使用sqlalchemy操作sqlite数据库。sqlalchem...

【代码抠图】4行Python代码帮你消除图片背景

在修图工具满天飞的年代其实仍然还有很多人不会扣图(比如我),在很多需要去除某些照片上面的背景的时候就会很难受,所以今天就给不会扣图的小伙伴们来带一个简单的代码扣图教程,只需要4行代码,不用再多了。准备...

Python 3.14 的 UUIDv6/v7/v8 上新,别再用 uuid4 () 啦!

Python3.14重磅更新!UUIDv6/v7/v8强势来袭,别再用uuid4()啦!为什么说UUID升级是2025年Python开发者的必学技能?在当今互联网应用中,UU...

殊途同归 python 第 4 节:有趣的键值对(字典)

字典数据的突出特点就是“键”和“值”,前文已经简单介绍过,本文来聊聊关于字典的几个高级玩法。1.函数打包后,通过键来调用globalf1,f2a={"k1":f1,"k2...

更有效地使用 Python Pandas 的 4 个技巧

一个简单而实用的指南照片由simonsun在Unsplash上拍摄Pandas是一个用于数据分析和操作任务的非常实用且功能强大的库。自2019年以来,我一直在使用Pandas,它始终能够为我...

4.python学习笔记-集合(python里面集合)

1.关于集合集合是一类元素无序不重复的数据结构,常用场景是元素去重和集合运算。python可以使用大括号{}或者set()函数创建集合,如果创建一个空集合必须用set()而不是{},因为{}是用来表示...

python生成4种UUID(python随机生成uuid)

总结了一份python生成4种UUID的代码:UUID用4种uuid生成方法:uuid1:基于时间戳由MAC地址、当前时间戳、随机数字。保证全球范围内的唯一性。但是由于MAC地址使用会带来安全问题...

你不知道的4种方法:python方法绘制扇形

1说明:=====1.1是问答中的我的一个回答。1.1因为问答中没有代码块的,所以我改为这里写文章,然后链接过去。1.24种方法:turtle法、OpenCV法、pygame法和matplot...

30天学会Python编程:4. Python运算符与表达式

4.1运算符概述4.1.1运算符分类Python运算符可分为以下几大类:4.1.2运算符优先级表4-1Python运算符优先级(从高到低)运算符描述示例**指数2**3→8~+-按位取...

这3个高级Python函数,不能再被你忽略了

全文共1657字,预计学习时长3分钟Python其实也可以带来很多乐趣。重新审视一些一开始并不被人们熟知的内置函数并没有想象中那么难,但为什么要这么做呢?今天,本文就来仔细分析3个在日常工作中或多或少...

beautifulSoup4,一个超实用的python库

一.前言我们在学习python爬虫的时候,数据提取是一个常见的任务。我们一般使用正则表达式,lxml等提取我们需要的数据,今天我们介绍一个新的库beautifulSoup4,使用它您可以从HTML和...

AI指导:打造第一个Python应用(4)(python ai开发)

眼瞅着迈过几个里程碑,与目标越来越近。尽管过程中照旧因返工而心焦,而欣喜与急躁比例,是喜悦运大于焦虑。从初次熟悉智能大模型,尝试编程起步,不定期进行复盘反思,这是小助手指导编程的第四篇。复盘以为记。需...

wxPython 4.2.0终于发布了(wxpython安装教程)

  wxPython是Python语言的跨平台GUI工具包。使用wxPython,软件开发人员可以为他们的Python应用程序创建真正的本地用户界面,这些应用程序在Windows、Ma...

《Python学习手册(第4版)》PDF开放下载,建议收藏

书籍简介如果你想动手编写高效、高质量并且很容易与其他语言和工具集成的代码,本书将快速地帮助你利用Python提高效率。本书基于Python专家的流程培训课程编写,内容通俗易懂。本书包含很多注释的例子和...

取消回复欢迎 发表评论: