百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

06《Python 办公自动化教程》Word 转换 PDF

off999 2024-09-21 20:59 27 浏览 0 评论

在工作中 Word 文档通常不是最终版本,在发给甲方或者其他同事时,我们还需要把Word文档转换为PDF格式文件。那为什么需要转换 PDF,直接发 Word 文档又有什么问题?

其实直接发 Word 文档问题还是挺大的,可以大致总结以下几点:

  1. 由于每个人使用的软件或版本都不统一,可能你使用的是微软的 Office2007,而他使用的是金山WPS,这样有可能你本地样式已经好好的 Word 文档,在别人电脑上就出现了乱码;
  2. PDF 可以直接预览,目前主流浏览器都已经支持;
  3. PDF 文件无法修改,保证了信息安全。

了解了转换 PDF 格式文件的作用之后,接下来这一小节中,将介绍 Python 第三方模块 pywin32 实现Word 文档转换为 PDF 格式文件。

1. pywin32 模块介绍

在 Windows 上如需使用 Python 编写脚本,很多时候都需要用到 Windows API,但 Python 是没有自带访问 Windows 系统 API 的标准库,所以这时可以使用第三方库 pywin32 来解决,pywin32 模块中直接包装了几乎所有的 Windows API,让开发者可以很方便的调用。

使用 python win32 库实现 Word 转换 PDF,实际上是调用 Word 底层 vba,利用 Word 导出方法完成 PDF 转换,文档地址:

1.1 安装

pywin32 是 Python 的第三方库,使用前需要通过以下命令进行安装:

pip install pywin32

1.2 使用步骤

步骤1:导入 pywin32 下所需模块

from win32com.client import constants,gencache
代码块1

步骤2:启动一个新的 Word 进程

word=gencache.EnsureDispatch('Word.Application')
代码块1

步骤3:读取要转换的 Word 文档

doc=word.Documents.Open(wordPath,ReadOnly=1)
代码块1

步骤4:转换 PDF 格式文件

doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF)
代码块1

ExportAsFixedFormat() 方法可以将文档保存为 PDF 或 XPS 格式,第一个参数指定新的 PDF 或 XPS 文件的路径和文件名,第二个参数是一个枚举值(取值包括:wdExportFormatPDF 和 wdExportFormatXPS)用于指定转换的格式,上述代码中要将文档转换为 PDF 在设置时设置为constants.wdExportFormatPDF。

2. Word 文档转换 PDF

接下来,通过 pywin32 模块分别实现单个 Word 文档的转换和多个Word 文档的转换。

2.1 单个文件转换

根据pywin32模块的使用步骤,封装转换方法 createpdf 方法,代码如下:

def createpdf(wordPath,pdfPath):
    word=gencache.EnsureDispatch('Word.Application')
    doc=word.Documents.Open(wordPath,ReadOnly=1)
    #转换方法
     doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF)
代码块12345

代码解释:EnsureDispatch() 方法为启动一个新的 Word 进程,通过启动的 Word 进程读取传入指定的Word 文档,打开 Word 文档后,通过 ExportAsFixedFormat() 方法进行导出 PDF,第一个参数为指定的PDF 文件存储路径,第二个参数为指定导出文件的类型,除 PDF 外,还可以传入 XPS 格式。执行完成后,生成了 “info.pdf” 格式文件,效果如下图所示:

2.2 多个文件转换

完成单个 Word 文档转换之后,日常工作中有时会涉及到批量 Word文 档的转换,这时可以在单个Word 文档转换代码的基础上进行完善,修改后代码如下:

from win32com.client import constants,gencache
import os

def createpdf(wordPath,pdfPath):
    word=gencache.EnsureDispatch('Word.Application')
    doc=word.Documents.Open(wordPath,ReadOnly=1)
    #转换方法
    doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF)
  
#多个文件的转换
print(os.listdir('.')) #当前文件夹下的所有文件
wordfiles=[]
for file in os.listdir('.'):
    if file.endswith(('.doc','.docx')):
        wordfiles.append(file)

for file in wordfiles:
    filepath=os.path.abspath(file)
    index=filepath.rindex('.')
    # 拼接文件名及.pdf后缀
    pdfpath=filepath[:index]+'.pdf'
    createpdf(filepath,pdfpath) 

代码解释:通过 Python 中内置的os模块,读取指定目录获取所有的 Word 文档,保存在wordfiles中。通过for…in循环wordfiles,在循环中,首先根据abspath()方法得到文档的绝对路径,将文档名称拼接.pdf作为PDF文件的新名称。调用封装好的createpdf() 方法将文档路径和PDF文件路径传入,进行文件转换。执行完成后,在指定目录就批量生成 PDF 格式文件。

3. pywin32 模块拓展

前面提到pywin32 模块中直接包装了几乎所有的 Windows API,除了前面小节介绍的转换PDF外,还可以进行如下操作,一起来体验下吧!

3.1 弹出MessageBox消息框

使用pywin32实现系统消息框的弹出,代码如下:

import win32api
import win32con
win32api.MessageBox(0, "Hello Python", "消息框标题", win32con.MB_OK)
代码块123

代码解释:MessageBox() 方法弹出消息框,第一个参数标识要创建的消息框的所有者窗口,第二个参数指向要显示的消息,第三个参数表示对话框标题,第四个参数指定一组位标志来确定对话框的内容和行为,取值范围如下:

  • MB_ABORTRETRYIGNORE:消息框包含三个按钮:中止,重试和忽略;
  • MB_OK:消息框包含一个按钮:OK。这是默认值;
  • MB_OKCANCEL:消息框包含两个按钮:确定和取消;
  • MB_RETRYCANCEL:消息框包含两个按钮:重试和取消;
  • MB_YESNO:消息框包含两个按钮:是和否;
  • MB_YESNOCANCEL:消息框包含三个按钮:是,否和取消。

执行完成后,弹出消息框效果如下图所示:

3.2 模拟键盘操作

使用 pywin32 模拟按下键盘的回车键(Enter),代码如下:

import win32api,win32con
win32api.keybd_event(13,0,win32con.KEYEVENTF_EXTENDEDKEY)

代码解释:keybd_event() 方法为触发键盘事件,第一个参数为虚拟键码(13表示回车键),第二个参数为硬件扫描码,一般设置为0即可,第三个参数表示操作的标志位,如果值为KEYEVENTF_EXTENDEDKEY则该键被按下,值为KEYEVENTF_KEYUP则该按键被释放。

4. 小结

本节课程我们主要学习了 pywin32 模块的使用。本节课程的重点如下:

  • 了解pywin32模块作用及使用步骤;
  • 掌握 pywin32模块实现Word文档转换PDF格式文件的方法;

相关推荐

让 Python 代码飙升330倍:从入门到精通的四种性能优化实践

花下猫语:性能优化是每个程序员的必修课,但你是否想过,除了更换算法,还有哪些“大招”?这篇文章堪称典范,它将一个普通的函数,通过四套组合拳,硬生生把性能提升了330倍!作者不仅展示了“术”,更传授...

7 段不到 50 行的 Python 脚本,解决 7 个真实麻烦:代码、场景与可复制

“本文整理自开发者AbdurRahman在Stackademic的真实记录,所有代码均经过最小化删减,确保在50行内即可运行。每段脚本都对应一个日常场景,拿来即用,无需额外依赖。一、在朋...

Python3.14:终于摆脱了GIL的限制

前言Python中最遭人诟病的设计之一就是GIL。GIL(全局解释器锁)是CPython的一个互斥锁,确保任何时刻只有一个线程可以执行Python字节码,这样可以避免多个线程同时操作内部数据结...

Python Web开发实战:3小时从零搭建个人博客

一、为什么选Python做Web开发?Python在Web领域的优势很突出:o开发快:Django、Flask这些框架把常用功能都封装好了,不用重复写代码,能快速把想法变成能用的产品o需求多:行业...

图解Python编程:从入门到精通系列教程(附全套速查表)

引言本系列教程展开讲解Python编程语言,Python是一门开源免费、通用型的脚本编程语言,它上手简单,功能强大,它也是互联网最热门的编程语言之一。Python生态丰富,库(模块)极其丰富,这使...

Python 并发编程实战:从基础到实战应用

并发编程是提升Python程序效率的关键技能,尤其在处理多任务场景时作用显著。本文将系统介绍Python中主流的并发实现方式,帮助你根据场景选择最优方案。一、多线程编程(threading)核...

吴恩达亲自授课,适合初学者的Python编程课程上线

吴恩达教授开新课了,还是亲自授课!今天,人工智能著名学者、斯坦福大学教授吴恩达在社交平台X上发帖介绍了一门新课程——AIPythonforBeginners,旨在从头开始讲授Python...

Python GUI 编程:tkinter 初学者入门指南——Ttk 小部件

在本文中,将介绍Tkinter.ttk主题小部件,是常规Tkinter小部件的升级版本。Tkinter有两种小部件:经典小部件、主题小部件。Tkinter于1991年推出了经典小部件,...

Python turtle模块编程实践教程

一、模块概述与核心概念1.1turtle模块简介定义:turtle是Python标准库中的2D绘图模块,基于Logo语言的海龟绘图理念实现。核心原理:坐标系系统:原点(0,0)位于画布中心X轴:向右...

Python 中的asyncio 编程入门示例-1

Python的asyncio库是用于编写并发代码的,它使用async/await语法。它为编写异步程序提供了基础,通过非阻塞调用高效处理I/O密集型操作,适用于涉及网络连接、文件I/O...

30天学会Python,开启编程新世界

在当今这个数字化无处不在的时代,Python凭借其精炼的语法架构、卓越的性能以及多元化的应用领域,稳坐编程语言排行榜的前列。无论是投身于数据分析、人工智能的探索,还是Web开发的构建,亦或是自动化办公...

Python基础知识(IO编程)

1.文件读写读写文件是Python语言最常见的IO操作。通过数据盘读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个...

Python零基础到精通,这8个入门技巧让你少走弯路,7天速通编程!

Python学习就像玩积木,从最基础的块开始,一步步搭建出复杂的作品。我记得刚开始学Python时也是一头雾水,走了不少弯路。现在回头看,其实掌握几个核心概念,就能快速入门这门编程语言。来聊聊怎么用最...

一文带你了解Python Socket 编程

大家好,我是皮皮。前言Socket又称为套接字,它是所有网络通信的基础。网络通信其实就是进程间的通信,Socket主要是使用IP地址,协议,端口号来标识一个进程。端口号的范围为0~65535(用户端口...

Python-面向对象编程入门

面向对象编程是一种非常流行的编程范式(programmingparadigm),所谓编程范式就是程序设计的方法论,简单的说就是程序员对程序的认知和理解以及他们编写代码的方式。类和对象面向对象编程:把...

取消回复欢迎 发表评论: