06《Python 办公自动化教程》Word 转换 PDF
off999 2024-09-21 20:59 30 浏览 0 评论
在工作中 Word 文档通常不是最终版本,在发给甲方或者其他同事时,我们还需要把Word文档转换为PDF格式文件。那为什么需要转换 PDF,直接发 Word 文档又有什么问题?
其实直接发 Word 文档问题还是挺大的,可以大致总结以下几点:
- 由于每个人使用的软件或版本都不统一,可能你使用的是微软的 Office2007,而他使用的是金山WPS,这样有可能你本地样式已经好好的 Word 文档,在别人电脑上就出现了乱码;
- PDF 可以直接预览,目前主流浏览器都已经支持;
- PDF 文件无法修改,保证了信息安全。
了解了转换 PDF 格式文件的作用之后,接下来这一小节中,将介绍 Python 第三方模块 pywin32 实现Word 文档转换为 PDF 格式文件。
1. pywin32 模块介绍
在 Windows 上如需使用 Python 编写脚本,很多时候都需要用到 Windows API,但 Python 是没有自带访问 Windows 系统 API 的标准库,所以这时可以使用第三方库 pywin32 来解决,pywin32 模块中直接包装了几乎所有的 Windows API,让开发者可以很方便的调用。
使用 python win32 库实现 Word 转换 PDF,实际上是调用 Word 底层 vba,利用 Word 导出方法完成 PDF 转换,文档地址:
1.1 安装
pywin32 是 Python 的第三方库,使用前需要通过以下命令进行安装:
pip install pywin32
1.2 使用步骤
步骤1:导入 pywin32 下所需模块
from win32com.client import constants,gencache
代码块1
步骤2:启动一个新的 Word 进程
word=gencache.EnsureDispatch('Word.Application')
代码块1
步骤3:读取要转换的 Word 文档
doc=word.Documents.Open(wordPath,ReadOnly=1)
代码块1
步骤4:转换 PDF 格式文件
doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF)
代码块1
ExportAsFixedFormat() 方法可以将文档保存为 PDF 或 XPS 格式,第一个参数指定新的 PDF 或 XPS 文件的路径和文件名,第二个参数是一个枚举值(取值包括:wdExportFormatPDF 和 wdExportFormatXPS)用于指定转换的格式,上述代码中要将文档转换为 PDF 在设置时设置为constants.wdExportFormatPDF。
2. Word 文档转换 PDF
接下来,通过 pywin32 模块分别实现单个 Word 文档的转换和多个Word 文档的转换。
2.1 单个文件转换
根据pywin32模块的使用步骤,封装转换方法 createpdf 方法,代码如下:
def createpdf(wordPath,pdfPath):
word=gencache.EnsureDispatch('Word.Application')
doc=word.Documents.Open(wordPath,ReadOnly=1)
#转换方法
doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF)
代码块12345
代码解释:EnsureDispatch() 方法为启动一个新的 Word 进程,通过启动的 Word 进程读取传入指定的Word 文档,打开 Word 文档后,通过 ExportAsFixedFormat() 方法进行导出 PDF,第一个参数为指定的PDF 文件存储路径,第二个参数为指定导出文件的类型,除 PDF 外,还可以传入 XPS 格式。执行完成后,生成了 “info.pdf” 格式文件,效果如下图所示:
2.2 多个文件转换
完成单个 Word 文档转换之后,日常工作中有时会涉及到批量 Word文 档的转换,这时可以在单个Word 文档转换代码的基础上进行完善,修改后代码如下:
from win32com.client import constants,gencache
import os
def createpdf(wordPath,pdfPath):
word=gencache.EnsureDispatch('Word.Application')
doc=word.Documents.Open(wordPath,ReadOnly=1)
#转换方法
doc.ExportAsFixedFormat(pdfPath,constants.wdExportFormatPDF)
#多个文件的转换
print(os.listdir('.')) #当前文件夹下的所有文件
wordfiles=[]
for file in os.listdir('.'):
if file.endswith(('.doc','.docx')):
wordfiles.append(file)
for file in wordfiles:
filepath=os.path.abspath(file)
index=filepath.rindex('.')
# 拼接文件名及.pdf后缀
pdfpath=filepath[:index]+'.pdf'
createpdf(filepath,pdfpath)
代码解释:通过 Python 中内置的os模块,读取指定目录获取所有的 Word 文档,保存在wordfiles中。通过for…in循环wordfiles,在循环中,首先根据abspath()方法得到文档的绝对路径,将文档名称拼接.pdf作为PDF文件的新名称。调用封装好的createpdf() 方法将文档路径和PDF文件路径传入,进行文件转换。执行完成后,在指定目录就批量生成 PDF 格式文件。
3. pywin32 模块拓展
前面提到pywin32 模块中直接包装了几乎所有的 Windows API,除了前面小节介绍的转换PDF外,还可以进行如下操作,一起来体验下吧!
3.1 弹出MessageBox消息框
使用pywin32实现系统消息框的弹出,代码如下:
import win32api
import win32con
win32api.MessageBox(0, "Hello Python", "消息框标题", win32con.MB_OK)
代码块123
代码解释:MessageBox() 方法弹出消息框,第一个参数标识要创建的消息框的所有者窗口,第二个参数指向要显示的消息,第三个参数表示对话框标题,第四个参数指定一组位标志来确定对话框的内容和行为,取值范围如下:
- MB_ABORTRETRYIGNORE:消息框包含三个按钮:中止,重试和忽略;
- MB_OK:消息框包含一个按钮:OK。这是默认值;
- MB_OKCANCEL:消息框包含两个按钮:确定和取消;
- MB_RETRYCANCEL:消息框包含两个按钮:重试和取消;
- MB_YESNO:消息框包含两个按钮:是和否;
- MB_YESNOCANCEL:消息框包含三个按钮:是,否和取消。
执行完成后,弹出消息框效果如下图所示:
3.2 模拟键盘操作
使用 pywin32 模拟按下键盘的回车键(Enter),代码如下:
import win32api,win32con
win32api.keybd_event(13,0,win32con.KEYEVENTF_EXTENDEDKEY)
代码解释:keybd_event() 方法为触发键盘事件,第一个参数为虚拟键码(13表示回车键),第二个参数为硬件扫描码,一般设置为0即可,第三个参数表示操作的标志位,如果值为KEYEVENTF_EXTENDEDKEY则该键被按下,值为KEYEVENTF_KEYUP则该按键被释放。
4. 小结
本节课程我们主要学习了 pywin32 模块的使用。本节课程的重点如下:
- 了解pywin32模块作用及使用步骤;
- 掌握 pywin32模块实现Word文档转换PDF格式文件的方法;
相关推荐
- Alist 玩家请进:一键部署全新分支 Openlist,看看香不香!
-
Openlist(其前身是鼎鼎大名的Alist)是一款功能强大的开源文件列表程序。它能像“万能钥匙”一样,解锁并聚合你散落在各处的云盘资源——无论是阿里云盘、百度网盘、GoogleDrive还是...
- 白嫖SSL证书还自动续签?这个开源工具让我告别手动部署
-
你还在手动部署SSL证书?你是不是也遇到过这些问题:每3个月续一次Let'sEncrypt证书,忘了就翻车;手动配置Nginx,重启服务,搞一次SSL得花一下午;付费证书太贵,...
- Docker Compose:让多容器应用一键起飞
-
CDockerCompose:让多容器应用一键起飞"曾经我也是一个手动启动容器的少年,直到我的膝盖中了一箭。"——某位忘记--link参数的运维工程师引言:容器化的烦恼与...
- 申请免费的SSL证书,到期一键续签
-
大家好,我是小悟。最近帮朋友配置网站HTTPS时发现,还有人对宝塔面板的SSL证书功能还不太熟悉。其实宝塔早就内置了免费的Let'sEncrypt证书申请和一键续签功能,操作简单到连新手都能...
- 飞牛NAS部署TVGate Docker项目,实现内网一键转发、代理、jx
-
前面分享了两期TVGate:Q大的转发代理工具TVGate升级了,操作更便捷,增加了新的功能跨平台内网转发神器TVGate部署与使用初体验现在项目已经开源,并支持Docker部署,本文介绍如何通...
- Docker Compose 编排实战:一键部署多容器应用!
-
当项目变得越来越复杂,一个服务已经无法满足需求时,你可能需要同时部署数据库、后端服务、前端网页、缓存组件……这时,如果还一个一个手动dockerrun,简直是灾难这就是DockerCompo...
- 深度测评:Vue、React 一键部署的神器 PinMe
-
不知道大家有没有这种崩溃瞬间:领导突然要看项目Demo,客户临时要体验新功能,自己写的小案例想发朋友圈;找运维?排期?还要走工单;自己买服务器?域名、SSL、Nginx、防火墙;本地起服务?断电、关...
- 超简单!一键启动多容器,解锁 Docker Compose 极速编排秘籍
-
想要用最简单的方式在本地复刻一套完整的微服务环境?只需一个docker-compose.yml文件,你就能一键拉起N个容器,自动组网、挂载存储、环境隔离,全程无痛!下面这份终极指南,教你如何用...
- 日志文件转运工具Filebeat笔记_日志转发工具
-
一、概述与简介Filebeat是一个日志文件转运工具,在服务器上以轻量级代理的形式安装客户端后,Filebeat会监控日志目录或者指定的日志文件,追踪读取这些文件(追踪文件的变化,不停的读),并将来自...
- K8s 日志高效查看神器,提升运维效率10倍!
-
通常情况下,在部署了K8S服务之后,为了更好地监控服务的运行情况,都会接入对应的日志系统来进行检测和分析,比如常见的Filebeat+ElasticSearch+Kibana这一套组合...
- 如何给网站添加 https_如何给网站添加证书
-
一、简介相信大家都知道https是更加安全的,特别是一些网站,有https的网站更能够让用户信任访问接下来以我的个人网站五岁小孩为例子,带大家一起从0到1配置网站https本次配置的...
- 10个Linux文件内容查看命令的实用示例
-
Linux文件内容查看命令30个实用示例详细介绍了10个Linux文件内容查看命令的30个实用示例,涵盖了从基本文本查看、分页浏览到二进制文件分析的各个方面。掌握这些命令帮助您:高效查看各种文本文件内...
- 第13章 工程化实践_第13章 工程化实践课
-
13.1ESLint+Prettier代码规范统一代码风格配置//.eslintrc.jsmodule.exports={root:true,env:{node...
- 龙建股份:工程项目中标_龙建股份有限公司招聘网
-
404NotFoundnginx/1.6.1【公告简述】2016年9月8日公告,公司于2016年9月6日收到苏丹共和国(简称“北苏丹”)喀土穆州基础设施与运输部公路、桥梁和排水公司出具的中标通知书...
- 福田汽车:获得政府补助_福田 补贴
-
404NotFoundnginx/1.6.1【公告简述】2016年9月1日公告,自2016年8月17日至今,公司共收到产业发展补助、支持资金等与收益相关的政府补助4笔,共计5429.08万元(不含...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)