批量读取邮箱并下载Excel附件,写入Word中,高效办公
off999 2024-12-13 15:36 104 浏览 0 评论
来源:早起Python
作者:陈熹、刘早起
大家好,我是早起。
在之前的Python办公自动化专题系列文章中,我们已经讲解了如何使用Python读取、收发邮件等多个邮件管理操作,有关Python处理Excel和Word相关的理论与实战案例更是介绍了数十篇。
今天就将分享一个更复杂的真实需求,看看如何用Python读取邮件—>下载Excel附件—>将Excel指定内容填写到Word中!
一、需求描述
你在某三甲医院的医务处工作,之前已经发通知让医生们邮件申请外派医院进修,表格 申请.xlsx 类似如下:
在你收到邮件后,需要根据他们的申请表开出相应的Word介绍信:
每个人会单独自己填写好的表格以 “进修申请 xxx” 的邮件标题发到你的邮箱。申请截止日期到了,你打开邮件发现有 300 多人申请!
而手动从邮件中下载附件,打开 Excel 文件并把对应信息填写到 Word,再修改介绍信文件名为 “xxx 进修介绍信” 实在过于繁琐。
这时我们来分析如何用 Python 自动化高效完成上述任务!
二、逻辑梳理
首先我们需要将这个需求拆分成多个小任务,并分析各部分的工作逻辑。
这次的真实需求实际上和之前讲过的案例批量生成多份合同非常类似,不同之处在于需要配合邮件相关的工具完成整个需求。
本需求同样绕不开一个问题:程序如何知道要将某个信息填到何处?
为了解决这个问题,我们需要对模板 介绍信.docx 进行修改,即将需要填写的地方改成某种标识,让程序可以看到标识就明白此处应该放什么信息
采取的策略是:将需要填写的地方改成表中的列名,即:
这样程序通过文本识别就能够定位相应信息并完成替换!
因此,本次需求完整的逻辑包括:
“遍历所有邮件,将标题符合要求的邮件附件下载到指定文件夹中遍历打开文件夹下的所有 Excel 文件获取每个 Excel 表格中的信息,填写至 Word 模板中保存文件到新文件夹中”
三、代码实现
3.1 解析邮件—>下载附件
首先完成第一部分的工作,读取全部邮件:
import keyring
from imbox import Imbox
利用 keyring 库,通过系统密钥环将密码(授权码)预先在本地存储好,后面在代码中调用 keyring 库的方法,通过账号把密码取出来作为变量,降低了密码(授权码)泄露的几率 通过 imbox 库获取附件:
password = keyring.get_password("yagmail","xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
all_inbox_messages = imbox.messages()
for uid,message in all_inbox_messages:
print(message.attachments)
从需求中我们知道,特定的邮件是以 进修申请 四个字开头的,那么就可以以此为依据作为判断,获取特定邮件的附件:
password = keyring.get_password("yagmail","xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
all_inbox_messages = imbox.messages()
for uid, message in all_inbox_messages:
if message.subject[:4] == '进修申请':
pass
pass 代码就可以写附件存储了。需要把 Excel 文件存储到指定文件夹中,因此需要先利用 os 库建立文件夹。邮件部分的代码如下:
import keyring
from imbox import Imbox
import os
path = r'C:\xxx'
if not os.path.exists(path + r'\申请表文件夹'):
os.mkdir(path + r'\申请表文件夹')
password = keyring.get_password("yagmail","xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
all_inbox_messages = imbox.messages()
for uid, message in all_inbox_messages:
if message.subject[:4] == '进修申请':
if message.attachments: # 判断是否存在附件
for attachment in message.attachments:
with open(path + f'\申请表文件夹\\{attachment["filename"]}', 'wb') as file:
file.write(attachment['content'].getvalue())
3.2 读取Excel —> 写入Word
接下来的操作涉及 Excel 读取和 Word 文件的写入,需要导入相应的模块。同时建立新文件夹存放最终的介绍信:
from docx import Document
from openpyxl import load_workbook
if not os.path.exists(path + r'\介绍信文件夹'):
os.mkdir(path + r'\介绍信文件夹')
现在 申请表文件夹 中存放 300 多个 Excel 文件,可以利用 glob 库进行遍历和读取:
import glob
for file in glob.glob(path + r'\申请表文件夹\*.xlsx'):
workbook = load_workbook(file)
sheet = workbook.active
有效信息在第二行,列名(文本替换的依据)在第一行。但考虑到有的申请表可能不按常规,填写了多个人的申请,因此用循环,不局限在第二行:
for file in glob.glob(path + r'\申请表文件夹\*.xlsx'):
workbook = load_workbook(file)
sheet = workbook.active
for table_row in range(2, sheet.max_row + 1): # 考虑到有的申请表可能不按常规,填写了多个人的申请,因此用循环
# 每循环一行实例化一个新的word文件
wordfile = Document(path + r'\新模板.docx')
# 单元格需要逐个遍历,每一个都包含着有用的信息
for table_col in range(1, sheet.max_column + 1):
# 旧的文本也就是列名,已经在模板里填好了,用于文本替换,将row限定在第一行后就是列名
old_text = '#' + str(sheet.cell(row=1, column=table_col).value) + '#'
# 新的文本就是实际的信息,table_col循环到某个数值时,实际的单元格和列名就确定了
new_text = str(sheet.cell(row=table_row, column=table_col).value)
获取到信息以后就可以进行 Word 模板文件的文本替换了,根据其 文档 Document - 段落 Paragraph - 文字块 Run的三级结构,在文字块层面完成替换:
# 文档Document - 段落Paragraph - 文字块Run
all_paragraphs = wordfile.paragraphs
for paragraph in all_paragraphs:
for run in paragraph.runs:
run.text = run.text.replace(old_text, new_text)
介绍信的落款日期是当天的日期,可以考虑借助 datetime 库获取,并在替换新旧文本时同时判断 #今天日期# 这个文本是否存在,存在就替换为真实日期:
run.text = run.text.replace(old_text, new_text)
run.text = run.text.replace('#今天日期#', datetime.date.today())
最后保存即可,文件名中的姓名即为当前循环行的第一个单元格,sheet.cell(row=table_row,column=1).value
完整代码如下:
import keyring
from imbox import Imbox
from docx import Document
from openpyxl import load_workbook
import os
import glob
import datetime
path = r'C:\xxx'
if not os.path.exists(path + r'\申请表文件夹'):
os.mkdir(path + r'\申请表文件夹')
password = keyring.get_password("yagmail", "xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
all_inbox_messages = imbox.messages()
for uid, message in all_inbox_messages:
if message.subject[:4] == '进修申请':
if message.attachments:
for attachment in message.attachments:
with open(path + f'\申请表文件夹\\{attachment["filename"]}', 'wb') as file:
file.write(attachment['content'].getvalue())
if not os.path.exists(path + r'\介绍信文件夹'):
os.mkdir(path + r'\介绍信文件夹')
for file in glob.glob(path + r'\申请表文件夹\*.xlsx'):
workbook = load_workbook(file)
sheet = workbook.active
for table_row in range(2, sheet.max_row + 1): # 考虑到有的申请表可能不按常规,填写了多个人的申请,因此用循环
# 每循环一行实例化一个新的word文件
wordfile = Document(path + '\新模板.docx')
# 单元格需要逐个遍历,每一个都包含着有用的信息
for table_col in range(1, sheet.max_column + 1):
# 旧的文本也就是列名,已经在模板里填好了,用于文本替换,将row限定在第一行后就是列名
old_text = '#' + str(sheet.cell(row=1, column=table_col).value) + '#'
# 新的文本就是实际的信息,table_col循环到某个数值时,实际的单元格和列名就确定了
new_text = str(sheet.cell(row=table_row, column=table_col).value)
all_paragraphs = wordfile.paragraphs
for paragraph in all_paragraphs:
for run in paragraph.runs:
run.text = run.text.replace(old_text, new_text)
run.text = run.text.replace('#今天日期#', datetime.date.today())
wordfile.save(path + f'\\介绍信文件夹\\{sheet.cell(row=table_row,column=1).value} 进修介绍信.docx')
可以看到,整个复杂的需求就被瓦解成多个问题而成功解决!
相关推荐
- Modbus RTU 指令基本功能介绍(modbus-rtu)
-
ModbusRTU协议概述:入门级知识点ModbusRTU协议,是工业自动化领域应用广泛的串行通信协议。它简单、可靠,在各种工业设备之间建立通信桥梁,实现数据的采集和控制。ModbusRTU...
- AIOT开发选型:行空板 K10 与 M10 适用场景与选型深度解析
-
前言随着人工智能和物联网技术的飞速发展,越来越多的开发者、学生和爱好者投身于创意项目的构建。在众多的开发板中,行空板K10和M10以其独特的优势脱颖而出。本文旨在为读者提供一份详尽的行空板K...
- 程序员花了1个月时间,手搓低成本机械臂:跟着他你也能复刻一台
-
在开源硬件的广阔天地中,SO-ARM100作为一款备受瞩目的开源机械臂项目脱颖而出。它以标准化的四轴机械臂设计为核心,构建起一个开放共享的技术平台,为机械臂爱好者与开发者提供了绝佳的远程操作实践场域...
- RPC接口测试技术-Tcp 协议的接口测试
-
首先明确Tcp的概念,针对Tcp协议进行接口测试,是指基于Tcp协议的上层协议比如Http,串口,网口,Socket等。这些协议与Http测试方法类似(具体查看接口自动化测试章...
- 同事开玩笑说:你这个python程序要是外流出去了,可能会有危险
-
引言公司因为业务原因,购入了一些高灵敏高精度的振动传感器。老板说:“拿去进行测试,看看数据如何?”吭哧吭哧接入数据,一看,确实精度和灵敏度非常高。具体多高呢?将传感器固定在相关的结构物上,在办公室中人...
- STM32搭建简易环境监测站并通过网络实时上报
-
一、系统总体架构本系统以STM32F407为核心,搭建一个环境监测节点,能够采集温湿度、光照、空气质量等数据,并通过OLED屏显示,同时通过ESP8266模块实现局域网数据上报。适合室内空气监测、智慧...
- STM32通过NB-IoT模块实现远程告警推送
-
一、项目概述本系统以STM32F103C8T6作为主控核心,通过串口控制NB-IoT通信模块(移远BC26),实现对外设状态的远程监测和异常自动告警推送(如温度超限、设备震动异常等)。支持通过UDP或...
- MicroPython 玩转硬件系列3:上电执行程序
-
1.引言上一篇:MicroPython玩转硬件系列2:点灯实验我们在ESP32上实现了LED灯的闪烁,但是有一个问题,该功能的实现需要我们在串口终端里去手动执行代码,可不可以让ESP32上电后自动...
- 打标机与上位机通讯异常如何快速定位?串口工具验证流程拆解
-
打标机与上位机通信过程中出现的错误问题需要通过串口通信助手验证,主要原因在于串口通信的底层特性以及问题隔离的工程需求。以下是原理说明和验证方法:一、验证原理底层数据透明化串口通信本质上是基于二进制数据...
- 4G短信猫发送中文短信(Python)(4g短信)
-
4G短信猫发送中文短信(Python)4G短信猫发送中文短信的方式可以使用TEXT模式或者PDU模式。1.TEXT模式在TEXT模式下发送中文短信的指令序列:AT+CSCS="UCS2...
- ESP32如何刷microPython固件(esp32 固件升级)
-
目录为什么要刷microPython固件固件和工具的获取刷固件的步骤检验是否成功1.为什么要刷固件microPython是由计算机工程师DamienGeorge设计出来的,他的初衷是——用Pyth...
- CH9329双头线使用说明(双头线是干什么用的)
-
目录1.介绍说明2.测试说明3.修改为ASCII模式(CH9328字符模式)常见问题解答:1.介绍说明CH9329双头线是集成了CH9329+CH340芯片的成品线,主要作用是使用主控电脑发送串口指令...
- Windows下最简单的ESP8266_ROTS_ESP-IDF环境搭建与腾讯云SDK编译
-
前言其实也没啥可说的,只是我感觉ESP-IDF对新手来说很不友好,很容易踩坑,尤其是对业余DIY爱好者搭建环境非常困难,即使有官方文档,或者网上的其他文档,但是还是很容易踩坑,多研究,记住两点就行了,...
- CPU眼里的:Python 和 C(cpp和python)
-
“Python跟C语言有什么联系?它们在计算机系统中分别扮演着什么角色?”01提出问题Python可能是当今最热门的编程语言,凭借简洁易读的语法和强大的生态,成为许多新手程序员的首选。然而,作为一门解...
- Python在工控领域的应用与优势(python工业控制系统)
-
前言之前利用Python编写了一些S7系列的PLC调试工具和组态开发,今天就具体讲讲Python在工控领域还有哪些应用与优势。Python在工业控制工控领域的应用逐渐增多,得益于其简洁的语法、丰富的生...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)