百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

批量读取邮箱并下载Excel附件,写入Word中,高效办公

off999 2024-12-13 15:36 128 浏览 0 评论

来源:早起Python

作者:陈熹、刘早起

大家好,我是早起。

在之前的Python办公自动化专题系列文章中,我们已经讲解了如何使用Python读取、收发邮件等多个邮件管理操作,有关Python处理Excel和Word相关的理论与实战案例更是介绍了数十篇。

今天就将分享一个更复杂的真实需求,看看如何用Python读取邮件—>下载Excel附件—>将Excel指定内容填写到Word中

一、需求描述

你在某三甲医院的医务处工作,之前已经发通知让医生们邮件申请外派医院进修,表格 申请.xlsx 类似如下:

在你收到邮件后,需要根据他们的申请表开出相应的Word介绍信

每个人会单独自己填写好的表格以 “进修申请 xxx” 的邮件标题发到你的邮箱。申请截止日期到了,你打开邮件发现有 300 多人申请!

而手动从邮件中下载附件,打开 Excel 文件并把对应信息填写到 Word,再修改介绍信文件名为 “xxx 进修介绍信” 实在过于繁琐。

这时我们来分析如何用 Python 自动化高效完成上述任务!

二、逻辑梳理

首先我们需要将这个需求拆分成多个小任务,并分析各部分的工作逻辑。

这次的真实需求实际上和之前讲过的案例批量生成多份合同非常类似,不同之处在于需要配合邮件相关的工具完成整个需求。

本需求同样绕不开一个问题:程序如何知道要将某个信息填到何处?

为了解决这个问题,我们需要对模板 介绍信.docx 进行修改,即将需要填写的地方改成某种标识,让程序可以看到标识就明白此处应该放什么信息

采取的策略是:将需要填写的地方改成表中的列名,即:

这样程序通过文本识别就能够定位相应信息并完成替换!

因此,本次需求完整的逻辑包括:

遍历所有邮件,将标题符合要求的邮件附件下载到指定文件夹中遍历打开文件夹下的所有 Excel 文件获取每个 Excel 表格中的信息,填写至 Word 模板中保存文件到新文件夹中

三、代码实现

3.1 解析邮件—>下载附件

首先完成第一部分的工作,读取全部邮件:

import keyring
from imbox import Imbox

利用 keyring 库,通过系统密钥环将密码(授权码)预先在本地存储好,后面在代码中调用 keyring 库的方法,通过账号把密码取出来作为变量,降低了密码(授权码)泄露的几率 通过 imbox 库获取附件:

password = keyring.get_password("yagmail","xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
    all_inbox_messages = imbox.messages()
    for uid,message in all_inbox_messages:
        print(message.attachments)

从需求中我们知道,特定的邮件是以 进修申请 四个字开头的,那么就可以以此为依据作为判断,获取特定邮件的附件:

password = keyring.get_password("yagmail","xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
    all_inbox_messages = imbox.messages()
    for uid, message in all_inbox_messages:
        if message.subject[:4] == '进修申请':
              pass

pass 代码就可以写附件存储了。需要把 Excel 文件存储到指定文件夹中,因此需要先利用 os 库建立文件夹。邮件部分的代码如下:

import keyring
from imbox import Imbox
import os

path = r'C:\xxx'
if not os.path.exists(path + r'\申请表文件夹'):
    os.mkdir(path + r'\申请表文件夹')

password = keyring.get_password("yagmail","xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
    all_inbox_messages = imbox.messages()
    for uid, message in all_inbox_messages:
        if message.subject[:4] == '进修申请':
              if message.attachments: # 判断是否存在附件
                  for attachment in message.attachments:
                      with open(path + f'\申请表文件夹\\{attachment["filename"]}', 'wb') as file:
                          file.write(attachment['content'].getvalue())

3.2 读取Excel —> 写入Word

接下来的操作涉及 Excel 读取和 Word 文件的写入,需要导入相应的模块。同时建立新文件夹存放最终的介绍信:

from docx import Document
from openpyxl import load_workbook

if not os.path.exists(path + r'\介绍信文件夹'):
    os.mkdir(path + r'\介绍信文件夹')

现在 申请表文件夹 中存放 300 多个 Excel 文件,可以利用 glob 库进行遍历和读取:

import glob

for file in glob.glob(path + r'\申请表文件夹\*.xlsx'):
    workbook = load_workbook(file)
    sheet = workbook.active

有效信息在第二行,列名(文本替换的依据)在第一行。但考虑到有的申请表可能不按常规,填写了多个人的申请,因此用循环,不局限在第二行:

for file in glob.glob(path + r'\申请表文件夹\*.xlsx'):
    workbook = load_workbook(file)
    sheet = workbook.active
    for table_row in range(2, sheet.max_row + 1):  # 考虑到有的申请表可能不按常规,填写了多个人的申请,因此用循环
        # 每循环一行实例化一个新的word文件
        wordfile = Document(path + r'\新模板.docx')
        # 单元格需要逐个遍历,每一个都包含着有用的信息
        for table_col in range(1, sheet.max_column + 1):
            # 旧的文本也就是列名,已经在模板里填好了,用于文本替换,将row限定在第一行后就是列名
            old_text = '#' + str(sheet.cell(row=1, column=table_col).value) + '#'
            # 新的文本就是实际的信息,table_col循环到某个数值时,实际的单元格和列名就确定了
            new_text = str(sheet.cell(row=table_row, column=table_col).value)

获取到信息以后就可以进行 Word 模板文件的文本替换了,根据其 文档 Document - 段落 Paragraph - 文字块 Run的三级结构,在文字块层面完成替换:

# 文档Document - 段落Paragraph - 文字块Run
        all_paragraphs = wordfile.paragraphs
        for paragraph in all_paragraphs:
            for run in paragraph.runs:
                run.text = run.text.replace(old_text, new_text)

介绍信的落款日期是当天的日期,可以考虑借助 datetime 库获取,并在替换新旧文本时同时判断 #今天日期# 这个文本是否存在,存在就替换为真实日期:

                run.text = run.text.replace(old_text, new_text)
                run.text = run.text.replace('#今天日期#', datetime.date.today())

最后保存即可,文件名中的姓名即为当前循环行的第一个单元格,sheet.cell(row=table_row,column=1).value

完整代码如下:

import keyring
from imbox import Imbox
from docx import Document
from openpyxl import load_workbook
import os
import glob
import datetime

path = r'C:\xxx'
if not os.path.exists(path + r'\申请表文件夹'):
    os.mkdir(path + r'\申请表文件夹')

password = keyring.get_password("yagmail", "xxx@163.com")
with Imbox('imap.163.com', 'xxx@163.com', password) as imbox:
    all_inbox_messages = imbox.messages()
    for uid, message in all_inbox_messages:
        if message.subject[:4] == '进修申请':
              if message.attachments:
                  for attachment in message.attachments:
                      with open(path + f'\申请表文件夹\\{attachment["filename"]}', 'wb') as file:
                          file.write(attachment['content'].getvalue())

if not os.path.exists(path + r'\介绍信文件夹'):
    os.mkdir(path + r'\介绍信文件夹')

for file in glob.glob(path + r'\申请表文件夹\*.xlsx'):
    workbook = load_workbook(file)
    sheet = workbook.active
    for table_row in range(2, sheet.max_row + 1):  # 考虑到有的申请表可能不按常规,填写了多个人的申请,因此用循环
        # 每循环一行实例化一个新的word文件
        wordfile = Document(path + '\新模板.docx')
        # 单元格需要逐个遍历,每一个都包含着有用的信息
        for table_col in range(1, sheet.max_column + 1):
            # 旧的文本也就是列名,已经在模板里填好了,用于文本替换,将row限定在第一行后就是列名
            old_text = '#' + str(sheet.cell(row=1, column=table_col).value) + '#'
            # 新的文本就是实际的信息,table_col循环到某个数值时,实际的单元格和列名就确定了
            new_text = str(sheet.cell(row=table_row, column=table_col).value)

            all_paragraphs = wordfile.paragraphs
            for paragraph in all_paragraphs:
                for run in paragraph.runs:
                    run.text = run.text.replace(old_text, new_text)
                    run.text = run.text.replace('#今天日期#', datetime.date.today())

        wordfile.save(path + f'\\介绍信文件夹\\{sheet.cell(row=table_row,column=1).value} 进修介绍信.docx')

可以看到,整个复杂的需求就被瓦解成多个问题而成功解决!

相关推荐

安全教育登录入口平台(安全教育登录入口平台官网)

122交通安全教育怎么登录:122交通网的注册方法是首先登录网址http://www.122.cn/,接着打开网页后,点击右上角的“个人登录”;其次进入邮箱注册,然后进入到注册页面,输入相关信息即可完...

大鱼吃小鱼经典版(大鱼吃小鱼经典版(经典版)官方版)

大鱼吃小鱼小鱼吃虾是于谦跟郭麒麟的《我的棒儿呢?》郭德纲说于思洋郭麒麟作诗的相声,最后郭麒麟做了一首,师傅躺在师母身上大鱼吃小鱼小鱼吃虾虾吃水水落石出师傅压师娘师娘压床床压地地动山摇。...

谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
  • 谷歌地球下载高清卫星地图(谷歌地球地图下载器)
哪个软件可以免费pdf转ppt(免费的pdf转ppt软件哪个好)
哪个软件可以免费pdf转ppt(免费的pdf转ppt软件哪个好)

要想将ppt免费转换为pdf的话,我们建议大家可以下一个那个wps,如果你是会员的话,可以注册为会员,这样的话,在wps里面的话,就可以免费将ppt呢转换为pdfpdf之后呢,我们就可以直接使用,不需要去直接不需要去另外保存,为什么格式转...

2026-02-04 09:03 off999

电信宽带测速官网入口(电信宽带测速官网入口app)

这个网站看看http://www.swok.cn/pcindex.jsp1.登录中国电信网上营业厅,宽带光纤,贴心服务,宽带测速2.下载第三方软件,如360等。进行在线测速进行宽带测速时,尽...

植物大战僵尸95版手机下载(植物大战僵尸95 版下载)

1可以在应用商店或者游戏平台上下载植物大战僵尸95版手机游戏。2下载教程:打开应用商店或者游戏平台,搜索“植物大战僵尸95版”,找到游戏后点击下载按钮,等待下载完成即可安装并开始游戏。3注意:确...

免费下载ppt成品的网站(ppt成品免费下载的网站有哪些)

1、Chuangkit(chuangkit.com)直达地址:chuangkit.com2、Woodo幻灯片(woodo.cn)直达链接:woodo.cn3、OfficePlus(officeplu...

2025世界杯赛程表(2025世界杯在哪个国家)

2022年卡塔尔世界杯赛程公布,全部比赛在卡塔尔境内8座球场举行,2022年,决赛阶段球队全部确定。揭幕战于当地时间11月20日19时进行,由东道主卡塔尔对阵厄瓜多尔,决赛于当地时间12月18日...

下载搜狐视频电视剧(搜狐电视剧下载安装)

搜狐视频APP下载好的视频想要导出到手机相册里方法如下1、打开手机搜狐视频软件,进入搜狐视频后我们点击右上角的“查找”,找到自已喜欢的视频。2、在“浏览器页面搜索”窗口中,输入要下载的视频的名称,然后...

pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
  • pubg免费下载入口(pubg下载入口官方正版)
永久免费听歌网站(丫丫音乐网)

可以到《我爱音乐网》《好听音乐网》《一听音乐网》《YYMP3音乐网》还可以到《九天音乐网》永久免费听歌软件有酷狗音乐和天猫精灵,以前要跳舞经常要下载舞曲,我从QQ上找不到舞曲下载就从酷狗音乐上找,大多...

音乐格式转换mp3软件(音乐格式转换器免费版)

有两种方法:方法一在手机上操作:1、进入手机中的文件管理。2、在其中选择“音乐”,将显示出手机中的全部音乐。3、点击“全选”,选中所有音乐文件。4、点击屏幕右下方的省略号图标,在弹出菜单中选择“...

电子书txt下载(免费的最全的小说阅读器)

1.Z-library里面收录了近千万本电子书籍,需求量大。2.苦瓜书盘没有广告,不需要账号注册,使用起来非常简单,直接搜索预览下载即可。3.鸠摩搜书整体风格简洁清晰,书籍资源丰富。4.亚马逊图书书籍...

最好免费观看高清电影(播放免费的最好看的电影)

在目前的网上选择中,IMDb(互联网电影数据库)被认为是最全的电影网站之一。这个网站提供了各种类型的电影和电视节目的海量信息,包括剧情介绍、演员表、评价、评论等。其还提供了有关电影制作背后的详细信息,...

孤单枪手2简体中文版(孤单枪手2简体中文版官方下载)

要将《孤胆枪手2》游戏的征兵秘籍切换为中文,您可以按照以下步骤进行操作:首先,打开游戏设置选项,通常可以在游戏主菜单或游戏内部找到。然后,寻找语言选项或界面选项,点击进入。在语言选项中,选择中文作为游...

取消回复欢迎 发表评论: