Python实战(数据库表结构信息输出word文档)
off999 2025-07-07 22:16 39 浏览 0 评论
背景
一般企业在做信息化项目的时候,等到验收环节需要承建单位提供如需求规格说明书、概要设计、详细设计、开发计划、数据库设计等等。这么多材料中数据库设计这份材料编制特别费时,费时的编制内容部分来自于数据库表结构的定义,每张表都需要定义成word表格形式。若是项目业务规模比较多,则数据库的表数量有可能上百个。这种情况下想要一个一个编制表结构,太浪费时间了。
本文通过python编程来解决这个问题。实现目标为了:通过连接某个数据库,将数据库的所有表结构信息导出至word中。
依赖库安装
环境激活
本人是通过python conda虚拟环境来进行开发的。首先通过本地安装好的虚拟环境命令来查看一下已创建好的虚拟环境目录。如下:
conda env list
# conda environments:
#
base E:\Users\65451\anaconda3
paddle_ocr E:\Users\65451\anaconda3\envs\paddle_ocr
ppocr_label E:\Users\65451\anaconda3\envs\ppocr_label
pytorch_project E:\Users\65451\anaconda3\envs\pytorch_project
test_python * E:\Users\65451\anaconda3\envs\test_python
可以看到默认我已经激活至test_python这个虚拟环境下。若想激活进入其它虚拟环境,可通过命令:
conda deactivate
conda activate pytorch_project
这样就激活进入pytorch_project虚拟环境了。本文依旧使用test_python虚拟环境进行实践。进入该虚拟环境下,可通过pip命令进行安装扩展包信息。
环境依赖安装
若想实现本文目标,需安装python-docx、pymysql 两个扩展包,安装命令如下:
pip install python-docx --upgrade
打印输出内容为:
Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Requirement already satisfied: python-docx in e:\users\65451\anaconda3\envs\test_python\lib\site-packages (1.1.2)
Requirement already satisfied: lxml>=3.1.0 in e:\users\65451\anaconda3\envs\test_python\lib\site-packages (from python-docx) (5.4.0)
Requirement already satisfied: typing-extensions>=4.9.0 in e:\users\65451\anaconda3\envs\test_python\lib\site-packages (from python-docx) (4.13.2)
正常情况下会顺利的安装,我这边因为已经安装过了这个扩展,所以会提示Requirement already satisfied。所以下载速度慢,可以更换pip镜像源,推进使用清华大学的地址。如下:
https://pypi.tuna.tsinghua.edu.cn/simple
执行镜像源地址下载安装包命令如下:
pip install python-docx -i https://pypi.tuna.tsinghua.edu.cn/simple
pymysql扩展包安装与python-docx一样。举简单例子:
pip install pymysql -i https://pypi.tuna.tsinghua.edu.cn/simple
默认情况下是下载两个包的最新版本。通过命令查看扩展包是否已经安装完成。如下:
pip list
打印内容为:
------------------ ---------
certifi 2025.1.31
charset-normalizer 3.4.1
idna 3.10
lxml 5.4.0
pip 25.0
PyMySQL 1.1.1
python-docx 1.1.2
requests 2.32.3
setuptools 75.8.0
typing_extensions 4.13.2
urllib3 2.3.0
wheel 0.45.1
发现两个包已经顺利安装完成了。
实现过程
连接数据库获取表信息
数据库连接,采用标准的扩展库连接方式,连接信息如下:
def generate_word_dict(dbhost, user, password, database):
# 连接数据库
conn = pymysql.connect(host=dbhost, user=user, password=password, database=database)
# 获取库里所有表的信息
cursor = conn.cursor()
# 执行获取表信息
cursor.execute("SHOW TABLES")
tables = cursor.fetchall()
定义输出表格
创建表格信息,定义生成表结构信息包含字段名称、字段类型、是否为空、默认值、主键信息、字段描述等字段,所以需要定义一个6列N行的表格。如下:
# 创建Word文档
doc = Document()
# 循环数据库表信息
for table in tables:
table_name = table[0]
# 查询某张表的表描述信息TABLE_COMMENT
cursor.execute(f"SELECT TABLE_COMMENT FROM information_schema.TABLES WHERE "
f"TABLE_SCHEMA = '{database}' and TABLE_NAME = '{table_name}'")
# 获取表描述信息,并设置word头表信息描述,如 表名:cs_user 表说明:用户管理表
for desc in cursor.fetchall():
table_desc = desc[0]
doc.add_heading("表名:{} 表说明:{}".format(table_name, table_desc), level=3)
# 创建表格
table_obj = doc.add_table(rows=1, cols=6)
# 设置第一行单元格背景颜色
set_row_background_color(table_obj.rows[0], "#D0893C")
# 设置全局表格样式,主要是为了描单元格边框
tbl = table_obj._tbl
tbl_pr = tbl.tblPr # 替代原get_or_add_tblPr()
tbl_borders = OxmlElement('w:tblBorders')
for border_type in ['top', 'left', 'bottom', 'right', 'insideH', 'insideV']:
border = OxmlElement(f'w:{border_type}')
border.set(qn('w:val'), 'single')
border.set(qn('w:sz'), '12')
#设置单元格边框颜色
border.set(qn('w:color'), '6E6E6E')
tbl_borders.append(border)
tbl_pr.append(tbl_borders)
这里设置单元格背景颜色的方法如下:
def set_row_background_color(row, color_hex):
"""
设置表格行的背景颜色
:param row: 表格行对象(如 table.rows[0])
:param color_hex: 十六进制颜色值(例如 "FF0000" 表示红色)
"""
for cell in row.cells:
tc_pr = cell._tc.get_or_add_tcPr()
shd = OxmlElement('w:shd')
shd.set(qn('w:fill'), color_hex)
tc_pr.append(shd)
添加表格数据
创建表格信息,定义生成表结构信息包含字段名称、字段类型、是否为空、默认值、主键信息、字段描述等字段,所以需要定义一个6列N行的表格。如下:
# 创建Word文档
doc = Document()
# 循环数据库表信息
for table in tables:
table_name = table[0]
# 查询某张表的表描述信息TABLE_COMMENT
cursor.execute(f"SELECT TABLE_COMMENT FROM information_schema.TABLES WHERE "
f"TABLE_SCHEMA = '{database}' and TABLE_NAME = '{table_name}'")
# 获取表描述信息,并设置word头表信息描述,如 表名:cs_user 表说明:用户管理表
for desc in cursor.fetchall():
table_desc = desc[0]
doc.add_heading("表名:{} 表说明:{}".format(table_name, table_desc), level=3)
# 创建表格
table_obj = doc.add_table(rows=1, cols=6)
# 设置第一行单元格背景颜色
set_row_background_color(table_obj.rows[0], "#D0893C")
# 设置全局表格样式,主要是为了描单元格边框
tbl = table_obj._tbl
tbl_pr = tbl.tblPr # 替代原get_or_add_tblPr()
tbl_borders = OxmlElement('w:tblBorders')
for border_type in ['top', 'left', 'bottom', 'right', 'insideH', 'insideV']:
border = OxmlElement(f'w:{border_type}')
border.set(qn('w:val'), 'single')
border.set(qn('w:sz'), '12')
#设置单元格边框颜色
border.set(qn('w:color'), '6E6E6E')
tbl_borders.append(border)
tbl_pr.append(tbl_borders)
验证
最后把上述分解的任务模块进行合并,设置测试数据库连接信息。输入打印查看结果。完整的项目代码如下:
from docx import Document
from docx.oxml import OxmlElement
from docx.oxml.ns import qn
import pymysql
def set_row_background_color(row, color_hex):
"""
设置表格行的背景颜色
:param row: 表格行对象(如 table.rows[0])
:param color_hex: 十六进制颜色值(例如 "FF0000" 表示红色)
"""
for cell in row.cells:
tc_pr = cell._tc.get_or_add_tcPr()
shd = OxmlElement('w:shd')
shd.set(qn('w:fill'), color_hex)
tc_pr.append(shd)
def generate_word_dict(dbhost, user, password, database):
# 连接数据库
conn = pymysql.connect(host=dbhost, user=user, password=password, database=database)
# 创建Word文档
doc = Document()
# 获取所有表
cursor = conn.cursor()
cursor.execute("SHOW TABLES")
tables = cursor.fetchall()
for table in tables:
table_name = table[0]
cursor.execute(f"SELECT TABLE_COMMENT FROM information_schema.TABLES WHERE "
f"TABLE_SCHEMA = '{database}' and TABLE_NAME = '{table_name}'")
for desc in cursor.fetchall():
table_desc = desc[0]
doc.add_heading("表名:{} 表说明:{}".format(table_name, table_desc), level=3)
# 创建表格
table_obj = doc.add_table(rows=1, cols=6)
set_row_background_color(table_obj.rows[0], "#D0893C")
# 设置全局表格样式
tbl = table_obj._tbl
tbl_pr = tbl.tblPr # 替代原get_or_add_tblPr()
tbl_borders = OxmlElement('w:tblBorders')
for border_type in ['top', 'left', 'bottom', 'right', 'insideH', 'insideV']:
border = OxmlElement(f'w:{border_type}')
border.set(qn('w:val'), 'single')
border.set(qn('w:sz'), '12')
border.set(qn('w:color'), '6E6E6E')
tbl_borders.append(border)
tbl_pr.append(tbl_borders)
hdr_cells = table_obj.rows[0].cells
hdr_cells[0].text = '字段名'
hdr_cells[1].text = '类型'
hdr_cells[2].text = '允许为空'
hdr_cells[3].text = '默认值'
hdr_cells[4].text = '主键'
hdr_cells[5].text = '字段说明'
'''每个字段说明'''
cursor.execute(f"SELECT COLUMN_NAME,COLUMN_COMMENT FROM information_schema.COLUMNS WHERE TABLE_SCHEMA = '{database}' and TABLE_NAME='{table_name}'")
table_rows = []
for row in cursor.fetchall():
table_rows.append(list(row))
# 填充数据
cursor.execute(f"DESCRIBE {table_name}")
num = 0
for row in cursor.fetchall():
table_details = table_rows[num]
row_cells = table_obj.add_row().cells
row_cells[0].text = row[0] # 字段名
row_cells[1].text = row[1] # 类
row_cells[2].text = '是' if row[2] == 'YES' else '否'
row_cells[3].text = str(row[4]) if row[4] != '' else ''
row_cells[4].text = row[5] if row[3] == 'PRI' else ''
row_cells[5].text = table_details[1] if row[0] == table_details[0] else ''
num = num + 1
doc.save('database_dict.docx')
if __name__ == "__main__":
# 定义你自己的数据库连接信息
host = '114.216.172.33'
user = 'root'
password = 'shuton899001'
database = 'detest'
generate_word_dict(dbhost=host, user=user, password=password, database=database)
这里dbtest是我新建的数据库,里面包含了cs_user这张表。如下:
此时执行脚本,会生成word文档,文档里的内容如下:
相关推荐
- Linux 网络协议栈_linux网络协议栈
-
前言;更多学习资料(包含视频、技术学习路线图谱、文档等)后台私信《资料》免费领取技术点包含了C/C++,Linux,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,Z...
- 揭秘 BPF map 前生今世_bpfdm
-
1.前言众所周知,map可用于内核BPF程序和用户应用程序之间实现双向的数据交换,为BPF技术中的重要基础数据结构。在BPF程序中可以通过声明structbpf_map_def...
- 教你简单 提取fmpeg 视频,音频,字幕 方法
-
ffmpeg提取视频,音频,字幕方法(HowtoExtractVideo,Audio,SubtitlefromOriginalVideo?)1.提取视频(ExtractVi...
- Linux内核原理到代码详解《内核视频教程》
-
Linux内核原理-进程入门进程进程不仅仅是一段可执行程序的代码,通常进程还包括其他资源,比如打开的文件,挂起的信号,内核内部的数据结构,处理器状态,内存地址空间,或多个执行线程,存放全局变量的数据段...
- Linux C Socket UDP编程详解及实例分享
-
1、UDP网络编程主要流程UDP协议的程序设计框架,客户端和服务器之间的差别在于服务器必须使用bind()函数来绑定侦听的本地UDP端口,而客户端则可以不进行绑定,直接发送到服务器地址的某个端口地址。...
- libevent源码分析之bufferevent使用详解
-
libevent的bufferevent在event的基础上自己维护了一个buffer,这样的话,就不需要再自己管理一个buffer了。先看看structbufferevent这个结构体struct...
- 一次解决Linux内核内存泄漏实战全过程
-
什么是内存泄漏:程序向系统申请内存,使用完不需要之后,不释放内存还给系统回收,造成申请的内存被浪费.发现系统中内存使用量随着时间的流逝,消耗的越来越多,例如下图所示:接下来的排查思路是:1.监控系统中...
- 彻底搞清楚内存泄漏的原因,如何避免内存泄漏,如何定位内存泄漏
-
作为C/C++开发人员,内存泄漏是最容易遇到的问题之一,这是由C/C++语言的特性引起的。C/C++语言与其他语言不同,需要开发者去申请和释放内存,即需要开发者去管理内存,如果内存使用不当,就容易造成...
- linux网络编程常见API详解_linux网络编程视频教程
-
Linux网络编程API函数初步剖析今天我们来分析一下前几篇博文中提到的网络编程中几个核心的API,探究一下当我们调用每个API时,内核中具体做了哪些准备和初始化工作。1、socket(family...
- Linux下C++访问web—使用libcurl库调用http接口发送解析json数据
-
一、背景这两天由于一些原因研究了研究如何在客户端C++代码中调用web服务端接口,需要访问url,并传入json数据,拿到返回值,并解析。 现在的情形是远程服务端的接口参数和返回类型都是json的字符...
- 平衡感知调节:“系统如人” 视角下的架构设计与业务稳定之道
-
在今天这个到处都是数字化的时代,系统可不是一堆冷冰冰的代码。它就像一个活生生的“数字人”,没了它,业务根本转不起来。总说“技术要为业务服务”,但实际操作起来问题不少:系统怎么才能快速响应业务需求?...
- 谈谈分布式文件系统下的本地缓存_什么是分布式文件存储
-
在分布式文件系统中,为了提高系统的性能,常常会引入不同类型的缓存存储系统(算法优化所带来的的效果可能远远不如缓存带来的优化效果)。在软件中缓存存储系统一般可分为了两类:一、分布式缓存,例如:Memca...
- 进程间通信之信号量semaphore--linux内核剖析
-
什么是信号量信号量的使用主要是用来保护共享资源,使得资源在一个时刻只有一个进程(线程)所拥有。信号量的值为正的时候,说明它空闲。所测试的线程可以锁定而使用它。若为0,说明它被占用,测试的线程要进入睡眠...
- Qt编写推流程序/支持webrtc265/从此不用再转码/打开新世界的大门
-
一、前言在推流领域,尤其是监控行业,现在主流设备基本上都是265格式的视频流,想要在网页上直接显示监控流,之前的方案是,要么转成hls,要么魔改支持265格式的flv,要么265转成264,如果要追求...
- 30 分钟搞定 SpringBoot 视频推拉流!实战避坑指南
-
30分钟搞定SpringBoot视频推拉流!实战避坑指南在音视频开发领域,SpringBoot凭借其快速开发特性,成为很多开发者实现视频推拉流功能的首选框架。但实际开发中,从环境搭建到流处理优...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python进度条 (67)
- python吧 (67)
- python的for循环 (65)
- python格式化字符串 (61)
- python静态方法 (57)
- python列表切片 (59)
- python面向对象编程 (60)
- python 代码加密 (65)
- python串口编程 (77)
- python封装 (57)
- python写入txt (66)
- python读取文件夹下所有文件 (59)
- python操作mysql数据库 (66)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python多态 (60)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)