2021年,你应该知道的Python打包指南
off999 2024-09-16 00:52 31 浏览 0 评论
△点击上方“Python猫”关注 ,回复“1”领取电子书
花下猫语:好久没在开头写推荐语了。今天分享一篇文章,作者应该是国内唯一一位PyPA成员。如他所言,中文世界关于 Python 最新包管理发展的内容确实很少,因此他的这篇文章有很好的指导价值。恰好我之前曾翻译过PyPA维护者的三篇文章(这里),算是有一定的相关性,推荐大家作关联阅读。
作者:frostming
原题:Python打包指南2021
来源:https://frostming.com/2020/12-25/python-packaging
大家好,雕虫小技栏目又和大家见面了,谁让咱不会那些个屠龙之技,只好捉几个虫子玩玩了。写这篇文章是因为过去的两年关于pip和 Python 包管理有几个重要的 PEP 发布,然而网上(中文世界)的打包发布教程很少有针对此的更新。再加上我成为 PyPA 的成员已经尸位素餐快一年了,还是应该来做点贡献。
setup.py 真难写
似乎从有 Python 打包以来就有了setuptools这个库,你能搜到的教程,涉及打包发布的,都会让你编写那个可怕的setup.py。不知道谁能完全掌握那个东西的写法,我到现在都还不太会。说几个常用的配置:
- 指定依赖和可选依赖setup(
install_requires=["flask", "flask-migrate", "sqlalchemy"],
extras_require={"mysql": ["mysqlclient"], "pgsql": ["psycopg2"]}
)
注意那两个 key 分别是install_requires和extras_require,别写错了。此外,如果你需要根据条件增减依赖的话,不要用INSTALL_REQUIRES = ["flask"]
if sys.platform == "win32":
INSTALL_REQUIRES.append("pywin32")
setup(install_requires=INSTALL_REQUIRES)
而应该使用Environment MarkersINSTALL_REQUIRES = [
"flask",
"pywin32; sys_platform == 'win32'"
]
setup(install_requires=INSTALL_REQUIRES) - 发布可执行程序到/bin下setup(
entry_points={
"console_scripts": ["mybin=mypackage.main:cli"]
}
)
或者 ini 写法setup(
entry_points="""[console_scripts]
mybin = mypackage.main:cli
"""
)
任选其一。 - 包含 data 文件setup(
include_package_data=True # 从MANIFEST.in中读取配置
)
或者setup(
package_data={"": ["*.json"]} # 包含所有json文件
) - 指定源代码结构,如果你使用的是src/存放包的源码这种项目结构,可以:setup(
package_dir={"": "src"}
)
打包上传和安装
打包
好了,这个万恶的setup.py我已经写好了,咱要发布 PyPI 了。第一步,打包成可分发的文件:
nbsp;python setup.py sdist bdist_wheel --universal
这条命令会同时生成源代码包(Source Distribution),和二进制包(Binary Distribution)。当然,大部分的 Python 发布包中并不真的包含二进制, 只是沿用了软件工程中的一般叫法。
其中bdist_wheel生成的二进制包是 wheel 格式(需要安装wheel才能打包),--universal的意思是这个二进制包对所有 支持的 Python 版本和 ABI 都适用,「 一处打包,到处使用」,生成的文件名类似:my_package-0.1.0-py3-none-any.whl。
如果你包中有 C 扩展, 也就是打包出来的 wheel 会真的有二进制文件时就不能加这个 flag 了,这时生成的文件名类似:my_package-0.1.0-cp38-cp38-win_amd64.whl。
这个文件名不是乱来的,是要遵循一定规则,下载器能直接从这个文件名获得这个包的基本信息:
上传
可能有老的教程,让你直接用python setup.py sdist bdist_wheel register upload打包上传一步到位,这个方式已经过时了不推荐使用。正确的方法应该用twine工具:
nbsp;twine upload dist/*
如果你要把上传放到 CI 里自动执行,最好生成一个 token 来使用,访问 https://pypi.org/manage/account/token/ 按提示生成一个 token,使用的时候只要用命令指定下用户名和密码:
twine upload --username __token__ --password ${{ secrets.PYPI_TOKEN }} dist/*
安装
把包上传到 PyPI 以后,pip install my-package的时候是怎么安装的呢?
- 访问https://pypi.org/simple/my-package,解析所有链接
- 若是 whl 文件,判断是否与当前 Python 版本、ABI、平台适配,加入到候选列表
- 从<a>标签中读取data-requires-python属性,判断是否与当前 Python 版本兼容,加入候选列表
- 若是源代码包,直接加入候选列表
最终在候选列表中优先选择 whl 文件为待安装的包,将包下载到本地,候选包的选择可以由pip install的--only-binary和--no-binary选项控制。
现在准备安装了,如果待安装的是 whl,那就非常简单,直接解压(whl 文件是一种 zip 格式),放到目标目录即可,解压后产生的文件除了代码或二进制以外,还会包含一个my_package-0.1.0.dist-info/目录,包含这个包的元数据信息,比如有哪些文件、文件 hash 值、entry_points 等等。
如果待安装的文件是源代码包,那么需要把这个压缩包解压到一个临时目录,根据包指定的方式编译构建,生成 whl 文件,再用 whl 安装同样的方法放到目标目录中。而这个指定的编译方式,在 PEP 517 提案之前,是调用python setup.py install命令。在 PEP 517 发布之后,则由 PEP 517 的 build backend 控制。
setuptools 不再是唯一的选择
PEP 517 的内容简单来说,就是在项目根目录下的pyproject.toml定义了两个特殊属性(注:其实还有第三个属性backend-path,当你的 backend 是在本地时使用。):
[build-system]
requires = ["setuptools >= 40.8.0", "wheel"]
build-backend = "setuptools.build_meta:__legacy__"
上面这个就是setuptools的 PEP 517 的配置,这样可以让老的项目,能直接用 PEP 517 的方式构建。如果你的项目中并没有pyproject.toml文件,pip能自动填充为此缺省配置。其中requires意为这个 backend 依赖的包列表,build-backend则为 backend 的具体位置。这个 backend 需要实现几个约定的接口:
- get_requires_for_build_wheel,构建 wheel 需要的依赖列表,这个一般没有特殊要求都是空
- get_requires_for_build_sdist,构建 sdist 需要的依赖列表,同上
- prepare_metadata_for_build_wheel,生成一个 wheel 要用的dist-info/文件夹
- build_wheel,生成 wheel 文件
- build_sdist,生成 sdist 文件
有了这些接口,pip以及其他可能的 frontend 就能从源代码构建一个 wheel 出来。因此,pyproject.toml必须被包含在源代码包中。
有了 PEP 517 的协议规范以后,backend 和 frontend 就能自由组合,不再是非setuptools不可了,实现了 PEP 517 的 backend 有:
所以我可以不用写 setup.py 了
setup.py作为一个元数据的定义格式是有问题的:
- 必须由 Python 运行,无法静态解析
- 由于第 1 点,有注入恶意代码的操作可行性
所以需要指定一个元数据的配置格式,这个格式规范最近也定下来了,它就是 PEP 621,也是使用pyproject.toml来定义的。而且,PDM已经支持这个配置格式了,仅此一家。
阅读链接
相关推荐
- 面试官:来,讲一下枚举类型在开发时中实际应用场景!
-
一.基本介绍枚举是JDK1.5新增的数据类型,使用枚举我们可以很好的描述一些特定的业务场景,比如一年中的春、夏、秋、冬,还有每周的周一到周天,还有各种颜色,以及可以用它来描述一些状态信息,比如错...
- 一日一技:11个基本Python技巧和窍门
-
1.两个数字的交换.x,y=10,20print(x,y)x,y=y,xprint(x,y)输出:102020102.Python字符串取反a="Ge...
- Python Enum 技巧,让代码更简洁、更安全、更易维护
-
如果你是一名Python开发人员,你很可能使用过enum.Enum来创建可读性和可维护性代码。今天发现一个强大的技巧,可以让Enum的境界更进一层,这个技巧不仅能提高可读性,还能以最小的代价增...
- Python元组编程指导教程(python元组的概念)
-
1.元组基础概念1.1什么是元组元组(Tuple)是Python中一种不可变的序列类型,用于存储多个有序的元素。元组与列表(list)类似,但元组一旦创建就不能修改(不可变),这使得元组在某些场景...
- 你可能不知道的实用 Python 功能(python有哪些用)
-
1.超越文件处理的内容管理器大多数开发人员都熟悉使用with语句进行文件操作:withopen('file.txt','r')asfile:co...
- Python 2至3.13新特性总结(python 3.10新特性)
-
以下是Python2到Python3.13的主要新特性总结,按版本分类整理:Python2到Python3的重大变化Python3是一个不向后兼容的版本,主要改进包括:pri...
- Python中for循环访问索引值的方法
-
技术背景在Python编程中,我们经常需要在循环中访问元素的索引值。例如,在处理列表、元组等可迭代对象时,除了要获取元素本身,还需要知道元素的位置。Python提供了多种方式来实现这一需求,下面将详细...
- Python enumerate核心应用解析:索引遍历的高效实践方案
-
喜欢的条友记得关注、点赞、转发、收藏,你们的支持就是我最大的动力源泉。根据GitHub代码分析统计,使用enumerate替代range(len())写法可减少38%的索引错误概率。本文通过12个生产...
- Python入门到脱坑经典案例—列表去重
-
列表去重是Python编程中常见的操作,下面我将介绍多种实现列表去重的方法,从基础到进阶,帮助初学者全面掌握这一技能。方法一:使用集合(set)去重(最简单)pythondefremove_dupl...
- Python枚举类工程实践:常量管理的标准化解决方案
-
本文通过7个生产案例,系统解析枚举类在工程实践中的应用,覆盖状态管理、配置选项、错误代码等场景,适用于Web服务开发、自动化测试及系统集成领域。一、基础概念与语法演进1.1传统常量与枚举类对比#传...
- 让Python枚举更强大!教你玩转Enum扩展
-
为什么你需要关注Enum?在日常开发中,你是否经常遇到这样的代码?ifstatus==1:print("开始处理")elifstatus==2:pri...
- Python枚举(Enum)技巧,你值得了解
-
枚举(Enum)提供了更清晰、结构化的方式来定义常量。通过为枚举添加行为、自动分配值和存储额外数据,可以提升代码的可读性、可维护性,并与数据库结合使用时,使用字符串代替数字能简化调试和查询。Pytho...
- 78行Python代码帮你复现微信撤回消息!
-
来源:悟空智能科技本文约700字,建议阅读5分钟。本文基于python的微信开源库itchat,教你如何收集私聊撤回的信息。[导读]Python曾经对我说:"时日不多,赶紧用Python"。于是看...
- 登录人人都是产品经理即可获得以下权益
-
文章介绍如何利用Cursor自动开发Playwright网页自动化脚本,实现从选题、写文、生图的全流程自动化,并将其打包成API供工作流调用,提高工作效率。虽然我前面文章介绍了很多AI工作流,但它们...
- Python常用小知识-第二弹(python常用方法总结)
-
一、Python中使用JsonPath提取字典中的值JsonPath是解析Json字符串用的,如果有一个多层嵌套的复杂字典,想要根据key和下标来批量提取value,这是比较困难的,使用jsonpat...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- python计时 (73)
- python安装路径 (56)
- python类型转换 (93)
- python自定义函数 (53)
- python进度条 (67)
- python吧 (67)
- python字典遍历 (54)
- python的for循环 (65)
- python格式化字符串 (61)
- python串口编程 (60)
- python读取文件夹下所有文件 (59)
- java调用python脚本 (56)
- python操作mysql数据库 (66)
- python字典增加键值对 (53)
- python获取列表的长度 (64)
- python接口 (63)
- python调用函数 (57)
- python人脸识别 (54)
- python多态 (60)
- python命令行参数 (53)
- python匿名函数 (59)
- python打印九九乘法表 (65)
- python赋值 (62)
- python异常 (69)
- python元祖 (57)