百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

2021年,你应该知道的Python打包指南

off999 2024-09-16 00:52 25 浏览 0 评论

△点击上方Python猫”关注 ,回复“1”领取电子书

花下猫语:好久没在开头写推荐语了。今天分享一篇文章,作者应该是国内唯一一位PyPA成员。如他所言,中文世界关于 Python 最新包管理发展的内容确实很少,因此他的这篇文章有很好的指导价值。恰好我之前曾翻译过PyPA维护者的三篇文章(这里),算是有一定的相关性,推荐大家作关联阅读。

作者:frostming

原题:Python打包指南2021

来源:https://frostming.com/2020/12-25/python-packaging

大家好,雕虫小技栏目又和大家见面了,谁让咱不会那些个屠龙之技,只好捉几个虫子玩玩了。写这篇文章是因为过去的两年关于pip和 Python 包管理有几个重要的 PEP 发布,然而网上(中文世界)的打包发布教程很少有针对此的更新。再加上我成为 PyPA 的成员已经尸位素餐快一年了,还是应该来做点贡献。

setup.py 真难写

似乎从有 Python 打包以来就有了setuptools这个库,你能搜到的教程,涉及打包发布的,都会让你编写那个可怕的setup.py。不知道谁能完全掌握那个东西的写法,我到现在都还不太会。说几个常用的配置:

  1. 指定依赖和可选依赖setup(
    install_requires=[
    "flask", "flask-migrate", "sqlalchemy"],
    extras_require={
    "mysql": ["mysqlclient"], "pgsql": ["psycopg2"]}
    )
    注意那两个 key 分别是install_requiresextras_require,别写错了。此外,如果你需要根据条件增减依赖的话,不要用INSTALL_REQUIRES = ["flask"]
    if sys.platform ==
    "win32":
    INSTALL_REQUIRES.append(
    "pywin32")
    setup(install_requires=INSTALL_REQUIRES)
    而应该使用Environment MarkersINSTALL_REQUIRES = [
    "flask",
    "pywin32; sys_platform == 'win32'"
    ]
    setup(install_requires=INSTALL_REQUIRES)
  2. 发布可执行程序到/binsetup(
    entry_points={
    "console_scripts": ["mybin=mypackage.main:cli"]
    }
    )
    或者 ini 写法setup(
    entry_points=
    """[console_scripts]
    mybin = mypackage.main:cli
    """

    )
    任选其一。
  3. 包含 data 文件setup(
    include_package_data=
    True # 从MANIFEST.in中读取配置
    )
    或者setup(
    package_data={
    "": ["*.json"]} # 包含所有json文件
    )
  4. 指定源代码结构,如果你使用的是src/存放包的源码这种项目结构,可以:setup(
    package_dir={
    "": "src"}
    )

打包上传和安装

打包

好了,这个万恶的setup.py我已经写好了,咱要发布 PyPI 了。第一步,打包成可分发的文件:

nbsp;python setup.py sdist bdist_wheel --universal

这条命令会同时生成源代码包(Source Distribution),和二进制包(Binary Distribution)。当然,大部分的 Python 发布包中并不真的包含二进制, 只是沿用了软件工程中的一般叫法。

其中bdist_wheel生成的二进制包是 wheel 格式(需要安装wheel才能打包),--universal的意思是这个二进制包对所有 支持的 Python 版本和 ABI 都适用,「 一处打包,到处使用」,生成的文件名类似:my_package-0.1.0-py3-none-any.whl

如果你包中有 C 扩展, 也就是打包出来的 wheel 会真的有二进制文件时就不能加这个 flag 了,这时生成的文件名类似:my_package-0.1.0-cp38-cp38-win_amd64.whl

这个文件名不是乱来的,是要遵循一定规则,下载器能直接从这个文件名获得这个包的基本信息:

上传

可能有老的教程,让你直接用python setup.py sdist bdist_wheel register upload打包上传一步到位,这个方式已经过时了不推荐使用。正确的方法应该用twine工具:

nbsp;twine upload dist/*

如果你要把上传放到 CI 里自动执行,最好生成一个 token 来使用,访问 https://pypi.org/manage/account/token/ 按提示生成一个 token,使用的时候只要用命令指定下用户名和密码:

twine upload --username __token__ --password ${{ secrets.PYPI_TOKEN }} dist/*

安装

把包上传到 PyPI 以后,pip install my-package的时候是怎么安装的呢?

  1. 访问https://pypi.org/simple/my-package,解析所有链接
  2. 若是 whl 文件,判断是否与当前 Python 版本、ABI、平台适配,加入到候选列表
  3. 从<a>标签中读取data-requires-python属性,判断是否与当前 Python 版本兼容,加入候选列表
  4. 若是源代码包,直接加入候选列表

最终在候选列表中优先选择 whl 文件为待安装的包,将包下载到本地,候选包的选择可以由pip install--only-binary--no-binary选项控制。

现在准备安装了,如果待安装的是 whl,那就非常简单,直接解压(whl 文件是一种 zip 格式),放到目标目录即可,解压后产生的文件除了代码或二进制以外,还会包含一个my_package-0.1.0.dist-info/目录,包含这个包的元数据信息,比如有哪些文件、文件 hash 值、entry_points 等等。

如果待安装的文件是源代码包,那么需要把这个压缩包解压到一个临时目录,根据包指定的方式编译构建,生成 whl 文件,再用 whl 安装同样的方法放到目标目录中。而这个指定的编译方式,在 PEP 517 提案之前,是调用python setup.py install命令。在 PEP 517 发布之后,则由 PEP 517 的 build backend 控制。

setuptools 不再是唯一的选择

PEP 517 的内容简单来说,就是在项目根目录下的pyproject.toml定义了两个特殊属性(注:其实还有第三个属性backend-path,当你的 backend 是在本地时使用。):

[build-system]
requires = ["setuptools >= 40.8.0", "wheel"]
build-backend = "setuptools.build_meta:__legacy__"

上面这个就是setuptools的 PEP 517 的配置,这样可以让老的项目,能直接用 PEP 517 的方式构建。如果你的项目中并没有pyproject.toml文件,pip能自动填充为此缺省配置。其中requires意为这个 backend 依赖的包列表,build-backend则为 backend 的具体位置。这个 backend 需要实现几个约定的接口:

  1. get_requires_for_build_wheel,构建 wheel 需要的依赖列表,这个一般没有特殊要求都是空
  2. get_requires_for_build_sdist,构建 sdist 需要的依赖列表,同上
  3. prepare_metadata_for_build_wheel,生成一个 wheel 要用的dist-info/文件夹
  4. build_wheel,生成 wheel 文件
  5. build_sdist,生成 sdist 文件

有了这些接口,pip以及其他可能的 frontend 就能从源代码构建一个 wheel 出来。因此,pyproject.toml必须被包含在源代码包中。

有了 PEP 517 的协议规范以后,backend 和 frontend 就能自由组合,不再是非setuptools不可了,实现了 PEP 517 的 backend 有:

  • Poetry-core
  • Flit-core
  • pdm-pep517
  • 所以我可以不用写 setup.py 了

    setup.py作为一个元数据的定义格式是有问题的:

    1. 必须由 Python 运行,无法静态解析
    2. 由于第 1 点,有注入恶意代码的操作可行性

    所以需要指定一个元数据的配置格式,这个格式规范最近也定下来了,它就是 PEP 621,也是使用pyproject.toml来定义的。而且,PDM已经支持这个配置格式了,仅此一家。


    阅读链接

  • Python Packaging User Guide (https://packaging.python.org/)
  • setuptools 文档 (https://setuptools.readthedocs.io/en/latest/)
  • Python 包构建接口 - PEP 517
  • Wheel 包格式 - PEP 427
  • Python 包元数据格式 - PEP 621
  • Snake bites: Beware malicious Python libraries (https://www.infoworld.com/article/3487701/snake-bites-beware-malicious-python-libraries.html)
  • 相关推荐

    python gui编程框架推荐以及介绍(python gui开发)

    Python的GUI编程框架有很多,这里为您推荐几个常用且功能强大的框架:Tkinter:Tkinter是Python的标准GUI库,它是Python内置的模块,无需额外安装。它使用简单,功能较为基础...

    python自动化框架学习-pyautogui(python接口自动化框架)

    一、适用平台:PC(windows和mac均可用)二、下载安装:推荐使用命令行下载(因为会自动安装依赖库):pipinstallPyAutoGUI1该框架的依赖库还是蛮多的,第一次用的同学耐心等...

    Python 失宠!Hugging Face 用 Rust 新写了一个 ML框架,现已低调开源

    大数据文摘受权转载自AI前线整理|褚杏娟近期,HuggingFace低调开源了一个重磅ML框架:Candle。Candle一改机器学习惯用Python的做法,而是Rust编写,重...

    Flask轻量级框架 web开发原来可以这么可爱呀~(建议收藏)

    Flask轻量级框架web开发原来可以这么可爱呀大家好呀~今天让我们一起来学习一个超级可爱又实用的PythonWeb框架——Flask!作为一个轻量级的Web框架,Flask就像是一个小巧精致的工...

    Python3使用diagrams生成架构图(python架构设计)

    目录技术背景diagrams的安装基础逻辑关系图组件簇的定义总结概要参考链接技术背景对于一个架构师或者任何一个软件工程师而言,绘制架构图都是一个比较值得学习的技能。这就像我们学习的时候整理的一些Xmi...

    几个高性能Python网络框架,高效实现网络应用

    Python作为一种广泛使用的编程语言,其简洁易读的语法和强大的生态系统,使得它在Web开发领域占据重要位置。高性能的网络框架是构建高效网络应用的关键因素之一。本文将介绍几个高性能的Python网络框...

    Web开发人员的十佳Python框架(python最好的web框架)

    Python是一种面向对象、解释型计算机程序设计语言。除了语言本身的设计目的之外,Python的标准库也是值得大家称赞的,同时Python还自带服务器。其它方面,Python拥有足够多的免费数据函数库...

    Diagram as Code:用python代码生成架构图

    工作中常需要画系统架构图,通常的方法是通过visio、processon、draw.io之类的软件,但是今天介绍的这个软件Diagrams,可以通过写Python代码完成架构图绘制,确实很co...

    分享一个2022年火遍全网的Python框架

    作者:俊欣来源:关于数据分析与可视化最近Python圈子当中出来一个非常火爆的框架PyScript,该框架可以在浏览器中运行Python程序,只需要在HTML程序中添加一些Python代码即可实现。该...

    10个用于Web开发的最好 Python 框架

    Python是一门动态、面向对象语言。其最初就是作为一门面向对象语言设计的,并且在后期又加入了一些更高级的特性。除了语言本身的设计目的之外,Python标准库也是值得大家称赞的,Python甚至还...

    使用 Python 将 Google 表格变成您自己的数据库

    图片来自Shutterstock,获得FrankAndrade的许可您知道Google表格可以用作轻量级数据库吗?GoogleSheets是一个基于云的电子表格应用程序,可以像大多数数据库管...

    牛掰!用Python处理Excel的14个常用操作总结!

    自从学了Python后就逼迫用Python来处理Excel,所有操作用Python实现。目的是巩固Python,与增强数据处理能力。这也是我写这篇文章的初衷。废话不说了,直接进入正题。数据是网上找到的...

    将python打包成exe的方式(将python文件打包成exe可运行文件)

    客户端应用程序往往需要运行Python脚本,这对于那些不熟悉Python语言的用户来说可能会带来一定的困扰。幸运的是,Python拥有一些第三方模块,可以将这些脚本转换成可执行的.exe...

    对比Excel学Python第1练:既有Excel,何用Python?

    背景之前发的文章开头都是“Python数据分析……”,使得很多伙伴以为我是专门分享Python的,但我的本意并非如此,我的重点还是会放到“数据分析”上,毕竟,Python只是一种工具而已。现在网上可以...

    高效办公:Python处理excel文件,摆脱无效办公

    一、Python处理excel文件1.两个头文件importxlrdimportxlwt其中xlrd模块实现对excel文件内容读取,xlwt模块实现对excel文件的写入。2.读取exce...

    取消回复欢迎 发表评论: