百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Python 中的 requirements.txt 与 setup.py

off999 2024-12-07 15:55 17 浏览 0 评论

Python 中 requirements.txt、setup.py 和 setup.cfg 的用途

新手而言管理 Python 项目中的依赖项是非常具有挑战性的,这个问题是由历史原因引起的并且一直被吐槽。

在今天的文章中,我们将讨论如何正确管理 Python 项目的依赖关系。 更具体地说,将讨论 requirements.txt 文件的用途以及如何使用 setuptools 来分发自定义的Python 包并让其他用户进一步使用和开发它。除此以外还将讨论设置文件(即 setup.cfg 和 setup.py)的用途以及如何将它们与需求文件一起使用,这样可以使包开发和重新分发的过程变得更容易。

Python项目的依赖关系是什么

让我们从包依赖开始;介绍它们到底是什么以及如何正确管理它们,因为这样可以使以使 Python 项目变得更容易维护。

简单来说,依赖项是我们Python项目所依赖的外部其他的Python 包,例如在AI方向,用到最多的包就是Numpy和Pandas。在 Python 中,这些依赖通常可以在 Python 包索引 (PyPI) 或其他管理工具中找到(例如 Nexus),后面我们都以PyPI为例介绍,因为它是最常用而且大家都在用的包管理工具。

现在我们自己的 Python 项目中可能需要引用某个特定版本的第三方包有依赖。这种情况可能会导致依赖冲突的出现,因为我们所有的依赖中(至少)有两个依赖项可能依赖同一个包,但每个依赖项都需要该外部包的特定版本(比如一个需要1.0,而一个需要2.0)。这种特殊的情况我们需要告诉 pip 需要如何处理依赖关系以及我们需要哪些特定版本。

一般情况下,我们需要requirements.txt 来指定项目的依赖包和版本,所以我们先看看requirements.txt的格式

requirements.txt 文件

requirements.txt 是一个文件,列出了 Python 项目的所有依赖项。 如前所述,它还可能包含依赖项的依赖项。 列除了依赖包名称外,还可以指定特定的版本(使用 ==)、>=或<=,甚至两者都指定。

示例 requirements.txt 文件

matplotlib>=2.2
numpy>=1.15.0, <1.21.0
pandas
pytest==4.0.1

然后就可以使用以下命令通过 pip 安装这些依赖项(通常在虚拟环境中):

pip install -r requirements.txt

在上面的示例中,我们指定了一些依赖项。例如,对于没有关联版本的的 pandas 包,pip 将正常安装最新版本,除非其他依赖项之一与它有任何冲突(如果有冲突,pip 将安装满足其余依赖项指定条件的最新 pandas 版本)。对于 pytest,包管理器将安装特定版本(即 4.0.1),而对于 matplotlib,将安装至少大于或等于 2.2 的最新版本(这还是取决于是否有其他依赖项具体要求,如果没有则会安装符合条件的最新版) 。对于 numpy 包,pip 将尝试安装 1.15.0(包含)和 1.21.0(不包含)之间的最新版本。

在安装所有依赖项后,可以通过运行 pip freeze 来查看虚拟环境中安装的每个依赖项的确切版本。此命令将列出所有包及其特定版本(即 ==)。

requirements.txt 非常有用,但他只针对于我们项目的开发和发布(例如线上部署等)。如果你想将你代码发布到 PyPI 供其他人使用,那么需要的不仅仅是这个文件。

Python 中的setuptools

setuptools 是构建在 distutils 之上的包,它可以帮助开发人员快速发布 Python 包。 除此以外它还提供了使依赖管理更容易的功能。

当想要发布一个包时,通常需要填写一些元数据,例如包名、版本、依赖项、入口点等。 setuptools 就提供了简化这些操作的功能。

项目的元数据等信息需要 在setup.py 文件中定义,例如下面的demo:

from setuptools import setup
setup( 
name='demo',
author='deephub', 
version='0.1', 
install_requires=[ 
'pandas', 
'numpy',
'matplotlib',
],
# ... more options/metadata
)

我们所填写的信息都是纯声明性的,所以一个更好的方法是在名为 setup.cfg 的文件中定义这些元数据和信息,然后只需在 setup.py 文件中调用 setup ()即可。 setup.cfg 文件如下所示:

[metadata]
name = demo
author = deephub
version = 0.1
[options]
install_requires =
pandas
numpy
matplotlib

这样在我们的 setup.py 文件中只需要保留最少的代码:

from setuptools import setup
if __name__ == "__main__":
setup()

上面install_requires 参数与requirements.txt 类似,可以使用运算符 <、>、<=、> =、== 或!=,后跟版本标识符。当项目安装时会根据该配置来下载和安装依赖。

我们需要 requirements.txt 和 setup.py/setup.cfg 文件吗?

这就需要分情况对待了。首先 requirements.txt 与 setup.py 之间的通常用于实现不同的需求:

  • 如果主要用于项目开发目的,并且不打算发布到pypi上,则 requirements.txt 就足够了(即使该包是在多台机器上开发的)
  • 如果包仅在单机开发,但是需要把他作为pip的包发布到pypi上,那么 setup.py/setup.cfg 就足够了。
  • 如果包是在多台机器上开发的并且还需要把他发布到pypi上,这就需要 requirements.txt (多个机器需要相同的开发环境)和 setup.py/setup.cfg 文件(发布到pypi上)。

另外就是如果同时使用两者,setup.py( setup.cfg)文件应包含抽象依赖项列表,而 requirements.txt 文件必须包含具有每个包版本的特定引脚的具体依赖项(使用 = = 指定特定版本)。

以下是Python文档中官方的定义:

install_requires(即 setup.py)定义了单个项目的依赖关系,而requirements.txt 通常用于定义完整 Python 环境。

尽管 install_requires 要求很少,但requirements.txt 通常包含详尽的固定版本列表,以实现完整环境的可重复安装。


总结

本文中讨论了在开发 Python 项目和应用程序时适当的依赖管理的重要性。并且介绍了 requirements.txt 文件的用途以及如何将它与 setuptools 的配置文件(即 setup.py 和 setup.cfg)一起使用,这样可以保证其他开发人员可以安装、运行、开发甚至测试源代码Python 包的代码。

setuptools 并不能完全替代 requirements.txt 文件。并且在大多数情况下,可能需要这两个文件同时存在,这样才能够正确管理包依赖和进行包的发布。

作者:Giorgos Myrianthous

相关推荐

让 Python 代码飙升330倍:从入门到精通的四种性能优化实践

花下猫语:性能优化是每个程序员的必修课,但你是否想过,除了更换算法,还有哪些“大招”?这篇文章堪称典范,它将一个普通的函数,通过四套组合拳,硬生生把性能提升了330倍!作者不仅展示了“术”,更传授...

7 段不到 50 行的 Python 脚本,解决 7 个真实麻烦:代码、场景与可复制

“本文整理自开发者AbdurRahman在Stackademic的真实记录,所有代码均经过最小化删减,确保在50行内即可运行。每段脚本都对应一个日常场景,拿来即用,无需额外依赖。一、在朋...

Python3.14:终于摆脱了GIL的限制

前言Python中最遭人诟病的设计之一就是GIL。GIL(全局解释器锁)是CPython的一个互斥锁,确保任何时刻只有一个线程可以执行Python字节码,这样可以避免多个线程同时操作内部数据结...

Python Web开发实战:3小时从零搭建个人博客

一、为什么选Python做Web开发?Python在Web领域的优势很突出:o开发快:Django、Flask这些框架把常用功能都封装好了,不用重复写代码,能快速把想法变成能用的产品o需求多:行业...

图解Python编程:从入门到精通系列教程(附全套速查表)

引言本系列教程展开讲解Python编程语言,Python是一门开源免费、通用型的脚本编程语言,它上手简单,功能强大,它也是互联网最热门的编程语言之一。Python生态丰富,库(模块)极其丰富,这使...

Python 并发编程实战:从基础到实战应用

并发编程是提升Python程序效率的关键技能,尤其在处理多任务场景时作用显著。本文将系统介绍Python中主流的并发实现方式,帮助你根据场景选择最优方案。一、多线程编程(threading)核...

吴恩达亲自授课,适合初学者的Python编程课程上线

吴恩达教授开新课了,还是亲自授课!今天,人工智能著名学者、斯坦福大学教授吴恩达在社交平台X上发帖介绍了一门新课程——AIPythonforBeginners,旨在从头开始讲授Python...

Python GUI 编程:tkinter 初学者入门指南——Ttk 小部件

在本文中,将介绍Tkinter.ttk主题小部件,是常规Tkinter小部件的升级版本。Tkinter有两种小部件:经典小部件、主题小部件。Tkinter于1991年推出了经典小部件,...

Python turtle模块编程实践教程

一、模块概述与核心概念1.1turtle模块简介定义:turtle是Python标准库中的2D绘图模块,基于Logo语言的海龟绘图理念实现。核心原理:坐标系系统:原点(0,0)位于画布中心X轴:向右...

Python 中的asyncio 编程入门示例-1

Python的asyncio库是用于编写并发代码的,它使用async/await语法。它为编写异步程序提供了基础,通过非阻塞调用高效处理I/O密集型操作,适用于涉及网络连接、文件I/O...

30天学会Python,开启编程新世界

在当今这个数字化无处不在的时代,Python凭借其精炼的语法架构、卓越的性能以及多元化的应用领域,稳坐编程语言排行榜的前列。无论是投身于数据分析、人工智能的探索,还是Web开发的构建,亦或是自动化办公...

Python基础知识(IO编程)

1.文件读写读写文件是Python语言最常见的IO操作。通过数据盘读写文件的功能都是由操作系统提供的,读写文件就是请求操作系统打开一个文件对象(通常称为文件描述符),然后,通过操作系统提供的接口从这个...

Python零基础到精通,这8个入门技巧让你少走弯路,7天速通编程!

Python学习就像玩积木,从最基础的块开始,一步步搭建出复杂的作品。我记得刚开始学Python时也是一头雾水,走了不少弯路。现在回头看,其实掌握几个核心概念,就能快速入门这门编程语言。来聊聊怎么用最...

一文带你了解Python Socket 编程

大家好,我是皮皮。前言Socket又称为套接字,它是所有网络通信的基础。网络通信其实就是进程间的通信,Socket主要是使用IP地址,协议,端口号来标识一个进程。端口号的范围为0~65535(用户端口...

Python-面向对象编程入门

面向对象编程是一种非常流行的编程范式(programmingparadigm),所谓编程范式就是程序设计的方法论,简单的说就是程序员对程序的认知和理解以及他们编写代码的方式。类和对象面向对象编程:把...

取消回复欢迎 发表评论: