百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

如何使用 Python 操作 Git 代码?GitPython 入门介绍

off999 2025-05-28 19:37 6 浏览 0 评论

花下猫语: 今天,我在查阅如何用 Python 操作 Gitlab 的时候,看到这篇文章,觉得还不错,特分享给大家。文中还提到了其它几种操作 Git 的方法,后续有机会的话,再陆续分享之~~

作者:匿蟒

出处:
https://note.qidong.name/2018/01/gitpython

有时,需要做复杂的 Git 操作,并且有很多中间逻辑。 用 Shell 做复杂的逻辑运算与流程控制就是一个灾难。 所以,用 Python 来实现是一个愉快的选择。 这时,就需要在 Python 中操作 Git 的库。

GitPython 简介

GitPython是一个与Git库交互的Python库,包括底层命令(Plumbing)与高层命令(Porcelain)。 它可以实现绝大部分的Git读写操作,避免了频繁与Shell交互的畸形代码。 它并非是一个纯粹的Python实现,而是有一部分依赖于直接执行git命令,另一部分依赖于GitDB。

GitDB也是一个Python库。 它为.git/objects建立了一个数据库模型,可以实现直接的读写。 由于采用流式(stream)读写,所以运行高效、内存占用低。

GitPython安装

 pip install GitPython

其依赖GitDB会自动安装,不过可执行的git命令需要额外安装。

基本用法

init

 
 import git
 repo = git.Repo.init(path='.')

这样就在当前目录创建了一个Git库。 当然,路径可以自定义。

由于git.Repo实现了__enter__与__exit__,所以可以与with联合使用。

 
 with git.Repo.init(path='.') as repo:
 # do sth with repo

不过,由于只是实现了一些清理操作,关闭后仍然可以读写,所以使用这种形式的必要性不高。 详见附录。

clone

clone分两种。 一是从当前库clone到另一个位置:

 
 new_repo = repo.clone(path='../new')

二是从某个URL那里clone到本地某个位置:

 
 new_repo = git.Repo.clone_from(url='git@github.com:USER/REPO.git', to_path='../new')

commit

 with open('test.file', 'w') as fobj:
 fobj.write('1st line\n')
 repo.index.add(items=['test.file'])
 repo.index.commit('write a line into test.file')
 
 with open('test.file', 'aw') as fobj:
 fobj.write('2nd line\n')
 repo.index.add(items=['test.file'])
 repo.index.commit('write another line into test.file')

status

GitPython并未实现原版git status,而是给出了部分的信息。

 
 >>> repo.is_dirty()
 False
 >>> with open('test.file', 'aw') as fobj:
 >>> fobj.write('dirty line\n')
 >>> repo.is_dirty()
 True
 
 >>> repo.untracked_files
 []
 >>> with open('untracked.file', 'w') as fobj:
 >>> fobj.write('')
 >>> repo.untracked_files
 ['untracked.file']

checkout(清理所有修改)

 
 >>> repo.is_dirty()
 True
 >>> repo.index.checkout(force=True)
 <generator object <genexpr> at 0x7f2bf35e6b40>
 >>> repo.is_dirty()
 False

branch

获取当前分支:

 
 head = repo.head

新建分支:

 
 new_head = repo.create_head('new_head', 'HEAD^')

切换分支:

 
 new_head.checkout()
 head.checkout()

删除分支:

 
 git.Head.delete(repo, new_head)
 # or
 git.Head.delete(repo, 'new_head')

merge

以下演示如何在一个分支(other),merge另一个分支(master)。

 
 master = repo.heads.master
 other = repo.create_head('other', 'HEAD^')
 other.checkout()
 repo.index.merge_tree(master)
 repo.index.commit('Merge from master to other')

remote, fetch, pull, push

创建remote:

 
 remote = repo.create_remote(name='gitlab', url='git@gitlab.com:USER/REPO.git')

远程交互操作:

 
 remote = repo.remote()
 remote.fetch()
 remote.pull()
 remote.push()

删除remote:

 
 repo.delete_remote(remote)
 # or
 repo.delete_remote('gitlab')

其它

其它还有Tag、Submodule等相关操作,不是很常用,这里就不介绍了。

GitPython的优点是在做读操作时可以方便地获取内部信息,缺点是在做写操作时感觉很不顺手,隔靴搔痒。 当然,它还支持直接执行git操作。

 
 git = repo.git
 git.status()
 git.checkout('HEAD', b="my_new_branch")
 git.branch('another-new-one')
 git.branch('-D', 'another-new-one')

这……感觉又回到了老路,而且仍然感觉怪怪的。

其它操作Git的方法

subprocess

这就是所谓『老路』。 在另一个进程,执行Shell命令,并通过stdio来解析返回结果。

 
 import subprocess
 subprocess.call(['git', 'status'])

dulwich

dulwich是一个纯Python实现的Git交互库,以后有空再研究吧。

官方网站:https://www.dulwich.io/

pygit2

pygit2是基于libgit2实现的一个Python库。 底层是C,而上层Python只是接口,运行效率应该是最高的,然而孤还是放弃了。 其缺点是,需要环境中预先安装libgit2。 相比之下,GitPython只需要环境预置Git,简单多了。

官方网站:http://www.pygit2.org/

参考

  • 《GitPython Documentation》
  • 《Welcome to GitDB’s documentation!》
  • 《Git - 底层命令 (Plumbing) 和高层命令 (Porcelain)》
  • 《GitPython | Hom》

附录

在git.Repo中对context相关接口的实现如下:

 
 def __enter__(self):
 return self
 
 def __exit__(self, exc_type, exc_value, traceback):
 self.close()
 
 def __del__(self):
 try:
 self.close()
 except:
 pass
 
 def close(self):
 if self.git:
 self.git.clear_cache()
 gc.collect()
 gitdb.util.mman.collect()
 gc.collect()

可见只是一些清理操作,关闭的必要性不高。 即使关闭,也仍然可以对这个git.Repo的instance进行读写操作。

相关推荐

Python中的两个内置函数id()和type()

id()>>>id(3)2531362761072>>>id(3.222222)2531397393680>>>id(3.0)25313...

python 函数中,如何将另一个函数作为参数传递

python函数中,如何将另一个函数作为参数传递,类似C#委托defadd(a,b):"""这是一个简单的加法函数,接受两个参数并返回它们的和。""...

Python性能暴涨10倍的终极指南:7个核心技巧+代码压缩秘籍

提升Python程序运行性能,使代码运行更流畅更快,以及压缩代码,减小代码大小,下面的方法仅供大家参考,有什么更好的方法在评论区说说。1.使用NumPy/SciPy替代纯Python循环...

Python 匿名函数(Lambda 函数)详解

匿名函数(AnonymousFunction),在Python中称为lambda函数,是一种不需要使用def关键字定义的小型函数。它主要用于简化代码,特别适合需要函数对象的地方。1.基...

Python学习笔记 | 匿名函数lambda、映射函数map和过滤函数filter

什么是匿名函数?定义:没有函数名的自定义函数场景:函数体非常简单,使用次数很少,没有必要声明函数,通常搭配高阶函数使用。高阶函数是能够把函数当成参数进行传递的函数,如:映射函数map和过滤函数fil...

python练习:自定义函数调用:商品购物实例

1、商品录入dict_myshanpin_iof={101:{"商品名称":"毛毛熊","单价":25},102:{"商品名称":...

Python中如何使用Lambda函数(lambda在python中的用法)

Python和其他编程语言一样,都在其语法中添加了lambda函数,Pythonlambda是匿名函数,比常规Python自定义函数有更简洁的语法。虽然Lambda语法在开始时可能会觉得有点混乱,...

8-Python内置函数(python内置函数代码)

Python提供了丰富的内置函数,这些函数可以直接使用而无需导入任何模块。以下是一些常用的内置函数及其示例:1-print()1-1-说明输出指定的信息到控制台。1-2-例子2-len()2-1-说...

用Python进行函数式编程(python函数程序)

什么是函数式编程?函数式程序设计是一种编程范例,它把计算当作数学函数的评价,避免状态和可变数据。换句话说,函数编程(FunctionalProgramming,FP)促进没有副作用和不变变量的代码。它...

python 函数进阶(python如何进阶)

1.有名函数和匿名函数#该函数有名称,名称是adddefadd(x,y):returnx+y#改函数没有名称属于匿名函数,也叫lambda表达式lambda_add...

python自学者的分享:自定义函数、参数作用域、匿名函数、装饰器

#自定义新函数函数名newhsdefnewhs(a,b=1):#b的默认值为1,在没有传入b值时,采用默认值,,默认值参数不能放前边returna-bprint(newh...

Python 函数式编程的 8 大核心技巧,不允许你还不会

函数式编程是一种强调使用纯函数、避免共享状态和可变数据的编程范式。Python虽然不是纯函数式语言,但提供了丰富的函数式编程特性。以下是Python函数式编程的8个核心技巧:1.纯函数(...

零基础到发布:手把手教你创建并分发 Python 自定义库

作为程序员,我们经常依赖各种外部库来解决不同的问题。这些库由技术娴熟的开发者创建,为我们提供了节省时间和精力的解决方案。但你是否曾想过:“我也能创建属于自己的自定义库吗?”答案是肯定的!本文将为你详细...

打工人学Python:(七)自定义函数,打造自己的武器库

从一个简单的函数开始#!/usr/bin/envpython#-*-encoding:utf-8-*-'''@Purpose:Wordcount@...

肖sir_python自定义函数format、zip函数

python自定义函数一、常见的自定义函数已经学过的函数:list、print、set、str、type、tuple、dict、range、input等今天学的函数:format二、实战讲解(一)f...

取消回复欢迎 发表评论: