百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

【Python自动化系列】批量提交文件到各个仓库并创建PR到指定分支

off999 2024-11-12 12:00 23 浏览 0 评论

一、问题

本地有一个文件夹openEuler-22.03-LTS(如下图所示),文件夹名是远程(Gitee平台)仓库的分支名,文件都是yaml文件,文件名对应仓库名,都是https://gitee.com/src-oepkgs/下的仓库,需要将每个文件依次添加到各自对应的仓库中,并提交PR到远程仓库的openEuler-22.03-LTS分支上。

二、思路1:走fork进行合并

先fork后clone,PR在相同的分支不同的用户(fork和被fork的用户)之间

Step1

由文件名解析出仓库名,与https://gitee.com/src-oepkgs/进行拼接,得到仓库的完整地址,比如:https://gitee.com/src-oepkgs/a2jmidid.git,为例

Step2

这个仓库fork到自己的账号(自己也当成组织),此时这个仓库的归属权是我,这个仓库的地址变为https://gitee.com/oepkgs-support/a2jmidid

Step3

将fork后(归属权是我)的仓库https://gitee.com/oepkgs-support/a2jmidid.git克隆指定分支(openEuler-22.03-LTS分支)到本地(电脑)D:/workspace/自动化/openEuler-22.03-LTS文件夹下,D:/workspace/自动化/openEuler-22.03-LTS/a2jmidid

git clone -b openEuler-22.03-LTS https://gitee.com/oepkgs-support/a2jmidid.git

Step4

进入到这个仓库文件夹,会自动会切换到本地的openEuler-22.03-LTS分支

Step5

取回远程主机openEuler-22.03-LTS分支的更新,再与本地的openEuler-22.03-LTS分支合并

git pull origin openEuler-22.03-LTS: openEuler-22.03-LTS

Step6

将openEuler-22.03-LTS文件夹下的a2jmidid.yaml文件复制到这个项目仓库(文件夹:D:/workspace/自动化/openEuler-22.03-LTS / a2jmidid)中

Step7

提交并推送到远程的openEuler-22.03-LTS分支

git add -A
git commit -m ‘add files’
git push origin openEuler-22.03-LTS:openEuler-22.03-LTS

这里直接push到远程的openEuler-22.03-LTS分支是可以的,因为这个push是在本地oepkgs-support/a2jmidid和远程的oepkgs-support/a2jmidid这同一个用户之间。oepkgs-support(人)是这个仓库的所有者,有直接推送这个权限。

Step8

创建oepkgs-support:openEuler-22.03-LTS这个分支到src-oepkgs:openEuler-22.03-LTS分支的PR:https://gitee.com/src-oepkgs/a2jmidid/pulls/1

完整代码:

import os
import subprocess
import time
import requests
import shutil
import pandas as pd


def fork_repo(repo_name):
    # # 仓库信息
    owner = "src-oepkgs"  # 替换为要Fork的用户名
    # 授权信息
    access_token = 'xxxxxxxxxxx' # 替换为自己账号的访问令牌
    # API URL
    url = f"https://gitee.com/api/v5/repos/{owner}/{repo_name}/forks"
    # 请求头
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {access_token}"
    }
    # 发送POST请求进行Fork操作
    response = requests.post(url, headers=headers)
    # 检查响应状态码
    if response.status_code == 201:
        print("Fork created successfully!")
        print("Forked repository URL:", response.json()["html_url"])
    else:
        print("Failed to create Fork.")
        print("Error message:", response.json()["message"])

def delete_repository(repo_name):
    owner = "oepkgs-support"  # 替换仓库所属空间地址
    access_token = 'xxxxxxxxxxx'  # 替换为你的访问令牌
    url = f"https://gitee.com/api/v5/repos/{owner}/{repo_name}"
    headers = {
        "Authorization": f"Bearer {access_token}"
    }
    response = requests.delete(url, headers=headers)
    if response.status_code == 204:
        print("仓库删除成功")
    else:
        print("仓库删除失败")

def git_add_commit_push(repo_path, file_name, branch):
    """执行 git add, commit, push"""
    os.chdir(repo_path)
    # subprocess.run(["git", "pull", "origin", branch, ":", branch])
    subprocess.run(["git", "add", file_name])
    subprocess.run(["git", "commit", "-m", f"Add {file_name}"])
    subprocess.run(["git", "push", "origin", f"{branch}:{branch}"])

def create_pr(repo_name):
    # 仓库信息
    owner = "src-oepkgs"  # 替换仓库所属空间地址
    # 授权信息
    access_token = 'xxxxxxxxxxxxx'  # 替换为自己账号的访问令牌
    # 创建Pull Request的参数
    title = "add yaml file"
    head = "oepkgs-support:openEuler-22.03-LTS"  # 替换为您的源分支名称
    base = "openEuler-22.03-LTS"  # 替换为您的目标分支名称
    # API URL
    url = f"https://gitee.com/api/v5/repos/{owner}/{repo_name}/pulls"
    # 请求头
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {access_token}"
    }
    # 请求体
    data = {
        "title": title,
        "head": head,
        "base": base
    }
    # 发送POST请求创建Pull Request
    response = requests.post(url, headers=headers, json=data)
    # 检查响应状态码
    if response.status_code == 201:
        print("Pull Request created successfully!")
        print("Pull Request URL:", response.json()["html_url"])
    else:
        print("Failed to create Pull Request.")
        print("Error message:", response.json()["message"])

def main():
    # 本地文件夹路径和远程分支名
    basedir = os.path.abspath(os.path.dirname(os.path.dirname(__file__)))
    local_folder = os.path.join(basedir, "openEuler-22.03-LTS")  # 本地文件夹路径
    branch_name = "openEuler-22.03-LTS"

    index = 0
    abnormal_repo = []
    start_ = 'a'
    end_ = 'z'

    # 遍历文件夹中的每个文件
    for file_name in os.listdir(local_folder):
        # if file_name.endswith('.yaml'):
        if file_name.lower().endswith('.yaml') and start_ <= file_name[0].lower() <= end_:
            # 解析出文件名
            repo_name = file_name.replace('.yaml', '')  # 从文件名获取仓库名
            print(repo_name)
            index = index + 1
            # fork仓库
            try:
                fork_repo(repo_name)
                fork_repo_url = f"https://gitee.com/oepkgs-support/{repo_name}.git"
                # 克隆仓库(如果需要)
                repo_path = os.path.join(local_folder, repo_name)
                if not os.path.exists(repo_path):
                    try:
                        subprocess.run(["git", "clone", "-b", branch_name, fork_repo_url, repo_path])
                    except Exception:
                        abnormal_repo.append(repo_name)
                    else:
                        # 判断repopath这个文件夹存不存在
                        if os.path.exists(repo_path):
                            print('clone success')
                            # 先pull一下,取回远程主机openEuler-22.03-LTS分支的更新
                            os.chdir(repo_path)
                            subprocess.run(["git", "config", "--global", "http.sslVerify", "true"])
                            subprocess.run(["git", "pull", "origin", branch_name])

                            # 将文件复制到仓库目录中
                            file_path = os.path.join(local_folder, file_name)
                            shutil.copy(file_path, repo_path)

                            # 执行 git 操作
                            git_add_commit_push(repo_path, file_name, branch_name)

                            # 创建PR
                            create_pr(repo_name)
                            print(repo_path)
                            try:
                                # os.system(f"attrib -r {repo_path}")
                                # shutil.rmtree(repo_path)
                                # remove_readonly_dir(repo_path)
                                # os.removedirs(repo_path)
                                subprocess.run(["rmdir", "/s", "/q", repo_path], shell=True)
                            except Exception as e:
                                print("删除文件夹时出现错误:", str(e))

                        else:
                            abnormal_repo.append(repo_name)
            except Exception as e:
                print("fork出现错误:", str(e))
                abnormal_repo.append(repo_name)
                time.sleep(30)
                fork_repo(repo_name)

            if index % 100 == 0:
                print(abnormal_repo)
                df = pd.DataFrame(abnormal_repo, columns=['异常仓库'])
                df.to_excel(os.path.join(basedir, 'log') + '\\' + f'{start_}-{end_}异常仓库{index}.xlsx', index=False)

if __name__ == "__main__":
    main()


问题1:fork不成功

fork出现错误: HTTPSConnectionPool(host='gitee.com', port=443): Max retries exceeded with url: /api/v5/repos/src-oepkgs/gtk-theme-adwaita-tweaks/forks (Caused by SSLError(SSLEOFError(8, 'EOF occurred in violation of protocol (_ssl.c:1129)')))

解决方法:引入异常捕获,增加时延,记录异常的仓库

问题2:fork成功但是不一定能够克隆下来

git clone时fatal: unable to access ‘https://gitee.com/XXX.git/‘: The requested returned error: 500

解决方法:引入异常捕获,记录异常的仓库

问题3:每个账号fork的项目数量有限制,最多1k,如果创建的PR没有合并,删除这个fork的仓库,这个PR也会被删除

换一种思路,走分支合并,不走fork合并。

三、走分支合并

不fork,直接clone原仓库,在远程源仓库创建新分支,走分支合并,PR合并在同一个用户的不同分支之间。

Step1

直接克隆原仓库到本地:git clone -b openEuler-22.03-LTS https://gitee.com/src-oepkgs/python-zeroconf.git

step2

进入到这个仓库文件夹,自动会切换到本地的openEuler-22.03-LTS分支

step3

取回远程主机openEuler-22.03-LTS分支的更新,再与本地的openEuler-22.03-LTS分支合并

git pull origin openEuler-22.03-LTS: openEuler-22.03-LTS

step4

将openEuler-22.03-LTS文件夹下的a2jmidid.yaml文件复制到这个项目仓库中

step5

提交并推送到远程的openEuler-22.03-LTS-yaml分支(相当于在远程建了一个新的openEuler-22.03-LTS-yaml分支并push到这个分支)

git add -A
git commit -m ‘add files’
git push origin openEuler-22.03-LTS:openEuler-22.03-LTS-yaml

这里直接push到远程的openEuler-22.03-LTS是会报错的,因为这个push是在本地oepkgs/a2jmidid和远程的oepkgs/a2jmidid这同一个用户之间,oepkgs-support(人)不是仓库a2jmidid的管理员(所有者或开发者),没有直接推送这个权限,万一提交不当会直接污染这个远程分支,因此需要在远程新建一个分支push到这个新分支,然后创建openEuler-22.03-LTS-yaml这个分支到openEuler-22.03-LTS分支的PR进行合并。

step6

创建src-oepkgs:openEuler-22.03-LTS-yaml这个分支到src-oepkgs:openEuler-22.03-LTS分支的PR

完整代码:

import os
import subprocess
import time
import requests
import shutil
import pandas as pd


def git_add_commit_push(repo_path, file_name, branch):
    """执行 git add, commit, push"""
    os.chdir(repo_path)
    subprocess.run(['git', 'config', '--global', 'core.autocrlf', 'true'])
    subprocess.run(["git", "add", file_name])
    subprocess.run(["git", "commit", "-m", f"Add {file_name}"])
    subprocess.run(["git", "push", "origin", f"{branch}:{branch}-yaml"])


def create_pr(repo_name):
    # 仓库信息
    owner = "src-oepkgs"  # 替换仓库所属空间地址
    # 授权信息
    access_token = '4e8xxxx250afc5a19'  # 自己账号的访问令牌
    # 创建Pull Request的参数
    title = "add yaml file"
    head = "openEuler-22.03-LTS-yaml"  # 源分支名称
    base = "openEuler-22.03-LTS"  # 目标分支名称
    # API URL
    url = f"https://gitee.com/api/v5/repos/{owner}/{repo_name}/pulls"
    # 请求头
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {access_token}"
    }
    # 请求体
    data = {
        "title": title,
        "head": head,
        "base": base
    }
    # 发送POST请求创建Pull Request
    response = requests.post(url, headers=headers, json=data)
    # 检查响应状态码
    if response.status_code == 201:
        print("Pull Request created successfully!")
        print("Pull Request URL:", response.json()["html_url"])
    else:
        print("Failed to create Pull Request.")
        print("Error message:", response.json()["message"])

def main():
    # 本地文件夹路径和远程分支名
    basedir = os.path.abspath(os.path.dirname(os.path.dirname(__file__)))
    local_folder = os.path.join(basedir, "openEuler-22.03-LTS")  # 本地文件夹路径
    branch_name = "openEuler-22.03-LTS"

    index = 0
    abnormal_repo = []
    start_ = 'a'
    end_ = 'z'

    # 遍历文件夹中的每个文件
    for file_name in os.listdir(local_folder):
        if file_name.lower().endswith('.yaml') and start_ <= file_name[0].lower() <= end_:
            # 解析出文件名
            repo_name = file_name.replace('.yaml', '')  # 从文件名获取仓库名
            print(repo_name)
            index = index + 1

            # 克隆仓库
            repo_url = f"https://gitee.com/src-oepkgs/{repo_name}.git"
            repo_path = os.path.join(local_folder, repo_name)
            if not os.path.exists(repo_path):
                try:
                    subprocess.run(["git", "clone", "-b", branch_name, repo_url, repo_path])
                except Exception:
                    abnormal_repo.append(repo_name)
                else:
                    # 判断repopath这个文件夹存不存在
                    if os.path.exists(repo_path):
                        print('clone success')
                        # 先pull一下,取回远程主机openEuler-22.03-LTS分支的更新
                        os.chdir(repo_path)
                        subprocess.run(["git", "config", "--global", "http.sslVerify", "true"])
                        subprocess.run(["git", "pull", "origin", branch_name])

                        # 将文件复制到仓库目录中
                        file_path = os.path.join(local_folder, file_name)
                        shutil.copy(file_path, repo_path)

                        # 执行 git 操作
                        git_add_commit_push(repo_path, file_name, branch_name)

                        # 创建PR
                        try:
                            create_pr(repo_name)
                        except Exception as e:
                            print("create pr出现错误:", str(e))
                            abnormal_repo.append(repo_name)
                            time.sleep(30)
                            create_pr(repo_name)

                        # 删除克隆的仓库文件夹内容
                        try:
                            subprocess.run(["rmdir", "/s", "/q", repo_path], shell=True)
                        except Exception as e:
                            print("删除文件夹时出现错误:", str(e))
                    else:
                        abnormal_repo.append(repo_name)

            if index % 100 == 0:
                print(abnormal_repo)
                df = pd.DataFrame(abnormal_repo, columns=['异常仓库'])
                df.to_excel(os.path.join(basedir, 'log') + '\\' + f'{start_}-{end_}异常仓库{index}.xlsx', index=False)

if __name__ == "__main__":
    main()

本人读研期间发表6篇SCI数据挖掘相关论文,现在某研究院从事数据算法相关科研工作,对Python有一定认知和理解,会结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能基础知识与应用案例。

致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。

1、关注“数据杂坛”公众号,即可在后台联系我获取相关数据集和源码。

2、关注“数据杂坛”公众号,点击“领资料”即可免费领取资料书籍。

3、需要论文指导或商务合作,点击“联系我”添加作者微信直接交流。

原文链接:

【Python自动化系列】自动化批量提交文件到各个仓库并创建PR到指定分支

相关推荐

怎样打开cdr文件(.cdr用什么打开)

cdr是什么文件?cdr文件用什么打开?cdr文件是CorelDraw图像制作软件标准的输出格式,与photoshop(PS)图片设计软件类似都属于图片设计软件,需要打开cdr文件我们就需要先了解C...

微软拼音输入法好用吗(微软拼音输入法好用吗知乎)

  CTRL(Control)组合键;Ctrl+Alt+A(截屏);Ctrl+A(All)全选;Ctrl+C(Copy)复制;Ctrl+V粘贴Ctrl+S保存,窗口...

怎么设置屏保密码(怎么设置屏保密码和锁定时间)

屏保密码设置的方法步骤1、鼠标左键单击桌面下的【开始】菜单键;点击【控制面板】;2、点击【外观和个性化】;然后点击【个性化】选项卡中的【更改屏幕保护程序】;3、选择一个自己喜欢的程序,勾选,然后再点击...

无法下载ie浏览器怎么办(ie浏览器显示无法下载)

如果您在使用IE浏览器时遇到无法下载的问题,以下是一些常见的解决办法:1.清除浏览器缓存:打开IE浏览器,依次点击工具(齿轮图标)->Internet选项->常规选项->...

笔记本w7可以升级w10吗(笔记本w7可以升级w10吗)

要将wln7升级到win10,需要先确保计算机配置符合win10的最低要求,包括处理器、内存、硬盘空间等。然后,可以下载win10的升级助手或镜像文件,在升级前备份重要数据,选择需要保留的文件和设置,...

如何卸载电脑浏览器软件(怎样卸载电脑浏览器)
如何卸载电脑浏览器软件(怎样卸载电脑浏览器)

如果我们发现我们从浏览器里面下载的东西删不了,这个时候,我们就可能是由于下载到了了一些病毒软件或者是病毒程序而导致的,如果说想要解决这个问题,方法的话也很简单,我们可以通过杀毒软件对其进行杀毒,然后再进行卸载,基本上就可以删除了。app卸载...

2025-11-18 09:51 off999

联想怎么看电脑配置和型号(联想怎么看电脑配置和型号笔记本)

笔记本看型号有推荐三种方法:第一种,点击你笔记本上的(开始),然后找到(运行)打开,在里面的输入框里输入(dxdiag)点击确定,你就可以看见笔记本型号,系统型号等笔记本信息。第二种,就是在你的电脑上...

怎么ghost电脑系统(怎样ghost)

使用GHOST软件备份系统即可。1、网上下载一键GOST安装好,重启电脑运行一键gost-选择手动进入GOST。2、进入GHOST的操作界面,点OK。3、选择菜单到Local(本机)--Partiti...

u盘读取软件下载(u盘读取器下载)

手机播放U盘里的视频不用刻意的去安装什么播放器,一般手机里自带的播放器就能够直接播放U盘里的一般常见的视频。只要你要播放的视频,都是平时在电脑上或者电视上能够正常播放的视频,一般在手机里面它的系统自带...

office2020安装包百度云下载

Office2020和Office2019是微软的办公套件产品,两个版本之间有以下区别:1.发布时间:Office2020于2021年10月发布,而Office2019于2018年9月发布。...

硬盘恢复分区(硬盘恢复分区怎么删除)

1、在电脑上下载DiskGenius软件。2、双击运行该软件,软件会自动识别硬盘。当软件自动识别硬盘之后,右键单击硬盘的盘符,出现下拉菜单栏,选择搜索已丢失分区(重建分区表)选项。3、右键单击硬盘盘符...

edge 浏览器(edge浏览器官网下载)
edge 浏览器(edge浏览器官网下载)

目前没有,如果是平板安装了WIN10是会内置MicrosoftEdge浏览器的。edge是由微软开发的基于Chromium开源项目及其他开源软件的网页浏览器。Edge浏览器主要特点是能够支持目前主流的Web技术,作为Windows10自带...

2025-11-18 06:51 off999

网易163邮箱免费注册(163网易免费邮件注册)
网易163邮箱免费注册(163网易免费邮件注册)

163邮箱登录入口页面官方地址:https://mail.163.com/163邮箱登录注册方法1、进入邮箱登入首页,我们点击右下角“去注册”按钮,进入注册界面;2、这里直接填写账号和密码内容,点一下同意那里呈蓝色圆点;再点下一步。3、再填...

2025-11-18 06:03 off999

苹果商城app下载安装(苹果商店app免费下载)

一、苹果手机下载软件显示APP内购买的意思是APP可以免费下载使用,但是该APP内有付费内容,也就是通常所说的收费道具。二、不是所有应用都会提供App内购买项目。如果某个应用提供App内购买...

惠普电脑中国官网(惠普手提电脑官网)

https://support.hp.com/cn是惠普笔记本售后服务官网。惠普维修服务中心通过整合线上线下相关资源,向国内用户提供方便快捷、安全可靠的优质电子产品维修服务。目前拥有北京6家、全国30...

取消回复欢迎 发表评论: