百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

如何清理误提交到git的历史大文件?

off999 2025-08-05 20:27 20 浏览 0 评论

前言

哈喽!好久不见~

最近在思考转型的事情,好久没有更新文章了

不过看到我之前开发的视频剪辑工具 Clipify[1] 收获了不少 star ,让我想起之前画的饼似乎才实现了一点点,所以利用了周末的空闲时间给 Clipify 项目重构了一下界面以及开发一些新功能。

预告一下,这是重构之后的新界面,后面我会写一篇文章介绍一下。

中途意识到现在使用的 WinForms + Blazor 技术栈,就像马拉火车,有种蒸汽朋克的复古感,虽然使用前端技术开发的界面很好看,但 WinForms 不能跨平台终究不是长久之计。

于是我便着手尝试迁移到 MAUI,虽然还不能支持 Linux,至少 Mac 还是可以的,也算是跨平台了吧…

然而我还没把项目跑起来呢,一不小心把一堆静态资源给提交进去了

就是下面这些文件

Clipify.Maui/wwwroot/lib/
Clipify.Maui/wwwroot/css/*.min.css
Clipify.Maui/wwwroot/temp/

这下 git push 超级慢,而且会占用大量空间

还好最终在大模型爷爷的帮助下解决了这个问题

不过我想总不能老是去打扰大模型爷爷啊,问题解决了还是得记录一下,以后遇到类似的情况也好处理。

使用git原生命令

这个问题其实老生常谈了

网上能查到的很多文章都会告诉你可以用以下命令解决

git rm -r --cached Clipify.Maui/wwwroot/lib
git rm --cached Clipify.Maui/wwwroot/css/*.min.css
git rm -r --cached Clipify.Maui/wwwroot/temp

这些命令会移除已提交的文件,但不会删除本地文件

但我这样做了之后还是不行,git push 的时候还是很慢

分析原因

那么问题来了,为什么 git rm --cached 没用呢?

原因是 git rm --cached 只会从当前 commit(工作区)中移除指定文件的 Git 跟踪,它不会修改过去的提交记录

它解决的是「现在开始不要再跟踪」的问题, 但历史上它已经跟踪过的文件,Git 还会一直保留在对象数据库(.git/objects)里

我在前面几个 commit 已经把 Clipify.Maui/wwwroot/lib 这类文件夹提交进去了

所以这个命令对于这个场景来说是没用的

简单来说,Git 是个版本管理工具,它不会忘记你历史上做过的提交,哪怕现在 git rm --cached 移除了 lib/ 文件夹

Git 仍然记得之前在第 N 次 commit 时曾经加入过它,所以 .git 目录依然保存了那些 大 blob 文件push 时照样要传。

解决方法

那么如何解决呢?

以前看到的方法是编写脚本,循环从每个 commit 里删除已提交的文件

现在不用这么麻烦了,有了 git-filter-repo 工具,这是一个 python 写的可以用来重写 git 历史记录的工具

https://github.com/newren/git-filter-repo

感谢 scoop ,让我在 Windows 上也能获得类似 Linux/MacOS 类似的软件安装体验

# 安装 Git Filter Repo
brew install git-filter-repo # macOS
scoop install git-filter-repo # Windows
# 或者用 Python 安装
pip install git-filter-repo

使用方法

git filter-repo --path Clipify.Maui/wwwroot/lib/ --invert-paths --force

这个命令会彻底删除历史中所有与该路径相关的文件和提交记录

重写整个 Git 提交历史之后,仓库大小会明显减小git push 更快,历史提交中指定文件将完全移除。可能需要使用 --force 强制推送代码。

经过这一通操作之后,我再使用 git push 提交明显快了很多。

拓展:如何分析git提交历史里的大文件

用 [git rev-list + git verify-pack] 可以找出 Git 提交历史中的大对象(大文件)

不过 git 原生的命令比较复杂

我还是选择借助工具的力量,这次是 git-sizer 工具

git-sizer[2]是 GitHub 官方出的工具,用于分析 Git 仓库大小、提交体积等问题。

brew install git-sizer
# or
scoop install git-sizer
# or
cargo install git-sizer

PS:再次感谢 scoop !

直接在项目根目录下执行 git-sizer 即可

这个工具会输出以下信息:

  • 最大的提交
  • 最大的 blob(文件内容)
  • 最大的目录
  • 含大文件的分支
  • 是否存在历史中隐藏的肥胖对象(hidden bloats)

我使用这个工具生成的结果是这样

Processing blobs: 2448 
Processing trees: 218
Processing commits: 42
Matching commits to trees: 42
Processing annotated tags: 0
Processing references: 3
| Name | Value | Level of concern |
| ---------------------------- | --------- | ------------------------------ |
| Biggest objects | | |
| * Trees | | |
| * Maximum entries [1] | 1.40 k | * |

[1] 77b7ff2aa0456193bee83eebe9dfb76ebd4f35ac (2d9cc135f1aff0863ce2ef8ceff3cbf6984ee499:Clipify.Maui/wwwroot/lib/font-awesome/svgs/solid)

这样就能很方便定位到最大的文件,给 git 仓库瘦身~

参考资料
[1]

Clipify: https://blog.deali.cn/Blog/Post/6a903b1c6fb2487f

[2]

git-sizer: https://github.com/github/git-sizer


解锁AI驱动的生产力跃迁

程序设计实验室 专注前沿技术落地,每周解析代码级解决方案。

关注获取:

《DeepSeek极速上手手册》24页干货:零基础3天玩转智能编码

清华独家课程三部曲:

  • 《DeepSeek从入门到精通》104页精讲(附30+代码实例)
  • 《职场效能革命指南》35页实战:7大行业应用场景深度拆解
  • 《AI红利捕获手册》65页秘籍:普通人快速构建竞争壁垒的5种路径

与万千技术人共建智能开发新范式。


相关推荐

联想win7怎么进入bios设置(联想win7进入bios设置win10)
联想win7怎么进入bios设置(联想win7进入bios设置win10)

联想电脑win7进入bios设置的具体步骤如下: 1、首先我们打开电脑的同时,按下键盘上的“F2”。2、然后我们在弹出来的窗口中就可以进入到BIOS界面中。3、然后我们按下键盘上的“F10”,之后回车确定即可退出。联想电脑win7...

2025-11-09 14:03 off999

优盘里面的文件被误删了能否找回

如果您的文件在很久以前被误删并且没有进行任何操作,那么有可能通过一些专业的数据恢复工具来恢复被删除的文件。以下是一些可能的操作步骤:1.停止使用U盘:为了最大限度地提高恢复成功的几率,请停止使用U盘...

电脑系统程序下载(电脑应用程序下载)

1、首先下载并安装DriverDroid,运行后根据设置向导进行设置。2、然后注意安卓手机已获取ROOT,设置时需要连接电脑。3、将手机自动下载的bios文件移动到镜像根目录下(手机内存/Downlo...

万能网卡驱动离线安装包下载

电脑没网是吧,那你可以先用手机下载。之后放电脑上安装的万能网卡驱动下载地址http://drivers.160.com/universal/camera.html该驱动能够使大部分的网卡能够被系统...

正版office和盗版区别(office正版和盗版可以共存吗)

区别主要有三方面:1.office正版是付费的,而且价格相对而言较高,盗版呢价格相对低或者干脆免费。2.office正版因为是官方发行,文件肯定完整,功能齐全,稳定。盗版呢一般都是破译的或者是拷贝的,...

ヽ这个符号怎么打出来(这个符号怎么打出来是在中间的)

下载酷狗拼音,软键盘就有了。ˋ☆╲ヽ

120g固态硬盘够用吗(10几年的老电脑换个固态硬盘)

一般办公家用还是够用了,分两个区,系统盘分50G,剩余的分一个区做资料盘。特殊要求,资料文件比较多的话,128g是不够用,只能分一个区。这个主要取决于您电脑主要的用途,如果您的电脑只是用来日常办公和娱...

谷歌浏览器google(谷歌浏览器googleplay)

GoogleChrome,又称Google浏览器,是一个美国Google(谷歌)公司开发的网页浏览器。该浏览器是基于其他开源软件所撰写,包括WebKit,目标是提升稳定性、速度和安全性,并创造出简单且...

android13正式版下载(安卓版本13)

出现该问题的原因是,用户在设置里开启了新下载的APP,仅添加到APP资源库选项。大家只要进入“设置-主屏幕”,把新下载的APP,改为“添加到主屏幕”即可解决问题。修改完成后,你再进入AppStore下...

firefox浏览器安卓版(firefox浏览器安卓版 打开本地网页)

要进入火狐浏览器手机版的主页,你可以通过以下几种方式进行:首先,打开火狐浏览器App,然后点击右上角的三条横线菜单按钮,接着选择“主页”选项。另外,你也可以直接在浏览器地址栏中输入“about:hom...

电脑cpu性能排行榜天梯图(“电脑cpu性能天梯图”)

一、英特尔酷睿i7670。这款英特尔CPU采用的是超频新芯,最大程度的提升处理器的超频能力。二、英特尔酷睿i74790kCPU:这款CPU采用22纳米制程工艺的框架,它的默认频率是4.0到4.4Ghz...

硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
  • 硬盘怎么分区合理(硬盘怎么分区合理一点)
路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
  • 路由器怎么设置密码不被别人蹭网
电脑自由截屏的快捷键是什么

快捷键是ctrl+alt+a,我们可将聊天窗口缩小,放在旁边。然后找到想要截屏的位置,这时我们在截屏旁边,就更加的方便了。在键盘中按下PrintScreenSysRq(简写为PrtSc)键,此快捷...

windows10精简版官网下载(win10官方精简版下载)

精简版的意思的它比原版的功能和软件少了,其实精简版的更适合大众,没有多余的其他必要功能,更快Win10版本主要为四个分别是专业版、家庭版、企业版、教育版,其实除了这四个之外,还有工作站版、LTSB/L...

取消回复欢迎 发表评论: