如何解决克隆git仓库和拉空仓库之间有什么区别?关于从远程复制的文件?
我知道其他人也问过类似的问题;但我在这里寻找具体细节。我对git非常熟悉,所以我没有在寻找为什么要克隆vs pull的原因,或者如何使用不同的git工作流程或其他方法。我对底层管道更感兴趣。
场景
我继承了一个巨大的仓库(400MB)。并被要求清理它。
我已经使用git filter-branch
和git gc --aggressive
删除了对不需要在存储库中的任何大文件的所有引用。这些命令畅通无阻。但是,我想了解一些有趣的行为。
问题
- 本地回购文件的大小没有太大变化。通常只会丢失大约50MB(即使删除了300MB的安装程序)。因此,也许git在某个地方保留着一些历史?经过一些调查,我发现我的本地设备确实有一些剩余的东西。没关系,我将新的小型存储库推到远程,然后克隆一组较小的更改。
-
git push --all --force <remote>
之后;我吹走了所有内容,然后重新做了git clone <remote>
;希望只有经过筛选的更新会被删除。不幸的是,该大小仍然约为300MB。列出git ls-tree
仍然显示我删除的大文件的斑点。 - 我最后的尝试是再次炸毁我的本地人。然后创建一个空的本地(
git init
);然后是git remote add <url>
,然后是git pull <remote>
。注意:这是与上述相同的遥控器。带有分支过滤器的遥控器向上推。这一次,拉动仅拉低了少量更改。整个存储库要小得多。约37MB!那就是我想要的!
如您所见; git clone
所做的工作不仅仅限于撤消master上的代码更改和设置远程跟踪分支。它还在做什么?为什么这样做呢?以及如何彻底清理遥控器,使克隆文件的大小减小?
解决方法
您已经在正确的轨道上。
区别在于在这两个操作中传输的数据类型。 Git pull仅提取存储在中央存储库中的数据(文件,文档等)。因此,Pull需要在远程存储库和本地存储库之间建立一个已经存在且可以正常使用的连接。 但是,Git克隆会复制整个存储库。不仅是数据,还包括元数据,历史记录(分支,提交,作者等)以及一堆配置文件,这些文件包含文件结构,权限,层次结构,设置,数据管理信息等。因此,此命令基本上建立了一个全新的存储库。另外,git clone创建一个名为“ origin”的远程连接,该远程连接使用git refs引用原始存储库。
如果您想从头开始,建议您保存文件/代码,然后删除远程存储库。然后,创建一个新文件,创建必要的分支,上载所有文件并克隆存储库。 否则,如果您希望保留存储库,请确保删除不必要的分支,并在可能的情况下执行一些合并,并删除隐藏的备份和历史记录文件。以下链接显示了有效减少存储库大小的不同方法。
https://docs.gitlab.com/ee/user/project/repository/reducing_the_repo_size_using_git.html
我希望能有所帮助。 斯文
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。