7.8 Git 工具 - 高级合并

高级合并

在 Git 中合并是相当容易的。因为 Git 使多次合并另一个分支变得很容易,这意味着你可以有一个始终保持最新的长期分支,经常解决小的冲突,比在一系列提交后解决一个巨大的冲突要好。

然而,有时也会有棘手的冲突。不像其他的版本控制系统,Git 并不会尝试过于聪明的合并冲突解决方案。Git 的哲学是聪明地决定无歧义的合并方案,但是如果有冲突,它不会尝试智能地自动解决它。因此,如果很久之后才合并两个分叉的分支,你可能会撞上一些问题。

在本节中,我们将会仔细查看那些问题是什么以及 Git 给了我们什么工具来帮助我们处理这些更难办的情形。我们也会了解你可以做的不同的、非标准类型的合并,也会看到如何后退到合并之前。

合并冲突

我们在 遇到冲突时的分支合并 介绍了解决合并冲突的一些基础知识,对于更复杂的冲突,Git 提供了几个工具来帮助你指出将会发生什么以及如何更好地处理冲突。

首先,在做一次可能有冲突的合并前尽可能保证工作目录是干净的。如果你有正在做的工作,要么提交到一个临时分支要么储藏它。这使你可以撤消在这里尝试做的任何事情。如果在你尝试一次合并时工作目录中有未保存的改动,下面的这些技巧可能会使你丢失那些工作。

让我们通过一个非常简单的例子来了解一下。我们有一个超级简单的打印 hello world 的 Ruby 文件。

  1. #! /usr/bin/env ruby
  2. def hello
  3. puts 'hello world'
  4. end
  5. hello()

在我们的仓库中,创建一个名为 whitespace 的新分支并将所有 Unix 换行符修改为 DOS 换行符,实质上虽然改变了文件的每一行,但改变的都只是空白字符。然后我们修改行 “hello world” 为 “hello mundo”。

  1. $ git checkout -b whitespace
  2. Switched to a new branch 'whitespace'
  3. $ unix2dos hello.rb
  4. unix2dos: converting file hello.rb to DOS format ...
  5. $ git commit -am 'converted hello.rb to DOS'
  6. [whitespace 3270f76] converted hello.rb to DOS
  7. 1 file changed, 7 insertions(+), 7 deletions(-)
  8. $ vim hello.rb
  9. $ git diff -b
  10. diff --git a/hello.rb b/hello.rb
  11. index ac51efd..e85207e 100755
  12. --- a/hello.rb
  13. +++ b/hello.rb
  14. @@ -1,7 +1,7 @@
  15. #! /usr/bin/env ruby
  16. def hello
  17. - puts 'hello world'
  18. + puts 'hello mundo'^M
  19. end
  20. hello()
  21. $ git commit -am 'hello mundo change'
  22. [whitespace 6d338d2] hello mundo change
  23. 1 file changed, 1 insertion(+), 1 deletion(-)

现在我们切换回我们的 master 分支并为函数增加一些注释。

  1. $ git checkout master
  2. Switched to branch 'master'
  3. $ vim hello.rb
  4. $ git diff
  5. diff --git a/hello.rb b/hello.rb
  6. index ac51efd..36c06c8 100755
  7. --- a/hello.rb
  8. +++ b/hello.rb
  9. @@ -1,5 +1,6 @@
  10. #! /usr/bin/env ruby
  11. +# prints out a greeting
  12. def hello
  13. puts 'hello world'
  14. end
  15. $ git commit -am 'document the function'
  16. [master bec6336] document the function
  17. 1 file changed, 1 insertion(+)

现在我们尝试合并入我们的 whitespace 分支,因为修改了空白字符,所以合并会出现冲突。

  1. $ git merge whitespace
  2. Auto-merging hello.rb
  3. CONFLICT (content): Merge conflict in hello.rb
  4. Automatic merge failed; fix conflicts and then commit the result.

中断一次合并

我们现在有几个选项。首先,让我们介绍如何摆脱这个情况。你可能不想处理冲突这种情况,完全可以通过 git merge —abort 来简单地退出合并。

  1. $ git status -sb
  2. ## master
  3. UU hello.rb
  4. $ git merge --abort
  5. $ git status -sb
  6. ## master

git merge —abort 选项会尝试恢复到你运行合并前的状态。但当运行命令前,在工作目录中有未储藏、未提交的修改时它不能完美处理,除此之外它都工作地很好。

如果因为某些原因你发现自己处在一个混乱的状态中然后只是想要重来一次,也可以运行 git reset —hard HEAD 回到之前的状态或其他你想要恢复的状态。请牢记这会将清除工作目录中的所有内容,所以确保你不需要保存这里的任意改动。

忽略空白

在这个特定的例子中,冲突与空白有关。我们知道这点是因为这个例子很简单,但是在实际的例子中发现这样的冲突也很容易,因为每一行都被移除而在另一边每一行又被加回来了。默认情况下,Git 认为所有这些行都改动了,所以它不会合并文件。

默认合并策略可以带有参数,其中的几个正好是关于忽略空白改动的。如果你看到在一次合并中有大量的空白问题,你可以简单地中止它并重做一次,这次使用 -Xignore-all-space-Xignore-space-change 选项。第一个选项忽略任意 数量 的已有空白的修改,第二个选项忽略所有空白修改。

  1. $ git merge -Xignore-space-change whitespace
  2. Auto-merging hello.rb
  3. Merge made by the 'recursive' strategy.
  4. hello.rb | 2 +-
  5. 1 file changed, 1 insertion(+), 1 deletion(-)

因为在本例中,实际上文件修改并没有冲突,一旦我们忽略空白修改,每一行都能被很好地合并。

如果你的团队中的某个人可能不小心重新格式化空格为制表符或者相反的操作,这会是一个救命稻草。

手动文件再合并

虽然 Git 对空白的预处理做得很好,还有很多其他类型的修改,Git 也许无法自动处理,但是脚本可以处理它们。例如,假设 Git 无法处理空白修改因此我们需要手动处理。

我们真正想要做的是对将要合并入的文件在真正合并前运行 dos2unix 程序。所以如果那样的话,我们该如何做?

首先,我们进入到了合并冲突状态。然后我们想要我的版本的文件,他们的版本的文件(从我们将要合并入的分支)和共同的版本的文件(从分支叉开时的位置)的拷贝。然后我们想要修复任何一边的文件,并且为这个单独的文件重试一次合并。

获得这三个文件版本实际上相当容易。Git 在索引中存储了所有这些版本,在 “stages” 下每一个都有一个数字与它们关联。Stage 1 是它们共同的祖先版本,stage 2 是你的版本,stage 3 来自于 MERGE_HEAD,即你将要合并入的版本(“theirs”)。

通过 git show 命令与一个特别的语法,你可以将冲突文件的这些版本释放出一份拷贝。

  1. $ git show :1:hello.rb > hello.common.rb
  2. $ git show :2:hello.rb > hello.ours.rb
  3. $ git show :3:hello.rb > hello.theirs.rb

如果你想要更专业一点,也可以使用 ls-files -u 底层命令来得到这些文件的 Git blob 对象的实际 SHA-1 值。

  1. $ git ls-files -u
  2. 100755 ac51efdc3df4f4fd328d1a02ad05331d8e2c9111 1 hello.rb
  3. 100755 36c06c8752c78d2aff89571132f3bf7841a7b5c3 2 hello.rb
  4. 100755 e85207e04dfdd5eb0a1e9febbc67fd837c44a1cd 3 hello.rb

:1:hello.rb 只是查找那个 blob 对象 SHA-1 值的简写。

既然在我们的工作目录中已经有这所有三个阶段的内容,我们可以手工修复它们来修复空白问题,然后使用鲜为人知的 git merge-file 命令来重新合并那个文件。

  1. $ dos2unix hello.theirs.rb
  2. dos2unix: converting file hello.theirs.rb to Unix format ...
  3. $ git merge-file -p \
  4. hello.ours.rb hello.common.rb hello.theirs.rb > hello.rb
  5. $ git diff -b
  6. diff --cc hello.rb
  7. index 36c06c8,e85207e..0000000
  8. --- a/hello.rb
  9. +++ b/hello.rb
  10. @@@ -1,8 -1,7 +1,8 @@@
  11. #! /usr/bin/env ruby
  12. +# prints out a greeting
  13. def hello
  14. - puts 'hello world'
  15. + puts 'hello mundo'
  16. end
  17. hello()

在这时我们已经漂亮地合并了那个文件。实际上,这比使用 ignore-space-change 选项要更好,因为在合并前真正地修复了空白修改而不是简单地忽略它们。在使用 ignore-space-change 进行合并操作后,我们最终得到了有几行是 DOS 行尾的文件,从而使提交内容混乱了。

如果你想要在最终提交前看一下我们这边与另一边之间实际的修改,你可以使用 git diff 来比较将要提交作为合并结果的工作目录与其中任意一个阶段的文件差异。让我们看看它们。

要在合并前比较结果与在你的分支上的内容,换一句话说,看看合并引入了什么,可以运行 git diff —ours

  1. $ git diff --ours
  2. * Unmerged path hello.rb
  3. diff --git a/hello.rb b/hello.rb
  4. index 36c06c8..44d0a25 100755
  5. --- a/hello.rb
  6. +++ b/hello.rb
  7. @@ -2,7 +2,7 @@
  8. # prints out a greeting
  9. def hello
  10. - puts 'hello world'
  11. + puts 'hello mundo'
  12. end
  13. hello()

这里我们可以很容易地看到在我们的分支上发生了什么,在这次合并中我们实际引入到这个文件的改动,是修改了其中一行。

如果我们想要查看合并的结果与他们那边有什么不同,可以运行 git diff —theirs。在本例及后续的例子中,我们会使用 -b 来去除空白,因为我们将它与 Git 中的,而不是我们清理过的 hello.theirs.rb 文件比较。

  1. $ git diff --theirs -b
  2. * Unmerged path hello.rb
  3. diff --git a/hello.rb b/hello.rb
  4. index e85207e..44d0a25 100755
  5. --- a/hello.rb
  6. +++ b/hello.rb
  7. @@ -1,5 +1,6 @@
  8. #! /usr/bin/env ruby
  9. +# prints out a greeting
  10. def hello
  11. puts 'hello mundo'
  12. end

最终,你可以通过 git diff —base 来查看文件在两边是如何改动的。

  1. $ git diff --base -b
  2. * Unmerged path hello.rb
  3. diff --git a/hello.rb b/hello.rb
  4. index ac51efd..44d0a25 100755
  5. --- a/hello.rb
  6. +++ b/hello.rb
  7. @@ -1,7 +1,8 @@
  8. #! /usr/bin/env ruby
  9. +# prints out a greeting
  10. def hello
  11. - puts 'hello world'
  12. + puts 'hello mundo'
  13. end
  14. hello()

在这时我们可以使用 git clean 命令来清理我们为手动合并而创建但不再有用的额外文件。

  1. $ git clean -f
  2. Removing hello.common.rb
  3. Removing hello.ours.rb
  4. Removing hello.theirs.rb

检出冲突

也许有时我们并不满意这样的解决方案,或许有时还要手动编辑一边或者两边的冲突,但还是依旧无法正常工作,这时我们需要更多的上下文关联来解决这些冲突。

让我们来稍微改动下例子。对于本例,我们有两个长期分支,每一个分支都有几个提交,但是在合并时却创建了一个合理的冲突。

  1. $ git log --graph --oneline --decorate --all
  2. * f1270f7 (HEAD, master) update README
  3. * 9af9d3b add a README
  4. * 694971d update phrase to hola world
  5. | * e3eb223 (mundo) add more tests
  6. | * 7cff591 add testing script
  7. | * c3ffff1 changed text to hello mundo
  8. |/
  9. * b7dcc89 initial hello world code

现在有只在 master 分支上的三次单独提交,还有其他三次提交在 mundo 分支上。如果我们尝试将 mundo 分支合并入 master 分支,我们得到一个冲突。

  1. $ git merge mundo
  2. Auto-merging hello.rb
  3. CONFLICT (content): Merge conflict in hello.rb
  4. Automatic merge failed; fix conflicts and then commit the result.

我们想要看一下合并冲突是什么。如果我们打开这个文件,我们将会看到类似下面的内容:

  1. #! /usr/bin/env ruby
  2. def hello
  3. <<<<<<< HEAD
  4. puts 'hola world'
  5. =======
  6. puts 'hello mundo'
  7. >>>>>>> mundo
  8. end
  9. hello()

合并的两边都向这个文件增加了内容,但是导致冲突的原因是其中一些提交修改了文件的同一个地方。

让我们探索一下现在你手边可用来查明这个冲突是如何产生的工具。应该如何修复这个冲突看起来或许并不明显。这时你需要更多上下文。

一个很有用的工具是带 —conflict 选项的 git checkout。这会重新检出文件并替换合并冲突标记。如果想要重置标记并尝试再次解决它们的话这会很有用。

可以传递给 —conflict 参数 diff3merge(默认选项)。如果传给它 diff3,Git 会使用一个略微不同版本的冲突标记:不仅仅只给你 “ours” 和 “theirs” 版本,同时也会有 “base” 版本在中间来给你更多的上下文。

  1. $ git checkout --conflict=diff3 hello.rb

一旦我们运行它,文件看起来会像下面这样:

  1. #! /usr/bin/env ruby
  2. def hello
  3. <<<<<<< ours
  4. puts 'hola world'
  5. ||||||| base
  6. puts 'hello world'
  7. =======
  8. puts 'hello mundo'
  9. >>>>>>> theirs
  10. end
  11. hello()

如果你喜欢这种格式,可以通过设置 merge.conflictstyle 选项为 diff3 来做为以后合并冲突的默认选项。

  1. $ git config --global merge.conflictstyle diff3

git checkout 命令也可以使用 —ours—theirs 选项,这是一种无需合并的快速方式,你可以选择留下一边的修改而丢弃掉另一边修改。

当有二进制文件冲突时这可能会特别有用,因为可以简单地选择一边,或者可以只合并另一个分支的特定文件 - 可以做一次合并然后在提交前检出一边或另一边的特定文件。

合并日志

另一个解决合并冲突有用的工具是 git log。这可以帮助你得到那些对冲突有影响的上下文。回顾一点历史来记起为什么两条线上的开发会触碰同一片代码有时会很有用。

为了得到此次合并中包含的每一个分支的所有独立提交的列表,我们可以使用之前在 三点 学习的 “三点” 语法。

  1. $ git log --oneline --left-right HEAD...MERGE_HEAD
  2. < f1270f7 update README
  3. < 9af9d3b add a README
  4. < 694971d update phrase to hola world
  5. > e3eb223 add more tests
  6. > 7cff591 add testing script
  7. > c3ffff1 changed text to hello mundo

这个漂亮的列表包含 6 个提交和每一个提交所在的不同开发路径。

我们可以通过更加特定的上下文来进一步简化这个列表。如果我们添加 —merge 选项到 git log 中,它会只显示任何一边接触了合并冲突文件的提交。

  1. $ git log --oneline --left-right --merge
  2. < 694971d update phrase to hola world
  3. > c3ffff1 changed text to hello mundo

如果你运行命令时用 -p 选项代替,你会得到所有冲突文件的区别。快速获得你需要帮助理解为什么发生冲突的上下文,以及如何聪明地解决它,这会 非常 有用。

组合式差异格式

因为 Git 暂存合并成功的结果,当你在合并冲突状态下运行 git diff 时,只会得到现在还在冲突状态的区别。当需要查看你还需要解决哪些冲突时这很有用。

在合并冲突后直接运行的 git diff 会给你一个相当独特的输出格式。

  1. $ git diff
  2. diff --cc hello.rb
  3. index 0399cd5,59727f0..0000000
  4. --- a/hello.rb
  5. +++ b/hello.rb
  6. @@@ -1,7 -1,7 +1,11 @@@
  7. #! /usr/bin/env ruby
  8. def hello
  9. ++<<<<<<< HEAD
  10. + puts 'hola world'
  11. ++=======
  12. + puts 'hello mundo'
  13. ++>>>>>>> mundo
  14. end
  15. hello()

这种叫作 “组合式差异” 的格式会在每一行给你两列数据。第一列为你显示 “ours” 分支与工作目录的文件区别(添加或删除),第二列显示 “theirs” 分支与工作目录的拷贝区别。

所以在上面的例子中可以看到 <<<<<<<>>>>>>> 行在工作拷贝中但是并不在合并的任意一边中。这很有意义,合并工具因为我们的上下文被困住了,它期望我们去移除它们。

如果我们解决冲突再次运行 git diff,我们将会看到同样的事情,但是它有一点帮助。

  1. $ vim hello.rb
  2. $ git diff
  3. diff --cc hello.rb
  4. index 0399cd5,59727f0..0000000
  5. --- a/hello.rb
  6. +++ b/hello.rb
  7. @@@ -1,7 -1,7 +1,7 @@@
  8. #! /usr/bin/env ruby
  9. def hello
  10. - puts 'hola world'
  11. - puts 'hello mundo'
  12. ++ puts 'hola mundo'
  13. end
  14. hello()

这里显示出 “hola world” 在我们这边但不在工作拷贝中,那个 “hello mundo” 在他们那边但不在工作拷贝中,最终 “hola mundo” 不在任何一边但是现在在工作拷贝中。在提交解决方案前这对审核很有用。

也可以在合并后通过 git log 来获取相同信息,并查看冲突是如何解决的。如果你对一个合并提交运行 git show 命令 Git 将会输出这种格式,或者你也可以在 git log -p(默认情况下该命令只会展示还没有合并的补丁)命令之后加上 —cc 选项。

  1. $ git log --cc -p -1
  2. commit 14f41939956d80b9e17bb8721354c33f8d5b5a79
  3. Merge: f1270f7 e3eb223
  4. Author: Scott Chacon <schacon@gmail.com>
  5. Date: Fri Sep 19 18:14:49 2014 +0200
  6. Merge branch 'mundo'
  7. Conflicts:
  8. hello.rb
  9. diff --cc hello.rb
  10. index 0399cd5,59727f0..e1d0799
  11. --- a/hello.rb
  12. +++ b/hello.rb
  13. @@@ -1,7 -1,7 +1,7 @@@
  14. #! /usr/bin/env ruby
  15. def hello
  16. - puts 'hola world'
  17. - puts 'hello mundo'
  18. ++ puts 'hola mundo'
  19. end
  20. hello()

撤消合并

虽然你已经知道如何创建一个合并提交,但有时出错是在所难免的。使用 Git 最棒的一件事情是犯错是可以的,因为有可能(大多数情况下都很容易)修复它们。

合并提交并无不同。假设现在在一个特性分支上工作,不小心将其合并到 master 中,现在提交历史看起来是这样:

意外的合并提交

Figure 138. 意外的合并提交

有两种方法来解决这个问题,这取决于你想要的结果是什么。

修复引用

如果这个不想要的合并提交只存在于你的本地仓库中,最简单且最好的解决方案是移动分支到你想要它指向的地方。大多数情况下,如果你在错误的 git merge 后运行 git reset —hard HEAD~,这会重置分支指向所以它们看起来像这样:

在 `git reset --hard HEAD~` 之后的历史

Figure 139. 在 git reset —hard HEAD~ 之后的历史

我们之前在 重置揭密 已经介绍了 reset,所以现在指出这里发生了什么并不是很困难。让我们快速复习下:reset —hard 通常会经历三步:

  • 移动 HEAD 指向的分支。在本例中,我们想要移动 master 到合并提交(C6)之前所在的位置。

  • 使索引看起来像 HEAD。

  • 使工作目录看起来像索引。

这个方法的缺点是它会重写历史,在一个共享的仓库中这会造成问题的。查阅 变基的风险 来了解更多可能发生的事情;用简单的话说就是如果其他人已经有你将要重写的提交,你应当避免使用 reset。如果有任何其他提交在合并之后创建了,那么这个方法也会无效;移动引用实际上会丢失那些改动。

还原提交

如果移动分支指针并不适合你,Git 给你一个生成一个新提交的选项,提交将会撤消一个已存在提交的所有修改。Git 称这个操作为 “还原”,在这个特定的场景下,你可以像这样调用它:

  1. $ git revert -m 1 HEAD
  2. [master b1d8379] Revert "Merge branch 'topic'"

-m 1 标记指出 “mainline” 需要被保留下来的父结点。当你引入一个合并到 HEADgit merge topic),新提交有两个父结点:第一个是 HEADC6),第二个是将要合并入分支的最新提交(C4)。在本例中,我们想要撤消所有由父结点 #2(C4)合并引入的修改,同时保留从父结点 #1(C4)开始的所有内容。

有还原提交的历史看起来像这样:

在 `git revert -m 1` 后的历史

Figure 140. 在 git revert -m 1 后的历史

新的提交 ^MC6 有完全一样的内容,所以从这儿开始就像合并从未发生过,除了“现在还没合并”的提交依然在 HEAD 的历史中。如果你尝试再次合并 topicmaster Git 会感到困惑:

  1. $ git merge topic
  2. Already up-to-date.

topic 中并没有东西不能从 master 中追踪到达。更糟的是,如果你在 topic 中增加工作然后再次合并,Git 只会引入被还原的合并 之后 的修改。

含有坏掉合并的历史

Figure 141. 含有坏掉合并的历史

解决这个最好的方式是撤消还原原始的合并,因为现在你想要引入被还原出去的修改,然后 创建一个新的合并提交:

  1. $ git revert ^M
  2. [master 09f0126] Revert "Revert "Merge branch 'topic'""
  3. $ git merge topic

在重新合并一个还原合并后的历史

Figure 142. 在重新合并一个还原合并后的历史

在本例中,M^M 抵消了。^^M 事实上合并入了 C3C4 的修改,C8 合并了 C7 的修改,所以现在 topic 已经完全被合并了。

其他类型的合并

到目前为止我们介绍的都是通过一个叫作 “recursive” 的合并策略来正常处理的两个分支的正常合并。然而还有其他方式来合并两个分支到一起。让我们来快速介绍其中的几个。

我们的或他们的偏好

首先,有另一种我们可以通过 “recursive” 合并模式做的有用工作。我们之前已经看到传递给 -Xignore-all-spaceignore-space-change 选项,但是我们也可以告诉 Git 当它看见一个冲突时直接选择一边。

默认情况下,当 Git 看到两个分支合并中的冲突时,它会将合并冲突标记添加到你的代码中并标记文件为冲突状态来让你解决。如果你希望 Git 简单地选择特定的一边并忽略另外一边而不是让你手动合并冲突,你可以传递给 merge 命令一个 -Xours-Xtheirs 参数。

如果 Git 看到这个,它并不会增加冲突标记。任何可以合并的区别,它会直接合并。任何有冲突的区别,它会简单地选择你全局指定的一边,包括二进制文件。

如果我们回到之前我们使用的 “hello world” 例子中,我们可以看到合并入我们的分支时引发了冲突。

  1. $ git merge mundo
  2. Auto-merging hello.rb
  3. CONFLICT (content): Merge conflict in hello.rb
  4. Resolved 'hello.rb' using previous resolution.
  5. Automatic merge failed; fix conflicts and then commit the result.

然而如果我们运行时增加 -Xours-Xtheirs 参数就不会有冲突。

  1. $ git merge -Xours mundo
  2. Auto-merging hello.rb
  3. Merge made by the 'recursive' strategy.
  4. hello.rb | 2 +-
  5. test.sh | 2 ++
  6. 2 files changed, 3 insertions(+), 1 deletion(-)
  7. create mode 100644 test.sh

在上例中,它并不会为 “hello mundo” 与 “hola world” 标记合并冲突,它只会简单地选取 “hola world”。然而,在那个分支上所有其他非冲突的改动都可以被成功地合并入。

这个选项也可以传递给我们之前看到的 git merge-file 命令,通过运行类似 git merge-file —ours 的命令来合并单个文件。

如果想要做类似的事情但是甚至并不想让 Git 尝试合并另外一边的修改,有一个更严格的选项,它是 “ours” 合并 策略。这与 “ours” recursive 合并 选项 不同。

这本质上会做一次假的合并。它会记录一个以两边分支作为父结点的新合并提交,但是它甚至根本不关注你正合并入的分支。它只会简单地把当前分支的代码当作合并结果记录下来。

  1. $ git merge -s ours mundo
  2. Merge made by the 'ours' strategy.
  3. $ git diff HEAD HEAD~
  4. $

你可以看到合并后与合并前我们的分支并没有任何区别。

当再次合并时从本质上欺骗 Git 认为那个分支已经合并过经常是很有用的。例如,假设你有一个分叉的 release 分支并且在上面做了一些你想要在未来某个时候合并回 master 的工作。与此同时 master 分支上的某些 bugfix 需要向后移植回 release 分支。你可以合并 bugfix 分支进入 release 分支同时也 merge -s ours 合并进入你的 master 分支(即使那个修复已经在那儿了)这样当你之后再次合并 release 分支时,就不会有来自 bugfix 的冲突。

子树合并

子树合并的思想是你有两个项目,并且其中一个映射到另一个项目的一个子目录,或者反过来也行。当你执行一个子树合并时,Git 通常可以自动计算出其中一个是另外一个的子树从而实现正确的合并。

我们来看一个例子如何将一个项目加入到一个已存在的项目中,然后将第二个项目的代码合并到第一个项目的子目录中。

首先,我们将 Rack 应用添加到你的项目里。我们把 Rack 项目作为一个远程的引用添加到我们的项目里,然后检出到它自己的分支。

  1. $ git remote add rack_remote https://github.com/rack/rack
  2. $ git fetch rack_remote
  3. warning: no common commits
  4. remote: Counting objects: 3184, done.
  5. remote: Compressing objects: 100% (1465/1465), done.
  6. remote: Total 3184 (delta 1952), reused 2770 (delta 1675)
  7. Receiving objects: 100% (3184/3184), 677.42 KiB | 4 KiB/s, done.
  8. Resolving deltas: 100% (1952/1952), done.
  9. From https://github.com/rack/rack
  10. * [new branch] build -> rack_remote/build
  11. * [new branch] master -> rack_remote/master
  12. * [new branch] rack-0.4 -> rack_remote/rack-0.4
  13. * [new branch] rack-0.9 -> rack_remote/rack-0.9
  14. $ git checkout -b rack_branch rack_remote/master
  15. Branch rack_branch set up to track remote branch refs/remotes/rack_remote/master.
  16. Switched to a new branch "rack_branch"

现在在我们的 rack_branch 分支里就有 Rack 项目的根目录,而我们的项目则在 master 分支里。如果你从一个分支切换到另一个分支,你可以看到它们的项目根目录是不同的:

  1. $ ls
  2. AUTHORS KNOWN-ISSUES Rakefile contrib lib
  3. COPYING README bin example test
  4. $ git checkout master
  5. Switched to branch "master"
  6. $ ls
  7. README

这个是一个比较奇怪的概念。并不是仓库中的所有分支都是必须属于同一个项目的分支.这并不常见,因为没啥用,但是却是在不同分支里包含两条完全不同提交历史的最简单的方法。

在这个例子中,我们希望将 Rack 项目拉到 master 项目中作为一个子目录。我们可以在 Git 中执行 git read-tree 来实现。你可以在 Git 内部原理 中查看更多 read-tree 的相关信息,现在你只需要知道它会读取一个分支的根目录树到当前的暂存区和工作目录里。先切回你的 master 分支,将 rack_back 分支拉取到我们项目的 master 分支中的 rack 子目录。

  1. $ git read-tree --prefix=rack/ -u rack_branch

当我们提交时,那个子目录中拥有所有 Rack 项目的文件 —— 就像我们直接从压缩包里复制出来的一样。有趣的是你可以很容易地将一个分支的变更合并到另一个分支里。所以,当 Rack 项目有更新时,我们可以切换到那个分支来拉取上游的变更。

  1. $ git checkout rack_branch
  2. $ git pull

接着,我们可以将这些变更合并回我们的 master 分支。使用 —squash 选项和使用 -Xsubtree 选项(它采用递归合并策略),都可以用来可以拉取变更并且预填充提交信息。(递归策略在这里是默认的,提到它是为了让读者有个清晰的概念。)

  1. $ git checkout master
  2. $ git merge --squash -s recursive -Xsubtree=rack rack_branch
  3. Squash commit -- not updating HEAD
  4. Automatic merge went well; stopped before committing as requested

Rack 项目中所有的改动都被合并了,等待被提交到本地。你也可以用相反的方法——在 master 分支上的 rack 子目录中做改动然后将它们合并入你的 rack_branch 分支中,之后你可能将其提交给项目维护着或者将它们推送到上游。

这给我们提供了一种类似子模块工作流的工作方式,但是它并不需要用到子模块(有关子模块的内容我们会在 子模块 中介绍)。我们可以在自己的仓库中保持一些和其他项目相关的分支,偶尔使用子树合并将它们合并到我们的项目中。某些时候这种方式很有用,例如当所有的代码都提交到一个地方的时候。然而,它同时也有缺点,它更加复杂且更容易让人犯错,例如重复合并改动或者不小心将分支提交到一个无关的仓库上去。

另外一个有点奇怪的地方是,当你想查看 rack 子目录和 rack_branch 分支的差异——来确定你是否需要合并它们——你不能使用普通的 diff 命令。取而代之的是,你必须使用 git diff-tree 来和你的目标分支做比较:

  1. $ git diff-tree -p rack_branch

或者,将你的 rack 子目和最近一次从服务器上抓取的 master 分支进行比较,你可以运行:

  1. $ git diff-tree -p rack_remote/master

prev | next

原文: https://git-scm.com/book/zh/v2/Git-%E5%B7%A5%E5%85%B7-%E9%AB%98%E7%BA%A7%E5%90%88%E5%B9%B6