Bài toán tìm cây khung nhỏ nhất trong đồ thị
Tác giả: * Hoàng Việt Cường - Đại học Bách Khoa Hà Nội * Phan Thành Long - THPT Chuyên Thái Bình (K17-20)
Reviewer: Vương Hoàng Long - Đại học Quốc Gia Singapore
Một số kiến thức cần biết¶
Vì bài viết nói về cây khung nhỏ nhất, các bạn nên đọc một số kiến thức liên quan đến cây trước mà mình liệt kê dưới đây vì đây là những kiến thức rất thường gặp trong những bài tập về cây khung, trong khuôn khổ bài viết mình sẽ không giải thích lại về những kiến thức này nữa: * Lowest Common Accessor * Disjoin Set Union
Lưu ý: Toàn bộ phần code phía dưới sử dụng cho C++11 trở lên, các bạn lưu ý kiểm tra trình biên dịch của mình.
Cây khung nhỏ nhất là gì¶

Định nghĩa¶
Theo lý thuyết đồ thị, chúng ta đều biết rằng 1 đồ thị được biểu diễn bằng công thức \(G = (V, E)\), trong đó đồ thị \(G\) của chúng ta bao gồm tập các đỉnh \(V\) và tập các cạnh \(E\).
- Cây khung (spanning tree) của đồ thị là một tập hợp các cạnh của đồ thị thỏa mãn tập cạnh này không chứa chu trình và liên thông (từ một đỉnh bất kì có thể đi tới bất kỳ đỉnh nào khác theo mà chỉ dùng các cạnh trên cây khung)
-
Trong đồ thị có trọng số, cây khung nhỏ nhất (minimum spanning tree) là cây khung có tổng trọng số các cạnh trong cây nhỏ nhất.
-
Một ví dụ về cây khung trong đồ thị vô hướng không trọng số:

- Một ví dụ về cây khung nhỏ nhất trong đồ thị vô hướng có trọng số:


Trong khuôn khổ bài viết, chúng ta sẽ làm việc với đồ thị vô hướng có trọng số.
Tính chất¶
Một vài tính chất của cây khung nhỏ nhất trong đồ thị vô hướng có trọng số: * 1. Tính chất chu trình: Trong một chu trình \(C\) bất kỳ, nếu \(e\) là cạnh có trọng số lớn nhất tuyệt đối (không có cạnh nào có trọng số bằng \(e\)) thì \(e\) không thể nằm trên bất kỳ cây khung nhỏ nhất nào.
-
2. Đường đi hẹp nhất: Xét 2 đỉnh \(u\), \(v\) bất kỳ trong đồ thị. Nếu \(w\) là trọng số của cạnh lớn nhất trên đường đi từ \(u\) đến \(v\) trên cây khung nhỏ nhất của đồ thị thì ta không thể tìm được đường đi nào từ \(u\) đến \(v\) trên đồ thị ban đầu chỉ đi qua những cạnh có trọng số nhỏ hơn \(w\).
-
3. Tính duy nhất: Nếu tất cả các cạnh đều có trọng số khác nhau thì chỉ có duy một cây khung nhỏ nhất. Ngược lại, nếu một vài cạnh có trọng số giống nhau thì có thể có nhiều hơn một cây khung nhỏ nhất.
-
4. Tính chất cạnh nhỏ nhất: Nếu \(e\) là cạnh có trọng số nhỏ nhất của đồ thị, và không có cạnh nào có trọng số bằng \(e\) thì \(e\) nằm trong mọi cây khung nhỏ nhất của đồ thị.
Chứng minh¶
Lưu ý : các bạn mới học cây khung lần đầu cân nhắc việc đọc chứng minh, tác giả khuyên các bạn nên tạm thời bỏ qua phần này
Xuyên suốt cả bốn tính chất, ta đều sử dụng phép phản chứng để chứng minh * 1. Tính chất chu trình: Giả sử \(e\) thuộc một cây khung \(T\) của đồ thị, ta sẽ chứng minh luôn tồn tại một cây khung khác của đồ thị có trọng số nhỏ hơn \(T\). - Ta thử xóa cạnh \(e\) khỏi cây khung \(T\). Lúc này, \(T\) sẽ bị chia làm 2 thành phần liên thông và tổng trọng số giảm đi \(w_e\). - Xét các đỉnh nằm trong chu trình \(C\), giả sử sau khi xóa \(e\) khỏi cây khung, các đỉnh này vẫn liên thông với nhau. Vì thế, khi thêm \(e\) trở lại vào cây khung, \(e\) sẽ kết nối 2 đỉnh đã liên thông với nhau \(\Rightarrow\) tồn tại chu trình trong cây khung \(\Rightarrow\) Trái với giả thiết \(T\) là cây khung. ⇒ Vậy nên, khi xóa \(e\) khỏi \(T\), các đỉnh nằm trong chu trình \(C\) sẽ bị tách làm 2 thành phần liên thông. Do đó, ta có thể chọn ra cạnh \(e'\) khác \(e\) thuộc chu trình \(C\) để kết nối 2 thành liên thông này, biến \(T\) trở lại thành một cây khung của đồ thị. Mặt khác, \(e\) là cạnh có trọng số lớn nhất tuyệt đối trên \(C\), nên khi thay \(e\) bằng \(e'\), trọng số của T sẽ giảm đi \(w_e - w_{e'}\) Kết luận: T không phải là cây khung nhỏ nhất của đồ thị.
- 2. Đường đi hẹp nhất:
- Xét cây khung nhỏ nhất \(T\) bất kỳ của đồ thị \(G\) mà tồn tại đường đi \(u \rightarrow v\) trên \(G\) có cạnh lớn nhất nhỏ hơn cạnh lớn nhất của đường đi \(u \rightarrow v\) trên \(T\).
- Gọi đường đi \(u \rightarrow v\) trên \(G\) là \(path\), cạnh lớn nhất của đường đi \(u \rightarrow v\) trên \(T\) là \(e\). ⇒ Như vậy, nếu xóa \(e\) khỏi cây khung ban đầu, cây khung sẽ bị chia thành 2 TPLT rời nhau, một TPLT chứa \(u\) và TPLT còn lại chứa \(v\).
- Do \(path\) là đường đi \(u \rightarrow v\) trên \(G\) nên trên \(path\) sẽ tồn tại cạnh \(e'\) có thể kết nối 2 TPLT này. Mà mọi cạnh trên \(path\) đều có trọng số nhỏ hơn \(e\) (như giả thiết) ⇒ Khi xoá \(e\) và thay bằng \(e'\), ta sẽ thu được 1 cây khung \(T'\) có trọng số nhỏ hơn cây khung ban đầu Kết luận: \(T\) không phải cây khung nhỏ nhất của đồ thị.
-
3. Tính duy nhất:
- Giả sử tồn tại 2 cây khung nhỏ nhất \(T\) và \(T'\). Xét cạnh \(u-v\) nằm trong \(T\) nhưng không trong \(T'\).
- Gọi đường đi \(u \rightarrow v\) trên \(T\) là \(path\), trên \(T'\) là \(path'\). Hiển nhiên, \(path'\) không chứa cạnh \(u-v\).
- Vì trọng số các cạnh của đồ thị đều khác nhau \(\Rightarrow\) Cạnh lớn nhất của \(path\) sẽ có trọng số lớn hơn trọng số cạnh lớn nhất của \(path'\) hoặc ngược lại. ⇒ Theo tính chất đường đi hẹp nhất, \(T\) hoặc \(T'\) sẽ không phải là cây khung nhỏ nhất.
-
4. Tính chất cạnh nhỏ nhất: > Ta sẽ chứng minh mọi cây khung không chứa \(e\) của đồ thị đều không phải là cây khung nhỏ nhất.
- Giả sử \(e\) nối 2 đỉnh \(u\), \(v\) của đồ thị. Gọi \(T\) là 1 cây khung không chứa \(e\) của đồ thị.
- Xét cạnh \(e'\) bất kỳ thuộc đường đi từ \(u \rightarrow v\) trên \(T\). Khi xóa \(e'\) khỏi \(T\), \(T\) sẽ bị tách làm 2 thành phần liên thông, 1 thành phần liên thông chứa \(u\), 1 phần phần liên thông chứa \(v\). ⇒ Do đó, ta hoàn toàn có thể thêm cạnh \(e\) (nối 2 đỉnh \(u- v\)) vào \(T\) để kết nối 2 thành phần liên thông này, khi đó \(T\) sẽ trở lại thành 1 cây khung của đồ thị.
- Mặt khác, \(e\) là cạnh có trọng số nhỏ nhất tuyệt đối của đồ thị, nên khi thay \(e'\) bằng \(e\) trên cây khung \(T\), trọng số của \(T\) sẽ giảm đi 1 lượng dương Kết luận: \(T\) ban đầu không phải là cây khung nhỏ nhất của đồ thị.
Các thuật toán tìm cây khung nhỏ nhất¶
1. Thuật toán Kruskal¶
Ý tưởng thuật toán: Ban đầu mỗi đỉnh là một cây riêng biệt, ta tìm cây khung nhỏ nhất bằng cách duyệt các cạnh theo trọng số từ nhỏ đến lớn, rồi hợp nhất các cây lại với nhau.
Cụ thể hơn, giả sử cạnh đang xét nối 2 đỉnh \(u\) và \(v\), nếu 2 đỉnh này nằm ở 2 cây khác nhau thì ta thêm cạnh này vào cây khung, đồng thời hợp nhất 2 cây chứa \(u\) và \(v\).
Giả sử ta cần tìm cây khung nhỏ nhất của đồ thị \(G\). Thuật toán bao gồm các bước sau: * Khởi tạo rừng \(F\) (tập hợp các cây), trong đó mỗi đỉnh của G tạo thành một cây riêng biệt. * Khởi tạo tập \(S\) chứa tất cả các cạnh của \(G\). * Chừng nào \(S\) còn khác rỗng và \(F\) gồm hơn một cây * Xóa cạnh nhỏ nhất trong \(S\) * Nếu cạnh đó nối hai cây khác nhau trong \(F\), thì thêm nó vào \(F\) và hợp hai cây kề với nó làm một * Nếu không thì loại bỏ cạnh đó.
Khi thuật toán kết thúc, rừng chỉ gồm đúng một cây và đó là một cây khung nhỏ nhất của đồ thị \(G\)
Ví dụ các bước giải bài toán tìm cây khung nhỏ nhất với thuật toán Kruskal :

Để thực hiện thao tác kiểm tra cạnh và hợp nhất 2 cây một cách nhanh chóng, ta sử dụng cấu trúc Disjoint Set, dưới đây là đoạn code dùng để cài đặt thuật toán:
Chứng minh tính đúng đắn của thuật toán:¶
Ta phải chứng minh hai điều: 1. đầu ra của thuật toán là một cây khung 2. cây đó có trọng số nhỏ nhất trong số tất cả các cây khung của đồ thị.
Chứng minh (1) - Mỗi cạnh \((u, v)\) được xét đến, nó chỉ kết nạp vào câu khung nếu \(u, v\) thuộc 2 thành phần liên thông khác nhau \(T_u, T_v\) ⇒ Do đó các cạnh được thêm không tạo thành chu trình - Do \(T\) không có chu trình ⇒ số cạnh được thêm \(≤ n - 1\). Ta sẽ chứng minh \(T\) có đúng \(n - 1\) cạnh - Giả sử số cạnh được thêm \(< n - 1\) ⇒ \(T\) gồm hai hay nhiều thành phần liên thông - Mặt khác, do \(G\) liên thông ⇒ tồn tại các cạnh thuộc \(G\) nối các thành phần liên thông đó mà không thuộc \(T\). Do đó cạnh đầu tiên nhỏ nhất trong số các cạnh này sẽ được đưa vào do nó không tạo thành chu trình, mâu thuẫn với giả thiết ở trên ⇒ Giả sử sai - Vậy số cạnh được thêm vào bằng đúng \(n - 1\)
Chứng minh (2)
Lưu ý : Nếu bạn mới học cây khung lần đầu tiên chưa nên đọc ngay chứng minh này, vì chúng có thể khiến bạn hoang mang. Chứng minh có sử dụng một số khái niệm như lát cắt, lát cắt hẹp nhất
Trong chứng minh này, mình có quy ước sử dụng một số kí hiệu: * \(\|A\|\) : số lượng phần tử có trong tập hợp \(A\) * \(A - B\) : tập hợp các phần tử thuộc \(A\) mà không thuộc \(B\)
Giờ cùng đi vào chi tiết chứng minh nhé (づ◔ ͜ʖ◔)づ - Gọi \(T\) là cây khung đầu ra của thuật toán Kruskal và $T^ \times $ là một cây khung nhỏ nhất, ta sẽ chứng minh tổng trọng số trên \(T\) và $T^ \times $ bằng nhau : \(c(T)\) = \(c(T^ \times )\) - Nếu \(c(T)\) = \(c(T^ \times )\) ⇒ hiển nhiên đúng - Nếu \(c(T)\) ≠ \(c(T^ \times )\) gọi \((u, v)\) là cạnh \(\in\) \(T\) mà \(\notin\) $T^ \times $ hay thuộc $T - T^ \times $. Gọi \(S\) là thành phần liên thông chứa u tại thời điểm \((u, v)\) được thêm vào \(T\). Nhận xét: Dễ thấy nếu xóa cạnh \((u, v)\) trên \(T\) thì sẽ tách thành 2 thành phần liên thông \(S\) và \(G - S\). Đây là một lát cắt, ta có thể thêm bất cứ cạnh nào nối giữa 2 thành phần liên thông này để tạo thành một cây mới ⇒ \((u, v)\) \(\in\) lát cắt \((S, G - S)\). > Định nghĩa : Một lát cắt \(s\) - \(t\) là một tập con của 𝐸 mà khi loại bỏ những cạnh này thì không còn đường đi từ \(s\) tới \(t\). (Bài toán lát cắt hẹp nhất)
1 2 3 4 5 6 7 8 | |
Đánh giá độ phức tạp thuật toán: Gọi \(n\) là số đỉnh, \(m\) là số cạnh của đồ thị
Thuật toán gồm 2 phần: * Sắp xếp mảng \(m\) cạnh theo trọng số tăng dần mất độ phức tạp \(O(m \log{m})\). * Ta duyệt \(m\) cạnh, mỗi cạnh dùng Disjoint Set mất độ phức tạp \(O(\log{n})\), vậy tổng cộng mất độ phức tạp \(O(m\log{n})\).
\(\Rightarrow\) độ phức tạp của thuật toán Kruskal là \(O(m\log{m} +m\log{n})\)
2. Thuật toán Prim¶
Ý tưởng thuật toán: Ý tưởng của thuật toán Prim rất giống với ý tưởng của thuật toán Dijkstra (tìm đường đi ngắn nhất trên đồ thị). Nếu như thuật toán Kruskal xây dựng cây khung nhỏ nhất bằng cách kết nạp từng cạnh vào đồ thị thì thuật toán Prim lại kết nạp từng đỉnh vào đồ thị theo tiêu chí: đỉnh được nạp vào tiếp theo phải chưa được nạp và gần nhất với các đỉnh đã được nạp vào đồ thị.
Thuật toán bao gồm các bước sau: * Khởi tạo tập \(S\) là cây khung hiện tại, ban đầu S chưa có đỉnh nào. * Khởi tạo mảng \(D\) trong đó \(D_i\) là khoảng cách ngắn nhất từ đỉnh \(i\) đến 1 đỉnh đã được kết nạp vào tập \(S\), ban đầu \(D[i]\) = \(+\infty\) * Lặp lại các thao tác sau \(n\) lần(\(n\) là số cạnh của đồ thị) * Tìm đỉnh \(u\) không thuộc \(S\) có \(D_u\) nhỏ nhất, thêm \(u\) vào tập \(S\). * Xét tất cả các đỉnh \(v\) kề \(u\), cập nhật \(D_v = min(D_v, w_{u,v})\) với \(w_{u,v}\) là trọng số cạnh \(u-v\). Nếu \(D_v\) được cập nhật theo \(w_{u,v}\) thì đánh dấu \(trace_v = u\). * Thêm cạnh \(u-trace[u]\) vào tập cạnh thuộc cây khung nhỏ nhất.
Mặc dù không bắt buộc, các bạn có thể đọc chứng minh tính đúng đắn thuật toán của Wiki tại đây.
Khi hoàn thành xong \(n\) bước trên, ta thu được cây khung nhỏ nhất của đồ thị gồm \(n\) đỉnh và \(n - 1\) cạnh.
Ví dụ các bước giải bài toán tìm cây khung nhỏ nhất với thuật toán Prim:

Đoạn code sử dụng để cài đặt thuật toán Prim:
Fact: Trong các bài toán tìm cây khung, phần lớn mọi người sẽ sử dụng thuật toán Kruskal do tính dễ cài đặt cũng như dễ hiểu của nó.
Bonus : Các bạn có thể sử dụng Visualgo để mô phỏng thuật toán Kruskal và Prim thông qua hoạt ảnh, qua đó hiểu thêm về các thuật toán trên
Một số bài toán áp dụng¶
1. Bài toán NKCITY¶
Tóm tắt đề bài¶
1 thành phố gồm \(N\) trọng điểm, \(M\) tuyến đường có thể được xây dựng với chi phí xây dựng khác nhau. Yêu cầu chọn ra một số tuyến đường sao cho \(N\) trọng điểm phải được liên thông với nhau và chi phí xây dựng tuyến đường lớn nhất là nhỏ nhất có thể.
Thuật toán¶
Dựa vào tính chất đường đi hẹp nhất của cây khung mà ta đã trình bày ở trên, đường đi giữa 2 đỉnh \(u\), \(v\) bất kỳ trên cây khung nhỏ nhất là đường đi có cạnh lớn nhất là nhỏ nhất của đồ thị. Như vậy việc chọn ra các tuyến đường để xây dựng chỉ đơn giản là chọn các cạnh trên cây khung nhỏ nhất của đồ thị.
Độ phức tạp¶
Chính là độ phức tạp của thuật toán tìm cây khung nhỏ nhất mà các bạn sẽ cài đặt.
Cài đặt¶
Ở đây ta sẽ dùng Kruskal để tìm cây khung nhỏ nhất
2. Bài toán tìm cây khung nhỏ nhất cho mỗi cạnh - Codeforces 609E¶
Tóm tắt đề bài¶
Cho đồ thị vô hướng \(G\) gồm \(n\) đỉnh và \(m\) cạnh. Yêu cầu với mỗi cạnh trong đồ thị, tìm cây khung nhỏ nhất chứa cạnh đó của đồ thị và in ra trọng số của cây khung đó.
Đây là 1 bài tập khá kinh điển về cây khung nhỏ nhất. Để giải được bài tập này, chúng ta cần giải bài LUBENICA trước. Các bạn có thể đọc thêm về bài ở đây
Thuật toán:¶
- Đầu tiên, ta dựng cây khung nhỏ nhất \(S\) của đồ thị ban đầu:
- Sau đó, ta lần lượt đi tìm cây khung nhỏ nhất chứa mỗi cạnh của đồ thị. Với 1 cạnh i nối 2 đỉnh \(u\), \(v\) với trọng số \(w\), có 2 trường hợp xảy ra:
- Cạnh \(u-v\) đã thuộc cây khung nhỏ nhất \(S\) ban đầu, cây khung cần tìm chính là \(S\).
- Cạnh \(u-v\) không thuộc cây khung nhỏ nhất \(S\). Như vậy nếu thêm cạnh \(u-v\) vào cây khung sẽ tạo thành chu trình từ \(u\rightarrow v\). Do đó ta phải xóa đi 1 cạnh trên chu trình này để đảm bảo tính chất của cây khung. Và đương nhiên để tối ưu thì ta sẽ chọn xóa đi cạnh có trọng số lớn nhất trên đường đi từ \(u \rightarrow v\) (đã được trình bày trong bài LUBENICA ở trên) và thêm cạnh \(u-v\) vào cây khung sau khi đã xóa cạnh đó.
Code mẫu:¶
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 | |
3. Bài toán 160D - Edges in MST¶
Tóm tắt đề bài¶
Cho đồ thị vô hướng có trọng số \(G\) gồm \(n\) đỉnh và \(m\) cạnh. Yêu cầu với mỗi cạnh trong đồ thị, kiểm tra xem cạnh đó không thuộc bất kỳ cây khung nhỏ nhất nào, thuộc một số cây khung nhỏ nhất hay nằm trong mọi cây khung nhỏ nhất của đồ thị.
Thuật toán¶
- Ban đầu, khởi tạo đồ thị \(G'\) rỗng. Ta sẽ xét lần lượt từng nhóm các cạnh có cùng trọng số và thêm chúng vào đồ thị \(G'\). Đồng thời, với mỗi cạnh ta không quan tâm nó nối 2 đỉnh nào mà chỉ quan tâm nó nối 2 TPLT nào trong đồ thị hiện tại.
- Nhận xét rằng nếu có cạnh kết nối 2 TPLT khác nhau, các cạnh này sẽ xuất hiện trong ít nhất 1 cây khung nhỏ nhất. Ngược lại, nếu 1 cạnh nối 2 đỉnh đã liên thông từ trước thì cạnh này sẽ không thuộc bất kỳ cây khung nhỏ nhất nào.
- Xét các nhóm cạnh có cùng trọng số mà thuộc 2 thành phần liên thông khác nhau, ta dựng đồ thị \(G\) mới từ các nhóm cạnh đó với các đỉnh là các thành phần liên thông.
- Dễ thấy : Chọn tập cạnh từ \(G\) để thêm vào cây khung, tập cạnh đó phải thỏa mãn không tạo ra chu trình và không làm tăng thành phần liên thông của \(G\) bởi vì :
- Nếu tập cạnh chọn chứa chu trình thì đầu ra không còn là cây khung
- Nếu tập cạnh làm tăng số lượng thành phần liên thông của \(G\) thì cây khung sẽ mất tính nhỏ nhất
- Vậy cạnh nằm trong mọi cây khung sẽ phải là cạnh mà nằm trong mọi tập cạnh mình chọn ở trên, nếu tập cạnh thiếu nó thì vi phạm tính nhỏ nhất. ⇒ Có nghĩa là nếu thiếu cạnh đó thì sẽ làm tăng thành phần liên thông của \(G\). Vậy đó chỉ có thể là cạnh cầu.
- Kết luận :
- Các cạnh cầu sẽ nằm trong mọi cây khung nhỏ nhất của đồ thị
- Các cạnh còn lại không phải cạnh cầu sẽ thuộc một số cây khung nhỏ nhất
- Xem thêm : Tìm cạnh cầu
Độ phức tạp¶
- Đầu tiên, ta phải sắp xếp lại các cạnh theo trọng số tăng dần mất đpt \(O(m\log{m})\). Sau đó, ta phải duy trì 1 đồ thị hiện tại trong quá trình lần lượt thêm các nhóm cạnh vào đồ thị, ở đây ta sử dụng Disjoint Set để kiểm tra 2 đỉnh nối 2 TPLT nào cũng như thêm các cạnh vào đồ thị hiện tại.
- Thuật toán Tarjan để tìm cầu có độ phức tạp \(O(m + n)\) cho toàn đồ thị ⇒ Như vậy, độ phức tạp tổng của bài toán là \(O(m\log{m} + m\log{n} + n)\).
Cài đặt¶
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 | |
Luyện tập¶
Các bạn có thể thử sức với một số bài tập sau: * P186SUMF - 959E * VMST * C11WATER * CHEER
Xem thêm: Tổng hợp bài học - Phiên bản biên soạn dễ hiểu hơn.