Bài 1: Độ Phức Tạp Thời Gian¶

Tác giả: FPTOJ Team
Nội dung tham khảo từ: VNOI Wiki - Độ phức tạp thời gian, Topcoder - Computational Complexity

Bản chất vấn đề¶

Bài toán: Ai là người chạy nhanh nhất?¶

Giả sử bạn có 2 người bạn - An và Bình - cùng nhận nhiệm vụ tìm một cuốn sách trong thư viện có \(N\) kệ sách.

An lười biếng: cô ấy đi từ kệ đầu tiên đến kệ cuối cùng, lần lượt kiểm tra từng kệ một. Nếu \(N = 10^6\) kệ, cô ấy phải kiểm tra cả \(10^6\) kệ.
Bình thông minh hơn: vì sách đã được xếp theo thứ tự ABC, Bình chia đôi giá sách, loại bỏ một nửa mỗi lần. Với \(N = 10^6\) kệ, Bình chỉ cần kiểm tra khoảng 20 lần là xong.

Cùng một bài toán, nhưng thuật toán khác nhau dẫn đến thời gian chạy khác nhau cực kỳ lớn.

Câu hỏi đặt ra: Làm sao để biết thuật toán nào nhanh, thuật toán nào chậm trước khi chạy thử? Đó chính là lý do ta cần học về Độ phức tạp thời gian.

Tại sao cần phân tích độ phức tạp?¶

Trong lập trình thi đấu, thời gian giới hạn thường là 1 giây, tương đương khoảng \(10^8\) phép tính. Nếu thuật toán của bạn chạy quá lâu, bạn sẽ bị TLE (Time Limit Exceeded) dù kết quả đúng.

Phân tích độ phức tạp giúp bạn:

Đánh giá trước thuật toán có kịp chạy trong giới hạn thời gian hay không
So sánh nhiều thuật toán giải cùng bài toán
Tối ưu code khi cần thiết

Tư duy cốt lõi¶

Toán học bổ trợ: Logarit¶

Logarit cơ số 2 của \(N\) (viết là \(\log_2 N\)) là số lần bạn phải nhân 2 với chính nó để ra \(N\).

Ví dụ:

\(\log_2(8) = 3\), vì \(2 \times 2 \times 2 = 8\) (nhân 3 lần)
\(\log_2(16) = 4\), vì \(2 \times 2 \times 2 \times 2 = 16\) (nhân 4 lần)
\(\log_2(10^6) \approx 20\)

Vì sao quan trọng? Khi một thuật toán "chia đôi" vấn đề mỗi bước (như Bình tìm sách), số bước cần thiết chính là \(\log_2 N\).

Bảng tra cứu nhanh:

\(N\)	\(\log_2 N\) (xấp xỉ)
\(10^3\)	10
\(10^6\)	20
\(10^9\)	30

Lưu ý: Trong lập trình thi đấu, ta viết gọn là \(\log N\) mà không cần ghi cơ số. Vì \(\log_2 N\), \(\log_{10} N\), \(\ln N\) chỉ khác nhau một hằng số, mà hằng số thì ta bỏ qua.

O-lớn (Big-O) - Chiếc "máy đo" tốc độ thuật toán¶

Thay vì đếm chính xác "thuật toán chạy 1.532.789 bước", ta chỉ cần biết nó tăng nhanh như thế nào khi dữ liệu đầu vào tăng.

O-lớn là cách viết tắt để nói: "Khi \(N\) đủ lớn, thuật toán này chạy không quá \(c \times f(N)\) bước".

Ví dụ:

\(f(n) = 2n + 10\) là \(O(n)\), vì khi \(n\) đủ lớn, 10 không đáng kể, \(2n\) cũng chỉ là "\(n\) với hệ số nhỏ"
\(f(n) = 3n^2 + 5n + 100\) là \(O(n^2)\), vì khi \(n\) đủ lớn, \(3n^2\) "nuốt chửng" mọi thứ còn lại

Nguyên tắc đơn giản: Chỉ giữ số mũ cao nhất, bỏ hệ số và số hạng nhỏ hơn.

Bảng "tốc độ" các độ phức tạp thường gặp¶

Hãy tưởng tượng máy tính chạy khoảng \(10^8\) phép tính/giây. Bảng dưới cho biết \(N\) lớn nhất để thuật toán chạy xong trong 1 giây:

\(O(?)\)	Tên gọi	\(N\) tối đa	Ví dụ thực tế
\(O(1)\)	Hằng số	Tùy ý	Lấy phần tử đầu mảng
\(O(\log N)\)	Logarit	\(10^{18}\)	Tìm kiếm nhị phân
\(O(N)\)	Tuyến tính	\(10^8\)	Duyệt mảng
\(O(N \log N)\)	"\(N \log N\)"	\(10^6\)	Merge Sort, Quick Sort
\(O(N^2)\)	Bậc 2	\(10^4\)	2 vòng lặp lồng nhau
\(O(N^3)\)	Bậc 3	\(500\)	3 vòng lặp lồng nhau
\(O(2^N)\)	Mũ	\(20\)	Quay lui thử mọi trường hợp
\(O(N!)\)	Giai thừa	\(11\)	Sinh tất cả hoán vị

Cách tính O-lớn cho code - 3 quy tắc vàng¶

Quy tắc 1: Vòng lặp for i = 1 to N là \(O(N)\).

Quy tắc 2: Hai vòng lặp liên tiếp (nối đuôi nhau) thì cộng độ phức tạp.

C++Python

for (int i = 0; i < n; i++) { /* ... */ }  // O(n)
for (int j = 0; j < m; j++) { /* ... */ }  // O(m)
// Tong: O(n + m)

for i in range(n):  # O(n)
    pass
for j in range(m):  # O(m)
    pass
# Tong: O(n + m)

Quy tắc 3: Hai vòng lặp lồng nhau thì nhân độ phức tạp.

C++Python

for (int i = 0; i < n; i++) {       // O(n)
    for (int j = 0; j < m; j++) {   // O(m)
        // ...
    }
}
// Tong: O(n) x O(m) = O(n * m)

for i in range(n):      # O(n)
    for j in range(m):  # O(m)
        pass
# Tong: O(n) x O(m) = O(n * m)

Ví dụ phân tích code¶

Ví dụ 1: Hai vòng lặp nối tiếp

C++Python

int sum = 0;
for (int i = 0; i < n; i++) sum += i;   // O(n)
for (int j = 0; j < n; j++) sum += j;   // O(n)
// Tong: O(n) + O(n) = O(2n) = O(n)

s = 0
for i in range(n):      # O(n)
    s += i
for j in range(n):      # O(n)
    s += j
# Tong: O(n) + O(n) = O(2n) = O(n)

Ví dụ 2: Hai vòng lặp lồng nhau

C++Python

int sum = 0;
for (int i = 0; i < n; i++) {       // n lan
    for (int j = 0; j < n; j++) {   // n lan
        sum += j;
    }
}
// Tong: O(n) x O(n) = O(n^2)

s = 0
for i in range(n):          # n lan
    for j in range(n):      # n lan
        s += j
# Tong: O(n) x O(n) = O(n^2)

Ví dụ 3: Vòng trong chạy ít hơn

C++Python

int sum = 0;
for (int i = 0; i < n; i++) {       // n lan
    for (int j = 0; j < i; j++) {   // 0 + 1 + 2 + ... + (n-1) = n(n-1)/2 lan
        sum += j;
    }
}
// Tong: n(n-1)/2 = O(n^2)  ← Van la O(n^2) vi bo he so!

s = 0
for i in range(n):          # n lan
    for j in range(i):      # 0 + 1 + 2 + ... + (n-1) = n(n-1)/2 lan
        s += j
# Tong: n(n-1)/2 = O(n^2)  ← Van la O(n^2) vi bo he so!

Kĩ thuật Hai con trỏ - Kẻ lừa đảo!¶

Xem đoạn code này:

C++Python

int j = 0;
for (int i = 0; i < n; i++) {              // i chay tu 0 den n
    while (j < n && a[i] - a[j] > d)       // j cung chi chay tu 0 den n
        j++;
}

j = 0
for i in range(n):                          # i chay tu 0 den n
    while j < n and a[i] - a[j] > d:        # j cung chi chay tu 0 den n
        j += 1

Thoạt nhìn: vòng lặp lồng nhau, vậy là \(O(n^2)\)?

Sai! Hãy đếm tổng số lần j++ chạy trong TOÀN BỘ chương trình: \(j\) chỉ tăng từ 0 đến \(n\), mỗi giá trị tối đa 1 lần. Vậy tổng số lần tăng là \(O(n)\).

Tổng cộng: \(i\) chạy \(n\) lần + \(j\) chạy \(n\) lần = \(O(n) + O(n) = O(n)\).

Bài học: Không phải cứ thấy vòng lặp lồng là \(O(n^2)\)! Phải xem xét kĩ biến bên trong chạy bao nhiêu lần tổng cộng.

Độ phức tạp bộ nhớ (Space Complexity)¶

Bên cạnh thời gian, máy tính còn giới hạn về bộ nhớ (thường là 256MB hoặc 512MB).

Nguyên tắc ước lượng:

Một biến int tốn 4 bytes
Mảng int a[10^6] tốn ~4MB
Mảng int a[10^4][10^4] (\(10^8\) phần tử) tốn ~400MB, dễ bị quá giới hạn (MLE)

Độ phức tạp	Giải thích	Ví dụ
\(O(1)\)	Dùng vài biến đơn lẻ	Tính tổng 2 số
\(O(N)\)	Dùng mảng 1 chiều kích thước \(N\)	Lưu danh sách học sinh
\(O(N^2)\)	Dùng mảng 2 chiều \(N \times N\)	Ma trận kề, bảng DP 2D

Mẹo: Trong lập trình thi đấu, ưu tiên tiết kiệm bộ nhớ nếu có thể (ví dụ: dùng DP 1D thay vì 2D).

Phân tích tính đúng đắn¶

Tại sao bỏ hằng số và số hạng nhỏ hơn?¶

Giả sử bạn có hai thuật toán:

Thuật toán A: \(f(n) = 2n + 10\)
Thuật toán B: \(g(n) = 3n^2 + 5n + 100\)

Khi \(n = 10\):

\(f(10) = 2 \times 10 + 10 = 30\)
\(g(10) = 3 \times 100 + 5 \times 10 + 100 = 450\)

Khi \(n = 100\):

\(f(100) = 2 \times 100 + 10 = 210\)
\(g(100) = 3 \times 10000 + 5 \times 100 + 100 = 30600\)

Khi \(n = 1000\):

\(f(1000) = 2 \times 1000 + 10 = 2010\)
\(g(1000) = 3 \times 1000000 + 5 \times 1000 + 100 = 3005100\)

Nhận xét: Khi \(n\) càng lớn, số hạng có bậc cao nhất càng "nuốt chửng" các số hạng còn lại. Đó là lý do ta chỉ quan tâm đến bậc cao nhất.

Tại sao kĩ thuật hai con trỏ cho \(O(n)\)?¶

Trong đoạn code hai con trỏ, biến \(j\) chỉ tăng từ 0 đến \(n\). Mỗi lần tăng, giá trị của \(j\) không bao giờ giảm. Vậy tổng số lần tăng của \(j\) trong toàn bộ chương trình là tối đa \(n\).

Biến \(i\) cũng chạy từ 0 đến \(n\), tổng số lần lặp là \(n\).

Tổng số phép tính = (số lần lặp của \(i\)) + (tổng số lần tăng của \(j\)) = \(n + n = 2n = O(n)\).

Đây là kĩ thuật quan trọng trong lập trình thi đấu: không đếm số lần lặp của vòng trong trong mỗi lần lặp của vòng ngoài, mà đếm tổng cộng số lần biến bên trong thay đổi giá trị.

Tại sao \(\sum_{i=1}^{n} \frac{n}{i} = O(n \log n)\)?¶

Xét đoạn code:

C++Python

for (int i = 1; i <= n; i++) {
    for (int j = i; j <= n; j += i) {
        // ...
    }
}

for i in range(1, n + 1):
    for j in range(i, n + 1, i):
        pass

Vòng trong chạy với bước nhảy \(i\), nên số lần chạy là \(\lfloor \frac{n}{i} \rfloor\).

Tổng số lần chạy của vòng trong:

\[\sum_{i=1}^{n} \left\lfloor \frac{n}{i} \right\rfloor \leq \sum_{i=1}^{n} \frac{n}{i} = n \sum_{i=1}^{n} \frac{1}{i}\]

Tổng \(\sum_{i=1}^{n} \frac{1}{i}\) là chuỗi điều hòa, có giá trị xấp xỉ \(\ln n + \gamma\) (với \(\gamma \approx 0.577\) là hằng số Euler-Mascheroni).

Vậy tổng số lần chạy là \(O(n \log n)\), không phải \(O(n^2)\).

Đánh giá độ phức tạp¶

Đo thời gian chạy thực tế¶

Đoạn code dưới đây so sánh thời gian chạy thực tế của các độ phức tạp khác nhau:

C++Python

#include <bits/stdc++.h>
using namespace std;

int main() {
    int n = 100000000; // 10^8

    // ===== O(N) =====
    clock_t start = clock();
    long long sum = 0;
    for (int i = 0; i < n; i++) {
        sum += i;
    }
    clock_t end = clock();
    cout << "O(N): " << (double)(end - start) / CLOCKS_PER_SEC << " giay" << endl;

    // ===== O(N^2) - chi chay voi n nho =====
    n = 10000; // Giam n xuong vi O(n^2) voi n=10^8 se rat lau
    start = clock();
    sum = 0;
    for (int i = 0; i < n; i++) {
        for (int j = 0; j < n; j++) {
            sum += i + j;
        }
    }
    end = clock();
    cout << "O(N^2) voi n=10000: " << (double)(end - start) / CLOCKS_PER_SEC << " giay" << endl;

    return 0;
}

import time

# ===== O(N) =====
n = 10**8
start = time.time()
s = 0
for i in range(n):
    s += i
print(f"O(N): {time.time() - start:.3f} giay")

# ===== O(N^2) =====
n = 10000
start = time.time()
s = 0
for i in range(n):
    for j in range(n):
        s += i + j
print(f"O(N^2) voi n=10000: {time.time() - start:.3f} giay")

Tìm kiếm nhị phân - \(O(\log N)\)¶

Tìm kiếm nhị phân là thuật toán kinh điển có độ phức tạp \(O(\log N)\):

C++Python

int binary_search(int a[], int n, int target) {
    int lo = 0, hi = n - 1;

    while (lo <= hi) {
        int mid = lo + (hi - lo) / 2;

        if (a[mid] == target)
            return mid;
        else if (a[mid] < target)
            lo = mid + 1;
        else
            hi = mid - 1;
    }
    return -1;
}

def binary_search(a, target):
    lo, hi = 0, len(a) - 1

    while lo <= hi:
        mid = lo + (hi - lo) // 2

        if a[mid] == target:
            return mid
        elif a[mid] < target:
            lo = mid + 1
        else:
            hi = mid - 1
    return -1

Mỗi bước, khoảng tìm kiếm giảm một nửa. Số bước tối đa là \(\log_2 N\).

Bảng tổng hợp độ phức tạp¶

Độ phức tạp	Tên gọi	\(N\) tối đa trong 1s	Ví dụ thuật toán
\(O(1)\)	Hằng số	Tùy ý	Truy cập mảng
\(O(\log N)\)	Logarit	\(10^{18}\)	Tìm kiếm nhị phân
\(O(N)\)	Tuyến tính	\(10^8\)	Duyệt mảng
\(O(N \log N)\)	Linearithmic	\(10^6\)	Merge Sort
\(O(N^2)\)	Bậc 2	\(10^4\)	Bubble Sort
\(O(N^3)\)	Bậc 3	\(500\)	Floyd-Warshall
\(O(2^N)\)	Mũ	\(20\)	Quay lui tổ hợp
\(O(N!)\)	Giai thừa	\(11\)	Sinh hoán vị

Lưu ý / Cạm bẫy hay gặp¶

Bẫy 1: \(O(N^2)\) với \(N = 10^5\) sẽ bị TLE¶

Nếu đề cho \(N \leq 10^5\), thì \(O(N^2) = 10^{10}\) phép tính, quá 1 giây. Bạn cần tìm thuật toán \(O(N \log N)\) hoặc \(O(N)\).

Mẹo: Nhìn \(N\) trong đề bài, tra bảng ở trên để biết thuật toán nào "đọ" được.

Bẫy 2: Hằng số ẩn - Kẻ thù giấu mặt¶

Hai thuật toán cùng \(O(N)\) không có nghĩa chạy nhanh như nhau.

C++Python

// Cach 1: O(n), hang so nho
for (int i = 0; i < n; i++) sum++;

// Cach 2: O(n), hang so lon (gap 1000 lan!)
for (int i = 0; i < n; i++)
    for (int k = 0; k < 1000; k++) sum++;

# Cach 1: O(n), hang so nho
for i in range(n):
    s += 1

# Cach 2: O(n), hang so lon (gap 1000 lan!)
for i in range(n):
    for k in range(1000):
        s += 1

Cả hai đều \(O(N)\), nhưng cách 2 chậm gấp 1000 lần.

Bẫy 3: Tràn số khi tính mid¶

C++Python

// SAI: co the tran so khi lo + hi > 2 ty
int mid = (lo + hi) / 2;

// DUNG: tranh tran so
int mid = lo + (hi - lo) / 2;

# SAI: Python khong tran so nhung van nen dung cach dung
mid = (lo + hi) // 2

# DUNG: tranh tran so (thoi quen tot)
mid = lo + (hi - lo) // 2

Bẫy 4: \(O(1)\) không có nghĩa là "chạy nhanh"¶

\(O(1)\) chỉ nghĩa là không phụ thuộc vào \(N\). Nó có thể là 1 phép tính, nhưng cũng có thể là \(10^9\) phép tính (hằng số rất lớn).

Ví dụ: Một thuật toán quay lui chơi cờ vua là \(O(1)\) vì bàn cờ có giới hạn cố định (\(8 \times 8\)). Nhưng "hằng số" đó lớn đến mức vũ trụ cũng không đủ thời gian.

Bẫy 5: Đừng quên \(\log N\) trong phân tích¶

Khi gặp code kiểu này:

C++Python

for (int i = 1; i <= n; i++) {
    for (int j = i; j <= n; j += i) {  // j += i, khong phai j++
        // ...
    }
}

for i in range(1, n + 1):
    for j in range(i, n + 1, i):       # step = i, khong phai 1
        pass

Vòng trong chạy \(\frac{n}{1} + \frac{n}{2} + \frac{n}{3} + \ldots + \frac{n}{n} = n \times \left(1 + \frac{1}{2} + \frac{1}{3} + \ldots + \frac{1}{n}\right) \approx n \times \log N\).

Độ phức tạp là \(O(N \log N)\), không phải \(O(N^2)\).

Chúc mừng! Bạn đã nắm được nền tảng quan trọng nhất trong lập trình thi đấu. Từ giờ, mỗi khi viết code, hãy tự hỏi: "Thuật toán của mình có độ phức tạp là bao nhiêu? Nó có kịp chạy trong thời gian giới hạn không?"

Bài tập luyện tập¶

Hãy thử sức với các bài tập phân tích và tối ưu độ phức tạp thuật toán sau đây trên hệ thống tự host:

Bài	Nền tảng	Độ khó	Mục đích
An và chiếc máy tính	FPTOJ	⭐	Tối ưu độ phức tạp tính tổng dãy số từ ~O(N)~ về ~O(1)~
Đếm cặp số của An	FPTOJ	⭐⭐	Tối ưu từ thuật toán duyệt cặp ~O(N^2)~ về đếm tần suất ~O(N)~
Trò chơi lũy thừa	FPTOJ	⭐⭐⭐	Sử dụng Lũy thừa nhị phân để tối ưu phép tính ~A^B \pmod M~ về ~O(\log B)~
Dãy con của Việt	FPTOJ	⭐⭐⭐	Tìm đoạn con liên tiếp có tổng lớn nhất bằng thuật toán Kadane ~O(N)~ thay vì ~O(N^2)~
Số lượng ước số	FPTOJ	⭐⭐⭐⭐	Rút gọn thuật toán đếm ước số tự nhiên từ ~O(\sqrt{N})~ về ~O(1)~ bằng tính chất số chính phương

Bài viết liên quan¶

Tài liệu tham khảo¶

Bài tiếp theo: Thuật toán sắp xếp

Bài 1: Độ Phức Tạp Thời Gian¶

Bản chất vấn đề¶

Bài toán: Ai là người chạy nhanh nhất?¶

Tại sao cần phân tích độ phức tạp?¶

Tư duy cốt lõi¶

Toán học bổ trợ: Logarit¶

O-lớn (Big-O) - Chiếc "máy đo" tốc độ thuật toán¶

Bảng "tốc độ" các độ phức tạp thường gặp¶

Cách tính O-lớn cho code - 3 quy tắc vàng¶

Ví dụ phân tích code¶

Kĩ thuật Hai con trỏ - Kẻ lừa đảo!¶

Độ phức tạp bộ nhớ (Space Complexity)¶

Phân tích tính đúng đắn¶

Tại sao bỏ hằng số và số hạng nhỏ hơn?¶

Tại sao kĩ thuật hai con trỏ cho \(O(n)\)?¶

Tại sao \(\sum_{i=1}^{n} \frac{n}{i} = O(n \log n)\)?¶

Đánh giá độ phức tạp¶

Đo thời gian chạy thực tế¶

Tìm kiếm nhị phân - \(O(\log N)\)¶

Bảng tổng hợp độ phức tạp¶

Lưu ý / Cạm bẫy hay gặp¶

Bẫy 1: \(O(N^2)\) với \(N = 10^5\) sẽ bị TLE¶

Bẫy 2: Hằng số ẩn - Kẻ thù giấu mặt¶

Bẫy 3: Tràn số khi tính mid¶

Bẫy 4: \(O(1)\) không có nghĩa là "chạy nhanh"¶

Bẫy 5: Đừng quên \(\log N\) trong phân tích¶

Bài tập luyện tập¶

Bài viết liên quan¶

Tài liệu tham khảo¶

💬 Bình luận