Bước tới nội dung

Phân tích LU

Bách khoa toàn thư mở Wikipedia

Trong đại số tuyến tính, phân tích LU (LU decomposition, LU factorization) là phương pháp phân tích ma trận thành tích của một ma trận tam giác dưới và một ma trận tam giác trên. Phép phân tích này thường được dùng trong giải tích số để giải hệ phương trình tuyến tính hoặc tính định thức của ma trận.

Định nghĩa

[sửa | sửa mã nguồn]

Gọi A là một ma trận vuông. Phân tích LU của A là cách viết A thành tích của 2 ma trận có dạng

trong đó LU lần lượt là các ma trận tam giác dưới và tam giác trên có cùng kích thước với A. Ví dụ với ma trận :

Phép phân tích LDU là cách phân tích có dạng:

với D là một ma trận chéo, LU là các ma trận tam giác đơn vị, nghĩa là tất cả các phần tử trên đường chéo của LU đều bằng một.

Phép Phân tích LUP (còn gọi là LU decomposition with partial pivoting) là cách phân tích có dạng

với LU vẫn tương ứng là ma trận tam giác dưới và trên, và P là một ma trận hoán vị, nghĩa là P chỉ gồm không và một và chỉ có duy nhất một phần tử 1 trên mỗi dòng và cột.

Phép LU decomposition with full pivoting (Trefethen and Bau) là cách phân tích có dạng

Trong phần này chúng ta yêu cầu A là ma trận vuông, nhưng những phép phân tích này có thể được tổng quát hóa cho ma trận bất kì. Trong trường hợp đó, LP là các ma trận vuông có số dòng bằng số dòng của A, trong khi U có kích thước giống như A. Ma trận tam giác trên khi đó được hiểu là chứa toàn giá trị 0 ở dưới đường chéo chính bắt đầu từ góc trên trái.

Sự tồn tại và tính duy nhất

[sửa | sửa mã nguồn]

Một ma trận khả nghịch cấp n thỏa phép phân tích LU nếu và chỉ nếu tất cả các ma trận con chính cấp k, k = 0, 1,..., n-1 của nó đều khả nghịch. Phép phân tích là duy nhất nếu ta yêu cầu các phần tử đường chéo của L (hoặc U) đều bằng 1. Ma trận cũng có phép phân tích LDU duy nhất với cùng điều kiện này.

Ma trận suy biến vẫn có thể có phân tích LU. Thực tế, một ma trận vuông hạng k vẫn có phân tích LU nếu k ma trận con chính đầu tiên của nó khả nghịch. Tuy nhiên điều ngược lại không chắc.

Người ta đã tìm được điều kiện cần và đủ để một ma trận không nhất thiết khả nghịch trong trường bất kì có phân tích LU. Điều kiện này được biểu diễn bằng hạng của một số ma trận con nào đó. Phép khử Gauss cũng được mở rộng cho trường hợp tổng quát này (Okunev & Johnson 1997).

Mọi ma trận khả nghịch A - bất kể vuông hay không - đều có phân tích LUP.

Các thuật toán

[sửa | sửa mã nguồn]

Phân tích LU về cơ bản là một dạng của phép khử Gaussian. Ta chuyển ma trận A thành ma trận tam giác trên U bằng cách khử các phần tử bên dưới đường chéo chính. Thuật toán Doolittle khử từng cột một bắt đầu từ bên trái, bằng cách nhân bên trái A với các ma trận tam giác dưới. Kết quả của thuật toán này là một ma trận tam giác dưới đơn vị và một ma trận tam giác trên. Thuật toán Crout hơi khác ở chỗ tạo thành một ma trận tam giác dưới và một ma trận tam giác trên đơn vị.

Phân tích LU sử dụng các thuật toán này yêu cầu khoảng 2n3 / 3 phép tính dấu chấm động.

Thuật toán Doolittle

[sửa | sửa mã nguồn]

Cho một ma trận N × N

ta định nghĩa

và lặp với n = 1,...,N-1 như sau.

Khử các phần tử bên dưới đường chéo chính của cột thứ n của A(n-1) bằng cách cộng vào dòng thứ i của ma trận này với dòng thứ n và nhân thêm hệ số

với . Nói cách khác, ta nhân bên trái A(n-1) với ma trận tam giác dưới

Đặt

Sau N-1 bước, ta đã khử tất cả các phần tử bên dưới đường chéo chính, và nhận được ma trận tam giác trên A(N-1). Phép phân tích LU được xác định bằng nhận xét rằng

Ký hiệu ma trận tam giác trên A(N-1)U, và . Vì nghịch đảo của ma trận tam giác dưới 'Ln cũng là ma trận tam giác dưới, và tích hai ma trận tam giác dưới cũng là một ma trận tam giác dưới nên L là ma trận tam giác dưới cần tìm. Hơn nữa, nhận xét rằng

Vậy ta có .

Rõ ràng là để thuật toán hoạt động được, cần phải đảm bảo tại mỗi bước (xem công thức ). Nếu giả sử này không đúng ở một bước nào đó, ta có thể hoán vị dòng thứ n với một dòng khác bên dưới nó để tiếp tục thuật toán. Đây là lý do mà phép phân tích LU tổng quát tương tự với phép phân tích .

Thuật toán Crout và LUP

[sửa | sửa mã nguồn]

Thuật toán phân tích LUP của Cormen et al. là trường hợp tổng quát của phép phân tích Crout. Phần này trình bày thuật toán phân tích LUP.

  1. Nếu có một phần tử khác không trong dòng đầu tiên, chọn ma trận hoán vị sao cho có phần tử khác không ở góc trên trái. Ngược lại, chọn ma trận đơn vị. Đặt .
  2. Gọi là ma trận có được từ bằng cách bỏ đi cột đầu tiên và dòng đầu tiên của nó. Phân tích theo đệ quy. Tạo từ bằng cách thêm một dòng 0 vào phía trên và thêm cột đầu tiên của vào bên trái.
  3. Tạo từ bằng cách thêm một dòng không vào phía trên và một cột không vào bên trái, sau đó thay phần tử ở góc trên trái (đang bằng 0) thành 1. Tạo từ theo cách tương tự và định nghĩa . Gọi là nghịch đảo của .
  4. Lúc này, bằng , (có thể) ngoại trừ dòng đầu tiên. Nếu dòng đầu tiên của là 0, thì vì cả hai đều có dòng đầu tiên là 0, và theo đó . Ngược lại, có cùng phần tử khác 0 ở góc trên trái, và với ma trận vuông tam giác trên với các phần tử đường chéo bằng 1 ( khử các phần tử của và thêm các phần tử của ). Khi đó là phép phân tích cần tìm.

Đoạn mã giả sau thể hiện từng bước của thuật toán phân tích LUP:

 // A: input - ma trận ban đầu, kích thước n x n.
 // n: input - kích thước của A.
 // C: output - ma trận kích thước (n x n+1),...
 //              với n cột đầu tiên chứa L  U,...
 //              cột cuối cùng thể hiện ma trận hoán vị P.
 
 FUNCTION LUP(n, A; C)
  
     // khởi tạo C
     FOR i=1 TO n DO
         C[i;n+1] = i             // khởi tạo p
         FOR j=1 TO n DO
             C[i,j] = A[i,j]
         END
     END
 
     FOR j=1 TO n-1 DO           // với mỗi cột j
         Chọn phần tử khác 0 lớn nhất (phần tử neo) trong cột j.
         Gọi i  dòng chứa phần tử neo đó.
 
         IF không tìm được i THEN
             NGỪNG THUẬT TOÁN    // Không  lời giải duy nhất
         END
 
         IF i ~= j THEN
             Đảo dòng i  j
         END
 
         FOR i = j + 1 TO n DO   // với mỗi dòng bên dưới dòng thứ j
             t = C[i,j]/C[j,j]   // thừa số
             C[i, j] = t
 
             FOR k = j+1 TO n DO                // với mỗi cột bên phải cột j
                 C[i,k] = C[i,k] - t*C[j,k]
             END
         END
     END
 END

Độ phức tạp lý thuyết

[sửa | sửa mã nguồn]

Nếu nhân hai ma trận bậc n có độ phức tạp M(n), trong đó M(n)≥na với a>2 nào đó, thì phép phân tích LU có thể được tính trong thời gian O(M(n)).[1] Nghĩa là, chẳng hạn dựa trên thuật toán Coppersmith–Winograd, ta có thể có thuật toán phân tích LU với độ phức tạp O(n2.376).

Ví dụ đơn giản

[sửa | sửa mã nguồn]

Một cách đơn giản để tìm phân tích LU của ma trận là giải hệ phương trình tuyến tính của các phép nhân ma trận tương ứng. Biết rằng:

Hệ này có vô số nghiệm. Trong trường hợp đó bất kì hai phần tử khác 0 nào của LU đều có thể được xem là tham số, và có thể chọn bất kì giá trị khác 0 nào. Do đó để tìm phân tích LU duy nhất, ta cần thêm một số giới hạn cho LU. Chẳng hạn ta có thể yêu cầu ma trận tam giác dưới L là ma trận đơn vị (nghĩa là các phần tử đường chéo chính của nó đều bằng 1). Khi đó hệ trở thành:

Thay các giá trị này vào ma trận, ta được:

Ứng dụng

[sửa | sửa mã nguồn]

Giải hệ phương trình tuyến tính

[sửa | sửa mã nguồn]

Cho phương trình

ta muốn giải phương trình này với Ab cho trước. Khi đó nghiệm của phương trình được tính qua 2 bước:

  1. Đầu tiên, giải phương trình để tìm y
  2. Sau đó giải phương trình để tìm x.

Nhận xét rằng trong cả hai bước ta chỉ phải làm việc với các ma trận tam giác (trên và dưới). Các phương trình này có thể được giải đơn giản bằng các phép thế thay vì sử dụng phép khử Gauss (tuy nhiên ta vẫn cần một thuật toán tương tự như phép khử Gauss để tính phân tích LU). Do đó phân tích LU chỉ tỏ ra hiệu quả khi ta phải giải phương trình trên nhiều lần với các giá trị khác nhau của b; khi đó chỉ cần tính phân tích LU của A một lần và giải các ma trận tam giác với các giá trị khác nhau của b, thay vì phải sử dụng nhiều lần các phép khử Gauss.

Tính ma trận nghịch đảo

[sửa | sửa mã nguồn]

Khi giải hệ phương trình, thường thì b được xem là vector có chiều dài bằng số dòng của A. Nếu thay vì vector b, ta có ma trận B, với B là ma trận kích thước , thì ta sẽ phải tìm ma trận X (cũng có kích thước ):

Có thể sử dụng cùng phương pháp ở trên để giải cho mỗi cột của ma trận X. Với giả sử rằng B là ma trận đơn vị với kích thước n thì X khi đó là nghịch đảo của A.[2]

Tính định thức

[sửa | sửa mã nguồn]

Các ma trận có thể được dùng để tính định thức của ma trận rất hiệu quả vì det(A) = det(L) det(U) và định thức của các ma trận tam giác đơn giản là tích các phần tử trên đường chéo của nó. Đặc biệt, nếu L là ma trận tam giác đơn vị thì:

Tương tự với phân tích LUP. Định thức của ma trận hoán vị P là (−1)S, với là số lượng phép hoán đổi dòng trong phép phân tích.

  1. ^ J.R. Bunch and J.E. Hopcroft, Triangular factorization and inversion by fast matrix multiplication, Mathematics of Computation, 28 (1974) 231–236.
  2. ^ Matrix Computations. 3rd Edition, 1996. p121.

Đọc thêm

[sửa | sửa mã nguồn]
  • Bau III, David; Trefethen, Lloyd N. (1997), Numerical linear algebra, Philadelphia: Society for Industrial and Applied Mathematics, ISBN 978-0-89871-361-9
  • Cormen, Thomas H.; Leiserson, Charles E.; Rivest, Ronald L.; Stein, Clifford (2001), Introduction to Algorithms, MIT Press and McGraw-Hill, ISBN 978-0-262-03293-3
  • Horn, Roger A.; Johnson, Charles R. (1985), Matrix Analysis, Cambridge University Press, ISBN 0-521-38632-2. See Section 3.5.
  • Householder, Alston (1975), The Theory of Matrices in Numerical Analysis.
  • Okunev, Pavel; Johnson, Charles (1997), Necessary And Sufficient Conditions For Existence of the LU Factorization of an Arbitrary Matrix, arXiv:math.NA/0506382.
  • Press, William H.; Flannery, Brian P.; Teukolsky, Saul A.; Vetterling, William T. (1992), “LU Decomposition and Its Applications”, Numerical Recipes in FORTRAN: The Art of Scientific Computing (PDF) (ấn bản thứ 2), Cambridge University Press, tr. 34–42