Ôtômat cây

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm


Ôtômat cây (tiếng Anh: tree automaton) là một loại máy trạng thái. Ôtômat cây xử lý cấu trúc cây, thay vì xâu như các máy trạng thái thường gặp.

Bài viết này đề cập đến ôtômat phân nhánh cây, tương đương với các ngôn ngữ chính quy của cây. Một khái niệm ôtômat cây khác có thể tìm thấy là ôtômat duyệt cây.

Tương tự ôtômat cổ điển, ôtômat cây hữu hạn có thể xác định (ÔHX) hoặc không (ÔHK). Theo cách xử lý cây đầu vào, ôtômat cây hữu hạn có thể thuộc vào hai loại: (a) dưới lên, (b) trên xuống. Đây là vấn đề quan trọng vì mặc dù ôtômat ÔHK trên xuống và ÔHK dưới lên tương đương về khả năng biểu diễn nhưng ÔHX trên xuống kém hơn hẳn ôtômat dưới lên tương ứng vì tính chất của cây xác định bởi ÔHX trên xuống chỉ có thể phụ thuộc vào tính chất của đường đi. ÔHX dưới lên mạnh ngang với ÔHK.

Định nghĩa[sửa | sửa mã nguồn]

Một bảng chữ cái xếp hạng là một cặp bảng chữ cái \mathcal{F} và hàm bậc (arity) sao cho có thể xây dựng một số hạng. Các thành tố trống (bậc bằng không) còn được gọi là hằng. Toán hạng được xây dựng bằng các ký hiện bậc một và hằng có thể được coi là xâu. Bậc cao hơn tạo ra cây.

Một ôtômat cây hữu hạn trên F được định nghĩa là: (Q, F, Q_{f}, \Delta)

Ở đây, Q là tập các trạng thái, F là một bảng chữ cái xếp hạng Q_{f} \subseteq Q là một tập các trạng thái kết thúc và \Delta là tập luật chuyển trạng thái, nghĩa là các luật viết lại một nút có các con là trạng thái thành nút trạng thái mới.

Không có trạng thái bắt đầu nhưng các luật chuyển cho ký hiệu hằng (nút lá) có thể được coi là các luật bắt đầu. Cây được chấp nhận nếu trạng thái ở gốc là một trạng thái chấp nhận.

Một ôtômat hữu hạn trên xuống trên F được định nghĩa bởi: (Q, F, I, \Delta)

Có hai điểm khác biệt với ôtômat cây dưới lên: thứ nhất, I \subseteq Q, tập trạng thái đầu thay cho Q_F; thứ hai, các luật chuyển đi theo chiều ngược lại, nghĩa là viết lại một nút trạng thái thành nút với các nút con là trạng thái. Cây được chấp nhận nếu mọi nhánh đều được duyệt qua theo cách này.

Các luật viết lại khiến các ký hiệu của Q 'di chuyển' dọc theo các nhánh của cây.

Tính chất[sửa | sửa mã nguồn]

Tính xác định[sửa | sửa mã nguồn]

Khả năng nhận dạng[sửa | sửa mã nguồn]

Với một ôtômat dưới lên, một số hạng nền t (nghĩa là một cây) được đoán nhận nếu có một phép biến đổi bắt đầu từ t và kết thúc bởi q(t). Ngược lại, với ôtômat trên xuống, một số hạng nền t được đoán nhận nếu có một phép biến đổi bắt đầu từ q(t) và kết thúc bằng t, với q(t) là một trạng thái bắt đầu.

Ngôn ngữ cây L(A) được đoán nhận bởi ôtômat cây A là tập hợp tất cả số hạng nền được đoán nhạn bởi A. Một tập các số hạng nền có thể được đoán nhận nếu tồn tại một ôtômat cây đoán nhận nó.

Một thuộc tính quan trọng là biến đổi đồng hình tuyến tính (nghĩa là bảo tồn bậc) không thay đổi tính đoán nhận được.

Tính đầy đủ và giản lược[sửa | sửa mã nguồn]

Một ôtômat cây hữu hạn không xác định là đầy đủ nếu có ít nhất một luật chuyển cho mỗi cặp ký hiệu-trạng thái. Một trạng thái q là đến được nếu có một số hạng nền (ground term) t sao cho có một phép biến đổi từ t đến q(t). Một ôtômat cây hữu hạn là giản lược nếu mọi trạng thái của nó đều đến được.

Định lý bơm[sửa | sửa mã nguồn]

Bao đóng[sửa | sửa mã nguồn]

Lớp các ngôn ngữ cây có thể nhận dạng được là đóng với các phép hợp, bù và giao.

Định lý Myhill-Nerode[sửa | sửa mã nguồn]

Tham khảo[sửa | sửa mã nguồn]

Kiến thức trong trang này đều lấy từ chương một, sách "Tree automata techniques and applications" - http://tata.gforge.inria.fr

Liên kết ngoài[sửa | sửa mã nguồn]