Bước tới nội dung

Mô hình cơ sở dữ liệu phân cấp

Bách khoa toàn thư mở Wikipedia

Mô hình cơ sở dữ liệu phân cấp (tiếng Anh: hierarchical database model) là một loại mô hình dữ liệu, trong đó dữ liệu được tổ chức thành cấu trúc dạng cây. Dữ liệu được lưu trữ dưới dạng các bản ghi (record) kết nối với nhau thông qua các liên kết (link). Mỗi bản ghi là một tập hợp các trường (field), mỗi trường chỉ chứa một giá trị. Kiểu (type) của một bản ghi xác định bản ghi đó sẽ chứa những trường nào.

Mô hình cơ sở dữ liệu phân cấp yêu cầu mỗi nút con chỉ có một nút cha, trong khi mỗi nút cha lại có thể có một hoặc nhiều nút con. Để lấy dữ liệu từ một cơ sở dữ liệu phân cấp, cần duyệt qua toàn bộ cây, bắt đầu từ nút gốc. Mô hình này được công nhận là mô hình cơ sở dữ liệu đầu tiên do IBM tạo ra vào những năm 1960.[1]

Lịch sử

[sửa | sửa mã nguồn]

Cấu trúc phân cấp được IBM phát triển vào những năm 1960 và sử dụng trong máy tính mainframe DBMS đầu tiên. Những mối quan hệ của các bản ghi tạo thành một mô hình dạng cây. Cấu trúc này tuy đơn giản nhưng không linh hoạt, vì các mối quan hệ trong cấu trúc bị ràng buộc ở dạng mối quan hệ một–nhiều. IBM Information Management System (IMS, Hệ thống Quản lý Thông tin IBM) và RDM Mobile là những ví dụ về hệ thống cơ sở dữ liệu phân cấp có nhiều cấp trên cùng một dữ liệu. RDM Mobile là cơ sở dữ liệu nhúng được thiết kế mới dành cho hệ thống máy tính di động.[2]

Mô hình dữ liệu phân cấp mất đi sức hút khi mô hình quan hệ của nhà khoa học máy tính Edgar Codd trở thành tiêu chuẩn trong thực tế, được sử dụng trong phần lớn các hệ thống quản lý cơ sở dữ liệu chính thống. Việc triển khai cơ sở dữ liệu quan hệ cho một mô hình phân cấp đã được thảo luận lần đầu tiên trong một xuất bản phẩm năm 1992 (xem thêm mô hình tập hợp lồng nhau). Các lược đồ thể hiện tổ chức dữ liệu phân cấp đã xuất hiện trở lại với sự ra đời của XML vào cuối những năm 1990[3] (xem thêm cơ sở dữ liệu XML). Ngày nay, cấu trúc phân cấp chủ yếu được sử dụng để lưu trữ thông tin địa lý và hệ thống tập tin.[2]

Hiện tại, cơ sở dữ liệu phân cấp vẫn được sử dụng rộng rãi, đặc biệt trong các ứng dụng đòi hỏi hiệu năng và tính sẵn sàng rất cao như ngân hàng và viễn thông. Một trong những cơ sở dữ liệu phân cấp thương mại được sử dụng rộng rãi nhất là IMS.[4] Một ví dụ khác về ứng dụng cơ sở dữ liệu phân cấp trong thực tế là phần mềm Windows Registry trong hệ điều hành Microsoft Windows.[1][5]

Ví dụ về dữ liệu phân cấp được biểu diễn dưới dạng bảng quan hệ

[sửa | sửa mã nguồn]

Một tổ chức có thể lưu trữ thông tin nhân viên trong một bảng có chứa các thuộc tính (hay cột) là mã nhân viên, tên, họ và mã phòng ban. Tổ chức sẽ cấp cho mỗi nhân viên phần cứng máy tính khi cần, nhưng thiết bị máy tính chỉ có thể do nhân viên được chỉ định sử dụng. Tổ chức có thể lưu trữ thông tin phần cứng máy tính trong một bảng riêng biệt bao gồm số sêri, loại và mã nhân viên sử dụng phần cứng đó. Các bảng có thể trông như thế này:

bảng employee
Mã nhân viên Tên Họ Mã phòng ban
100 Mahwish Faki 10-L
101 Hamadh Hashim 10-L
102 Nirun Ar 20-B
103 Chaaya Sandakelum 20-B
bảng computer
Số sêri Loại Mã nhân viên
3009734-4 Máy tính 100
3-23-283742 Màn hình 100
2-22-723423 Màn hình 100
232342 Máy in 100

Trong mô hình này, bảng dữ liệu employee đại diện cho nút "cha" của hệ thống phân cấp, còn bảng computer đại diện cho nút "con". Không giống cấu trúc cây thường thấy trong các thuật toán phần mềm máy tính, ở mô hình này, nút con trỏ đến nút cha thay vì ngược lại. Như bảng trên, mỗi nhân viên có thể sở hữu một số thiết bị máy tính, nhưng mỗi thiết bị máy tính có thể chỉ có một nhân viên sở hữu.

Xét cấu trúc sau:

Mã nhân viên Chức vụ Cấp trên
10 Giám đốc
20 Quản lý cấp cao 10
30 Nhân viên đánh máy 20
40 Lập trình viên 20

Trong bảng này, "con" có cùng kiểu dữ liệu với "cha". Hệ thống phân cấp cho biết Mã nhân viên 10 là cấp trên của 20, còn 30 và 40 có cấp trên là 20, thể hiện trong cột "Cấp trên". Trong thuật ngữ của cơ sở dữ liệu quan hệ, cột Cấp trên là một khóa ngoại tham chiếu đến cột Mã nhân viên. Nếu kiểu dữ liệu "con" khác "cha", phần con sẽ nằm ở một bảng khác, nhưng vẫn sẽ là một khóa ngoại tham chiếu đến cột Mã nhân viên của bảng nhân viên.

Mô hình đơn giản này thường được gọi là mô hình danh sách kề, do Tiến sĩ Edgar F. Codd giới thiệu sau những phê bình cho rằng mô hình quan hệ không thể mô hình hóa dữ liệu phân cấp.[6] Tuy vậy, mô hình này chỉ là một trường hợp đặc biệt của cách biểu diễn danh sách kề điển hình cho một đồ thị.

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ a b Bouchrika, Imed (2014). Learn Database Systems with Implementation and Examples. Lulu.com. tr. 7. ISBN 978-1-291-68889-4.
  2. ^ a b Singh, Shivendra (2011). The Theory And Practice Of The Dewey Decimal Classification System. Gyan Publishing House. tr. 142. ISBN 978-81-8205-521-6.
  3. ^ David Mertz (1 tháng 4 năm 2001). “Putting XML in context with hierarchical, relational, and object-oriented models” (bằng tiếng Anh). IBM. Truy cập ngày 17 tháng 5 năm 2020.
  4. ^ IBM. “Information Management System” (bằng tiếng Anh). IBM. Truy cập ngày 17 tháng 5 năm 2020.
  5. ^ Microsoft (31 tháng 5 năm 2018). “Structure of the Registry” (bằng tiếng Anh). Microsoft. Truy cập ngày 17 tháng 5 năm 2020.
  6. ^ National Open University of Nigeria (2009). Database Management System (PDF). National Open University of Nigeria. tr. 38. ISBN 978-058-331-9. Bản gốc (PDF) lưu trữ ngày 22 tháng 12 năm 2018. Truy cập ngày 17 tháng 5 năm 2020.

Liên kết ngoài

[sửa | sửa mã nguồn]

Bản mẫu:Mô hình cơ sở dữ liệu