Lưu trữ web

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm

Lưu trữ web (tiếng Anh: Web archiving) là một quá trình thu thập các phần của web để chắc chắn thông tin là dạng lưu trữ kỹ thuật số (Digital preservation) để các nhà nghiên cứu, sử gia và công chúng tra cứu trong tương lai.[1]

Trang web lớn nhất lưu trữ nội dung web dựa trên phương pháp thu thập số lượng lớn là Internet Archive, trang web này cũng duy trì một lưu trữ khổng lồ toàn bộ nội dung Web hiện nay.

Thu thập thông tin Web[sửa | sửa mã nguồn]

Thông thường, các nhà lưu trữ nội dung thu thập thông tin các dạng nội dung web như HTML, style sheet (phát triển web), JavaScript, Hình ảnh kỹ thuật số, và video kỹ thuật số. Họ cũng lưu trữ siêu dữ liệu về các nguồn tài nguyên thu thập được như thời gian truy xuất, dạng media, và độ dài nội dung. Dạng siêu dữ liệu này hữu dụng trong việc thiết lập xác thựcnguồn gốc (provenance) của bộ sưu tập lưu trữ.

Tham khảo[sửa | sửa mã nguồn]

  1. ^ Habibzadeh, P.; Sciences, Schattauer GmbH - Publishers for Medicine and Natural (ngày 1 tháng 1 năm 2013). “Decay of References to Web sites in Articles Published in General Medical Journals: Mainstream vs Small Journals”. Applied Clinical Informatics 4 (4). doi:10.4338/aci-2013-07-ra-0055. 
Sách chuyên khảo

Liên kết ngoài[sửa | sửa mã nguồn]