Dữ liệu Lớn

Bách khoa toàn thư mở Wikipedia
Bước tới: menu, tìm kiếm

Dữ liệu Lớn[1][2] là thuật ngữ chỉ tập hợp dữ liệu lớn và phức tạp đến mức khó có thể xử lý bằng các công cụ hay ứng dụng quản trị và phân tích dữ liệu truyền thống. Thách thức công nghệ nằm ở các công đoạn thu thập, lưu trữ,[3] tìm kiếm, chia sẻ, truyền dẫn, phân tích[4] và hiển thị. Ứng dụng gồm có "xác định xu hướng kinh doanh, chất lượng nghiên cứu, ngăn chặn bệnh dịch, liên kết các trích dẫn luật pháp, phòng chống tội phạm, hay xác định tình trạng giao thông trong thời gian thực."[5][6].

Một đồ thị thể hiện sửa đổi trên Wikiepdia bởi IBM. Với kích cỡ vài terabyte, các văn bản và hình ảnh trên Wikipedia là một ví dụ của dữ liệu lớn.
Tăng trưởng lưu trữ dạng số; nguồn: http://www.martinhilbert.net/WorldInfoCapacity.html

Xem thêm[sửa | sửa mã nguồn]

Tham khảo[sửa | sửa mã nguồn]

  1. ^ White, Tom (10 tháng 5 năm 2012). Hadoop: The Definitive Guide. O'Reilly Media. tr. 3. ISBN 978-1-4493-3877-0. 
  2. ^ “MIKE2.0, Big Data Definition”. 
  3. ^ Kusnetzky, Dan. “What is "Big Data?"”. ZDNet. 
  4. ^ Vance, Ashley (22 tháng 4 năm 2010). “Start-Up Goes After Big Data With Hadoop Helper”. New York Times Blog. 
  5. ^ “E-Discovery Special Report: The Rising Tide of Nonlinear Review”. Hudson Global. Truy cập ngày 1 tháng 7 năm 2012.  by Cat Casey and Alejandra Perez
  6. ^ “What Technology-Assisted Electronic Discovery Teaches Us About The Role Of Humans In Technology — Re-Humanizing Technology-Assisted Review”. Forbes. Truy cập ngày 1 tháng 7 năm 2012. 

Đọc thêm[sửa | sửa mã nguồn]