Big Data là gì?

Nếu các bạn làm việc trong ngành công nghệ thông tin hay là những tổ chức lớn như Y Tế, Ngân Hàng.. chắc rằng các bạn đã từng nghe qua cụm từ “Big Data” hay còn được biết đến với cái tên Dữ Liệu Lớn.

Vậy Big Data là gì, sử dụng nó trong những trường nào? Các bạn hãy cùng chúng tôi đi tìm hiểu những nội dung này trong bài viết hôm nay nha.

Các doanh nghiệp ngày nay đang tìm kiếm những cách thức mới và tốt hơn để duy trì tính cạnh tranh, sinh lời và chuẩn bị cho tương lai, và, theo các chuyên gia trong ngành, phân tích Big Data (Dữ liệu Lớn) mang đến cho các nhà lãnh đạo một cách để khai thác những hiểu biết và ý tưởng mới.

Vậy Big Data thật sự là gì?

Theo Gartner:

Big Data là những tài nguyên thông tin mang trong mình những tính chất như high-volume, high-velocity and high-variety, đòi hỏi các hình thức xử lý thông tin mang tính sáng tạo, hiệu quả về chi phí để tăng cường hiểu biết và ra quyết định.

Theo Wikipedia (định nghĩa gần chính xác nhất):

Big Data là một thuật ngữ rộng cho các tập dữ liệu quá lớn hoặc phức tạp đến mức chúng khó xử lý bằng các ứng dụng xử lý dữ liệu truyền thống. Những thách thức bao gồm analysis (phân tích), capture (nắm bắt), curation (quản lý), search (tìm kiếm), sharing (chia sẻ), storage (lưu trữ), transfer (chuyển giao), visualization (trực quan hóa) và information privacy (bảo mật thông tin).

5 Vs của Big Data là gì?

5Vs. Big data used to manage large data sets described by the characteristics: Volume, Velocity, Variety, Veracity, Value

Để có được những khái niệm đúng nhất, những nhà nghiên cứu đã dùng 5Vs để miêu tả về những gì Big Data có thể làm được và hoạt động mạnh như thế nào. 5Vs đấy bao gồm:

Volume (Tổng dung lượng lưu trữ)

Nói về số lượng dữ liệu được tạo và lưu trữ.  Kích thước của dữ liệu sẽ được đánh giá là có giá trị và có tiềm năng hay không, và để xem xét liệu nó có thể được coi là dữ liệu lớn hay không.

Với số lượng lớn thông tin hàng ngày liên tục được update trên Internet, vd như: Facebook nhận được gần 350 triệu hình ảnh, hơn 4.5 tỷ lượt like, và gần 10 tỷ tin nhắn, comment mỗi ngày. Vì lý do đó, những kiểu lưu trữ và phân tích dữ liệu truyền thống không cách nào có thể làm được. Nhưng với công nghệ chúng ta đang nói tới đây, nó có thể dễ dàng xử lý và lưu trữ tất cả những thông tin trên các hệ thống chi nhánh nhỏ tách biệt.

Variety (Đa dạng kiểu dữ liệu)

Khái niệm này nói về type of data (kiểu dữ liệu) và nature of data (tính chất của dữ liệu). Điều này giúp những người phân tích nó sử dụng hiệu quả thông tin chi tiết về kết quả. Chúng được tập hợp từ những text (văn bản), image (hình ảnh), sound (âm thanh), video; cộng với nó hoàn thành phần còn thiếu thông qua những thuật toán tổng hợp dữ liệu.

Velocity (Khả năng xử lý tốc độ cao)

Trong thời đại ngày nay, tốc độ dữ liệu được tạo ra và xử lý để đáp ứng nhu cầu và thách thức nằm trong con đường tăng trưởng và phát triển. Dữ liệu lớn thường có sẵn trong thời gian thực.

Tốc độ của một data (dữ liệu) được tạo ra và rồi được chuyển từ nơi này sang nơi khác hiện tại đã đạt đến mức kinh ngạc. Như việc mọi người có thể chat với nhau trên facebook với tốc độ nhanh chóng trong môi trường mạng hiện nay. Big Data cho phép chúng ta có thể phân tích các thông số của một dữ liệu được tạo ra mà không cần phải lưu chúng xuống database.

Variability (Độ chính xác)

Vì đa dạng về các kiểu dữ liệu, nên sự không thống nhất của tập dữ liệu có thể cản trở các quy trình để xử lý và quản lý nó. Do đó, độ chính xác của công nghệ này có thể đảm bảo giúp cho việc giảm bớt sự sai lệch đáng tiếc có thể xảy ra.

Value (Mức độ giá trị của thông tin)

Chất lượng dữ liệu của những dữ liệu lấy được có thể thay đổi rất nhiều, điều này sẽ ảnh hưởng rất mạnh đến việc phân tích chính xác những đấy. Ta có thể xem đây là tính chất cũng là khái niệm mà những doanh nghiệp hay nhà nghiên cứu muốn sử dụng và khai thác Big Data phải nắm giữ và am hiểu nó đầu tiên.

Tham khảo: dthshare.com

Các bài viết khác có thể bạn quan tâm:

Mã hóa dữ liệu là gì? Những điều cần biết về mã hóa dữ liệu

ERP là gì? Làm thế nào để Triển khai một dự án ERP gọi là thành công?

Microsoft lại thừa nhận làm ăn cẩu thả khiến máy tính người dùng treo cứng sau khi cập nhật


Leave a Comment