Dữ liệu phân loại và dữ liệu định lượng
Dữ liệu có thể được phân loại thêm thành dữ liệu phân loại (categorical data) hoặc dữ liệu định lượng (quantitative data).
-
Dữ liệu phân loại bao gồm các nhãn hoặc tên dùng để xác định một thuộc tính của từng phần tử.
Chúng sử dụng thang đo định danh (nominal) hoặc thang đo thứ bậc (ordinal) và có thể không phải là số hoặc được mã hóa bằng số (ví dụ: 1 = Nam, 2 = Nữ). -
Dữ liệu định lượng là dữ liệu yêu cầu giá trị số biểu thị số lượng hoặc mức độ, và được thu thập bằng thang đo khoảng (interval) hoặc thang đo tỷ lệ (ratio).
Biến phân loại và biến định lượng
-
Biến phân loại (categorical variable) là biến mà giá trị của nó là dữ liệu phân loại.
-
Biến định lượng (quantitative variable) là biến có giá trị định lượng.
Việc lựa chọn phương pháp phân tích thống kê phù hợp phụ thuộc vào loại biến: biến phân loại hay biến định lượng.
Khi là biến phân loại
-
Phân tích thống kê thường hạn chế hơn.
-
Ta có thể đếm số lượng quan sát trong mỗi nhóm hoặc tính tỷ lệ phần trăm.
-
Ngay cả khi dữ liệu được mã hóa bằng số (ví dụ: 1, 2, 3), các phép toán như cộng, trừ, nhân, chia không mang ý nghĩa.
🔸 Ví dụ: Nếu bạn khảo sát ngành học của 100 sinh viên (Kinh tế, Kế toán, Marketing), thì việc cộng "Kế toán + Marketing" hoàn toàn không có ý nghĩa gì cả.
Khi là biến định lượng
-
Các phép toán số học có ý nghĩa thực tiễn.
-
Bạn có thể cộng các giá trị và chia trung bình để ra giá trị trung bình, hoặc đo độ lệch chuẩn, phương sai, v.v.
🔸 Ví dụ: Bạn có dữ liệu về thu nhập hàng tháng của 1.000 người lao động → bạn có thể:
-
Tính thu nhập trung bình
-
Tính thu nhập tối đa, tối thiểu
-
Vẽ biểu đồ phân phối
-
Phân tích xu hướng theo ngành hoặc khu vực
Thực tế trong kinh doanh:
Loại dữ liệu | Ví dụ kinh doanh | Loại biến | Phân tích được áp dụng |
---|---|---|---|
Tên sản phẩm | Vinamilk, CocaCola | Phân loại | Đếm số sản phẩm, phân tích tỷ lệ |
Ngành hàng | Sữa, Bia, Đồ gia dụng | Phân loại (Ordinal) | Xếp hạng doanh số theo ngành |
Doanh thu tháng | 12 tỷ, 15 tỷ, 10 tỷ | Định lượng | Trung bình, độ lệch chuẩn, biểu đồ |
Mức độ hài lòng (1-5) | 1 = rất không hài lòng → 5 = rất hài lòng | Thứ bậc (Ordinal) | Tính trung bình, phân tích xu hướng |