# Nguần dữ liệu(DATA SOURCES)
**Nguồn dữ liệu có thể đến từ các nguồn sẵn có hoặc được thu thập mới thông qua khảo sát và nghiên cứu thực nghiệm.**
#### **Nguồn dữ liệu sẵn có**
Trong một số trường hợp, dữ liệu cần thiết cho một ứng dụng cụ thể **đã tồn tại**. Các công ty tại Việt Nam hiện nay thường lưu trữ nhiều cơ sở dữ liệu khác nhau về **nhân viên, khách hàng và hoạt động kinh doanh**. Dữ liệu về **mức lương, độ tuổi và số năm kinh nghiệm của nhân viên** thường có thể lấy từ hồ sơ nhân sự nội bộ. Các hồ sơ nội bộ khác có thể chứa thông tin về:
- Doanh số bán hàng
- Chi phí quảng cáo
- Chi phí phân phối
- Mức tồn kho
- Sản lượng sản xuất
Ngoài ra, **nhiều doanh nghiệp cũng quản lý dữ liệu rất chi tiết về khách hàng** như hành vi mua hàng, tần suất giao dịch, khu vực sinh sống v.v...
**Nhóm dữ liệu** | **Ví dụ dữ liệu có thể thu thập** |
---|
Nhân sự | Mức lương, chức vụ, số năm làm việc |
Khách hàng | Tên, độ tuổi, khu vực, lịch sử mua hàng |
Bán hàng | Doanh số theo quý, sản phẩm bán chạy |
Quảng cáo | Chi phí chạy quảng cáo trên Facebook, Google |
Chuỗi cung ứng | Chi phí vận chuyển, số lượng tồn kho, nhà cung cấp |
Sản xuất | Sản lượng, tỉ lệ lỗi sản phẩm, thời gian hoàn thành |
Bảng 1.3: Một số dữ liệu thường có trong hệ thống nội bộ của công ty (Việt Nam)
#### **Các nguồn dữ liệu bên ngoài tại Việt Nam**
Nhiều tổ chức trong và ngoài nước chuyên thu thập và cung cấp dữ liệu về **kinh tế, thị trường và doanh nghiệp** tại Việt Nam. Một số nguồn thông tin phổ biến:
- **Tổng cục Thống kê Việt Nam (GSO)**: Dữ liệu dân số, thu nhập, lao động, xuất nhập khẩu.
- **Cục Quản lý đăng ký kinh doanh (Bộ KH&ĐT)**: Thông tin về số lượng doanh nghiệp thành lập, giải thể.
- **Cục Thuế, Tổng cục Hải quan**: Dữ liệu về thuế, kim ngạch xuất nhập khẩu.
- **VNDirect, SSI Research**: Cung cấp báo cáo ngành và thông tin chứng khoán.
- **DataViet, InfoTV, Vietdata**: Các công ty chuyên cung cấp dữ liệu thương mại, thị trường tiêu dùng.
Doanh nghiệp có thể tiếp cận các nguồn này **thông qua thuê bao, mua dữ liệu hoặc qua nền tảng mở** của cơ quan nhà nước.
#### **Internet – nguồn dữ liệu ngày càng quan trọng**
Ngày nay, **Internet** trở thành một **kho dữ liệu khổng lồ**. Hầu hết các công ty tại Việt Nam đều có website cung cấp:
- Thông tin công ty
- Sản phẩm/dịch vụ
- Giá bán, chương trình khuyến mãi
- Tuyển dụng, quy mô nhân sự
- Tin tức nội bộ, báo cáo tài chính
Ngoài ra, nhiều nền tảng chuyên biệt như:
- **CafeF, Vietstock, Investing.vn**: Cập nhật liên tục thông tin về thị trường tài chính.
- **Google Trends, Facebook Audience Insights**: Dữ liệu xu hướng người dùng.
- **Foody, Shopee, Tiki**: Thống kê đánh giá sản phẩm, giá cả và thói quen mua sắm.
#### **Cơ quan nhà nước – nguồn dữ liệu đáng tin cậy**
Các cơ quan nhà nước cũng là nguồn cung cấp dữ liệu rất giá trị. Ví dụ:
Cơ quan | Dữ liệu cung cấp |
---|
Tổng cục Thống kê (GSO) | Dân số, GDP, tỉ lệ thất nghiệp, chỉ số giá tiêu dùng |
Bộ Giáo dục & Đào tạo | Số lượng sinh viên, điểm thi trung bình, phân tích ngành học |
Ngân hàng Nhà nước | Lãi suất, tỷ giá, báo cáo tiền tệ, tín dụng |
Tổng cục Hải quan | Kim ngạch xuất – nhập khẩu, đối tác thương mại chủ yếu |
Bộ Y tế | Số ca bệnh, cơ sở khám chữa bệnh, phân bổ nhân lực y tế |
Hầu hết dữ liệu đều có thể **tải về miễn phí tại các cổng thông tin điện tử** như:
[https://www.gso.gov.vn](https://www.gso.gov.vn)
[https://data.gov.vn](https://data.gov.vn)
**Tác giả: Đỗ Ngọc Tú**
**Công Ty Phần Mềm [VHTSoft](https://vhtsoft.com/ "Công Ty Phần Mềm VHTSoft")**