Nhảy đến nội dung chính

Nguần dữ liệu(DATA SOURCES)

Nguồn dữ liệu có thể đến từ các nguồn sẵn có hoặc được thu thập mới thông qua khảo sát và nghiên cứu thực nghiệm.

Nguồn dữ liệu sẵn có

Trong một số trường hợp, dữ liệu cần thiết cho một ứng dụng cụ thể đã tồn tại. Các công ty tại Việt Nam hiện nay thường lưu trữ nhiều cơ sở dữ liệu khác nhau về nhân viên, khách hàng và hoạt động kinh doanh. Dữ liệu về mức lương, độ tuổi và số năm kinh nghiệm của nhân viên thường có thể lấy từ hồ sơ nhân sự nội bộ. Các hồ sơ nội bộ khác có thể chứa thông tin về:

  • Doanh số bán hàng

  • Chi phí quảng cáo

  • Chi phí phân phối

  • Mức tồn kho

  • Sản lượng sản xuất

Ngoài ra, nhiều doanh nghiệp cũng quản lý dữ liệu rất chi tiết về khách hàng như hành vi mua hàng, tần suất giao dịch, khu vực sinh sống v.v...

Nhóm dữ liệu Ví dụ dữ liệu có thể thu thập
Nhân sự Mức lương, chức vụ, số năm làm việc
Khách hàng Tên, độ tuổi, khu vực, lịch sử mua hàng
Bán hàng Doanh số theo quý, sản phẩm bán chạy
Quảng cáo Chi phí chạy quảng cáo trên Facebook, Google
Chuỗi cung ứng Chi phí vận chuyển, số lượng tồn kho, nhà cung cấp
Sản xuất Sản lượng, tỉ lệ lỗi sản phẩm, thời gian hoàn thành

Bảng 1.3: Một số dữ liệu thường có trong hệ thống nội bộ của công ty (Việt Nam)

Các nguồn dữ liệu bên ngoài tại Việt Nam

Nhiều tổ chức trong và ngoài nước chuyên thu thập và cung cấp dữ liệu về kinh tế, thị trường và doanh nghiệp tại Việt Nam. Một số nguồn thông tin phổ biến:

  • Tổng cục Thống kê Việt Nam (GSO): Dữ liệu dân số, thu nhập, lao động, xuất nhập khẩu.

  • Cục Quản lý đăng ký kinh doanh (Bộ KH&ĐT): Thông tin về số lượng doanh nghiệp thành lập, giải thể.

  • Cục Thuế, Tổng cục Hải quan: Dữ liệu về thuế, kim ngạch xuất nhập khẩu.

  • VNDirect, SSI Research: Cung cấp báo cáo ngành và thông tin chứng khoán.

  • DataViet, InfoTV, Vietdata: Các công ty chuyên cung cấp dữ liệu thương mại, thị trường tiêu dùng.

Doanh nghiệp có thể tiếp cận các nguồn này thông qua thuê bao, mua dữ liệu hoặc qua nền tảng mở của cơ quan nhà nước.

Internet – nguồn dữ liệu ngày càng quan trọng

Ngày nay, Internet trở thành một kho dữ liệu khổng lồ. Hầu hết các công ty tại Việt Nam đều có website cung cấp:

  • Thông tin công ty

  • Sản phẩm/dịch vụ

  • Giá bán, chương trình khuyến mãi

  • Tuyển dụng, quy mô nhân sự

  • Tin tức nội bộ, báo cáo tài chính

Ngoài ra, nhiều nền tảng chuyên biệt như:

  • CafeF, Vietstock, Investing.vn: Cập nhật liên tục thông tin về thị trường tài chính.

  • Google Trends, Facebook Audience Insights: Dữ liệu xu hướng người dùng.

  • Foody, Shopee, Tiki: Thống kê đánh giá sản phẩm, giá cả và thói quen mua sắm.

Cơ quan nhà nước – nguồn dữ liệu đáng tin cậy

Các cơ quan nhà nước cũng là nguồn cung cấp dữ liệu rất giá trị. Ví dụ:

Cơ quan Dữ liệu cung cấp
Tổng cục Thống kê (GSO) Dân số, GDP, tỉ lệ thất nghiệp, chỉ số giá tiêu dùng
Bộ Giáo dục & Đào tạo Số lượng sinh viên, điểm thi trung bình, phân tích ngành học
Ngân hàng Nhà nước Lãi suất, tỷ giá, báo cáo tiền tệ, tín dụng
Tổng cục Hải quan Kim ngạch xuất – nhập khẩu, đối tác thương mại chủ yếu
Bộ Y tế Số ca bệnh, cơ sở khám chữa bệnh, phân bổ nhân lực y tế

Hầu hết dữ liệu đều có thể tải về miễn phí tại các cổng thông tin điện tử như:

https://www.gso.gov.vn
https://data.gov.vn

Tác giả: Đỗ Ngọc Tú
Công Ty Phần Mềm VHTSoft