Thống Kê (Statistics) được xem là “nỗi ám ảnh” của nhiều sinh viên thuộc các khối Kinh tế bởi lượng kiến thức lớn và nhiều kỹ thuật phức tạp. Có phải bạn đã không ít lần mong muốn mình nắm vững kiến thức về Thống kê không? Nếu muốn nâng trình phân tích dữ liệu thì bạn không thể bỏ qua kiến thức Thống kê đâu nhé. Hãy tham khảo bài viết này để có thể tự học Thống kê (Statistics) và ứng dụng vào Phân tích Dữ liệu hiệu quả.

Kiến thức Thống kê quan trọng thường áp dụng trong phân tích dữ liệu

Kiến thức của Thống kê khá nhiều, vì vậy bạn nên chọn ra những kiến thức quan trọng nhất để nghiên cứu thật kỹ, đảm bảo nắm vững để áp dụng vào phân tích dữ liệu hiệu quả. Xem sơ đồ sau đây để bạn có thể hệ thống kiến thức Thống kê cốt lõi nhất như sau. Trước tiên, bạn hãy chia 2 category kiến thức lớn để dễ nằm bắt như sau:

Kiến thức Thống kê quan trọng áp dụng trong phân tích dữ liệu

Kiến thức Thống kê quan trọng áp dụng trong phân tích dữ liệu

Descriptive statistics (thống kê mô tả)

Thống kê mô tả gồm các chỉ số đo lường xu hướng tập trung (center) và đo lường sự biến động (variability). Cụ thể:

  • Center: Mean, Median, Mode
  • Variability: Variance, Standard deviation, Coefficient

Bạn cần sử dụng các loại biểu đồ thể hiện sự phân bổ của dữ liệu như Histogram, Boxplot và kết hợp kiến thức về Quantile và Percentile để làm tốt thống kê mô tả.

Minh họa biểu đồ Boxplot

Minh họa biểu đồ Boxplot

 

Minh họa biểu đồ Histogram

Minh họa biểu đồ Histogram

Inferential statistics (thống kê suy luận)

Trên thực tế, dữ liệu của doanh nghiệp rất lớn và có rất ít hệ thống hoặc công cụ nào có thể đảm bảo hiệu quả khi xử lý toàn bộ tập data đó. Vì vậy, khi làm phân tích dữ liệu, chúng ta sẽ thường chọn ra một mẫu (sample). Khi chọn 1 sample để phân tích và chúng ta mong muốn kết quả phân tích mang tính tổng thể thì cần đến thống kê suy luận. Đây là phương pháp cao cấp hơn so với thống kê mô tả. Vì vậy, bạn nên nắm chắc phần thống kê mô tả trước khi chuyển qua thống kê suy luận nhé.

Nguồn học Thống kê chất lượng

  1. Sách siêu hay về Thống kê và các kiến thức liên quan đến phân tích dữ liệu. Tải ngay eBook “Practical Statistics for Data Scientist”
  2. Kênh Youtube chia sẻ về Thống kê chất lượng, xem ngay kênh StatQuest with Josh Starmer
  3. Tham khảo các khóa học trên Udemy…
  4. Tham khảo các tài liệu tự học Thống kê mà mình tổng hợp ở đây:
    1. Các quy luật phân phối xác suất và thống kê
    2. Tóm tắt công thức xác suất thống kê

Hy vọng, qua bài viết này, bạn đã có thêm kiến thức về Thống kê, nguồn tự học Thống kê hiệu quả cũng như áp dụng thành công trong các dự án phân tích dữ liệu của mình nhé.

Nguồn: Tổng hợp

Theo dõi www.tailieuxin.com để xem thêm nhiều kiến thức và tài liệu hay được cập nhật mỗi ngày!