Lộ trình tự học
1 Buổi #01
Giới thiệu và chuẩn bị
– Hướng dẫ sử dụng tài nguyên khóa học: Videos, Dataset, Books,
Projects demo.
– Trí tuệ kinh doanh (Business Intelligence – BI): Bức tranh toàn
cảnh về việc sử dụng dữ liệu trong doanh nghiệp.
– Các loại phân tích dữ liệu (Descriptive, Diagnostic, Predictive,
Prescriptive).
– Qui trình phân tích dữ liệu.
– Cài đặt và làm quen với công cụ thực hành.
– Hướng dẫn thực hiện Capstone Project về Data Analysis với dữ
liệu thực tế.
2 Buổi #02
Data Visualization and Data Storytelling: Lập báo cáo quản trị
bằng dữ liệu
– Trực quan hóa dữ liệu (Data Visualization)
– Lựa chọn các loại biểu đồ phù hợp.
– Làm việc với các loại đồ thị nâng cao (Map, Heatmap, Treemap,
Pareto, Waterfall, Wordcloud…).
– Phân tích dữ liệu đa chiều, phân cấp.
– Tính toán, sử dụng các hàm xử lý dữ liệu, tham số, bộ lọc dữ liệu.
3 Buổi #03
Data Visualization and Data Storytelling (tiếp theo)
– Giới thiệu về Dashboard: Các thành phần chính của Dashboard, các
loại Dashboard, Qui trình xây dựng Dashboard.
– Giới thiệu về Data Storytelling.
– Xây dựng Dashboard và Data Storytelling.
– Xuất bản và chia sẻ Dashboard.
4 Buổi #04
Xây dựng Dashboard với dữ liệu thực tế (Dashboard CRM &
Marketing)
– Data insights và cách phát hiện Data insights
– Hiểu về dữ liệu phân tích (dataset).
– Phân tích yêu cầu xây dựng Dashboard.
– Thiết kế câu hỏi và lựa chọn đồ thị phù hợp.
– Thiết kế Dashboard.
– Xuất bản và chia sẻ Dashboard.
5 Buổi #05
Nền tảng thống kê cho phân tích dữ liệu
– Phân tích dữ liệu bằng thống kê mô tả (Descriptive Statistics)
– Sử dụng thống kê mô tả để đánh giá một bộ dữ liệu (dataset): Đo
lường sự tập trung, đo lường sự phân tán, đánh giá hình dáng phân
bố, phân tích mối quan hệ giữa các biến.
– Thống kê suy diễn và ứng dụng: Kiểm định giả thuyết.
6 Buổi #06
Tiền xử lý dữ liệu
– Vai trò và nhiệm vụ của tiền xử lý dữ liệu
– Tích hợp dữ liệu (Data integration): ETL, Join, Union
– Làm sạch dữ liệu (Data Cleaning): Missing value treatment, Outlier
detection, Dealing with duplicate data
– Chuyển đổi dữ liệu (Data Transformation): Feature Scaling,
Categorical Data Enconding, Dealing with imbalanced data, Feature
selection
– Thực hành tiền xử lý dữ liệu cho Capstone Project DA
7 Buổi #07
Các kỹ thuật phân tích dữ liệu phổ biến
– Phân cụm khách hàng bằng RFM (Recency, Frequency and
Monetary)
– Phân tích dãy số thời gian và dự báo (Time series analysis and
forecasting)
– Phân tích hồi qui và tương quan (Regression and Correlation
Analysis)
8 Buổi #08
Hướng nghiệp và thảo luận về khoa học dữ liệu (DS – Data Science)
– Giới thiệu các kỹ thuật phân tích dữ liệu nâng cao: Phân cụm dữ liệu
(Clustering), Phân lớp dữ liệu (Classification), luật kết hợp
(Association rule), Cohort Analysis,
A/B testing, Conjont Analysis.
– Làm sao để lựa chọn phương pháp phân tích dữ liệu phù hợp với
mục đích phân tích.
– Các vị trí việc làm DS: Yêu cầu, thu nhập, lộ trình nghề nghiệp
(Career path)
– Thảo luận Capstone project về DA của khóa học