Kmin Academy

Khoá học

DB - Nhập môn phân tích dữ liệu

21/01/2023
6 tuần | 18 buổi

3,500,000 VND

5,000,000 VND

70 Bà Huyện Thanh Quan, Quận 3, TP.HCM

Về khoá học

Khóa học khởi đầu dành cho các bạn muốn dấn thân vào ngành Phân tích dữ liệu (Data Analysis). Những tư duy và kỹ năng nền tảng được hướng dẫn trong khóa học này sẽ giúp bạn vững chãi trên con đường chinh phục ước mơ trở thành một Data Analyst hay Data Scientist.

🎯 Chuẩn đầu ra

🔖 Kiến thức:

  1. Toán thống kê cơ bản cho Phân tích dữ liệu
  2. Phân tích dữ liệu với Excel
  3. Phân tích và trực quan hóa dữ liệu với Tableau (chủ đạo), mở rộng sang PowerBI và Google Data Studio

💻 Kỹ năng:

  1. Vận dụng toán học để hiểu về dữ liệu
  2. Sử dụng Excel để phân tích và báo cáo
  3. Sử dụng Tableau để phân tích và báo cáo

🧠 Tư duy:

  1. Phát triển tư duy phân tích dữ liệu, tự đặt câu hỏi và trả lời câu hỏi dựa trên dữ liệu.
  2. Học viên có phong cách làm việc tận tâm, chỉn chu, chuyên nghiệp.

👨🏼‍🎓 Thành quả của học viên

  1. Học viên hoàn thành dự án cá nhân: Phân tích và báo cáo một bộ dữ liệu bất kỳ
  2. Học viên trả lời tốt các câu hỏi về phân tích dữ liệu cơ bản trong cuộc phỏng vấn dành cho Thực tập sinh.

Từ khoá

tư duy phân tích
kỹ năng phân tích
toán thống kê ứng dụng
excel
tableau
google data studio
power bi

Chương trình học có gì?

Giới thiệu về Phân tích dữ liệu và Quy trình phân tích

Về khoá học

  • Ví dụ mở đầu
  • Tư duy phân tích
  • Các mức độ phân tích:
    • Mô tả - Descriptive (Insight)
    • Chẩn đoán - Diagnostic (Reason)
    • Dự đoán - Predictive (Prediction)
    • Khuyến nghị - Prescriptive (Recommendation)
    • Chiến lược - Cognitive (Strategy)
  • Những ứng dụng thực tế
  • Quy trình phân tích: Yêu cầu phân tích ⇒ Hiểu dữ liệu ⇒ Thu thập dữ liệu ⇒ Khám phá dữ liệu ⇒ Tiền xử lý dữ liệu ⇒ Trực quan hóa dữ liệu ⇒ Phân

  • Thu thập dữ liệu:
  • Các nguồn và các dạng lưu trữ dữ liệu
  • Dữ liệu có cấu trúc
  • Dữ liệu phi cấu trúc
  • Tiền xử lý dữ liệu:
  • Làm sạch dữ liệu:

    Dữ liệu bị trùng lặp Lọc dữ liệu/Sắp xếp dữ liệu Scaling Normalization

  • Biến đổi dữ liệu

    Xử lý dữ liệu dạng văn bản Encoding

  • Trực quan hoá dữ liệu
  • Phân tích dữ liệu

  • Yêu cầu phân tích: Xác định mục tiêu và yêu cầu của phân tích.
  • Hiểu dữ liệu:
    • Dữ liệu đã có sẵn chưa? ⇒ Nếu có: Xác định cơ sở dữ liệu, bảng và trường dữ liệu đang chứa dữ liệu mình cần. ⇒ Nếu chưa: Xác định nguồn lấy và cách lấy.
  • Thu thập dữ liệu:
    • Nếu lưu trong cơ sở dữ liệu: sử dụng câu truy vấn.
    • Nếu trong cơ sở dữ liệu chưa có: Xác định các nguồn và các dạng lưu trữ dữ liệu. ⇒ Dữ liệu có cấu trúc ⇒ Dữ liệu bán cấu trúc ⇒ Dữ liệu phi cấu trúc
  • Khám phá dữ liệu:
    • Variable Identification
    • Univariate Analysis (continuous variables and categorical variables)
    • Missing value
    • Dữ liệu bị trùng lặp
    • Dữ liệu ngoại lai
  • Tiền xử lý dữ liệu:
    • Làm sạch dữ liệu: ⇒ Dữ liệu bị trùng lặp ⇒ Dữ liệu bị khuyết ⇒ Dữ liệu ngoại lai ⇒ Lọc dữ liệu/Sắp xếp dữ liệu ⇒ Scaling ⇒ Normalization
  • Biến đổi dữ liệu ⇒ Xử lý dữ liệu dạng văn bản ⇒ Xử lý dữ liệu thời gian ⇒ Encoding
  • Trực quan hoá dữ liệu
  • Phân tích dữ liệu

  • Tần suất: tuyệt đối và tương đối, histogram
  • Xu hướng tập trung: trung bình, mốt, trung vị, phân vị
  • Độ phân tán:
    • Cực tiểu, cực đại và khoảng dữ liệu
    • Tứ phân vị và khoảng tứ phân vị
    • Độ lệch chuẩn
    • Phương sai
  • Hình dạng dữ liệu:
    • Tính đối xứng
    • Tính nghiêng
    • Tính dẹt
  • Sự kết hợp của hai biến:
    • Bảng liên hợp
    • Thống kê \chi^2χ 2  Pearson
    • Thống kê VV Cramer
    • Tương quan
  • Ước lượng khoảng tin cậy
  • Kiểm định giả thuyết:
    • Xây dựng giả thuyết
    • Một mẫu và hai mẫu
    • Một phía và hai phía
    • p-value
  • Kiểm định tham số (phân tích phương sai)
    • Kiểm định cho trung bình khi biết phương sai
    • Kiểm định cho trung bình khi chưa biết phương sai

  • EDA - Khám phá dữ liệu trong quy trình Phân tích dữ liệu:
    • Dùng Excel highlight dòng bị trùng.
    • Dùng Excel lọc tìm missing value
    • Các hàm tính đặc trưng thống kê: MIN, MAX, MEAN, MEDIAN, MODE, QUARTILE,… để xác định outlier. (Có thể cho dữ liệu cơ bản để dạy thêm một số phương pháp khác xác định outlier như dùng box plot hoặc dùng Grubbs's test, Dixon's test hoặc Rosner's test).
  • Tiền xử lý dữ liệu:
    • Xử lý dòng bị trùng
    • Xử lý missing value
    • Xử lý outlier
  • Một số phân tích đơn giản:
    • VLOOKUP, HLOOKUP, COUNTIF, SUMIF
    • Pivot table
    • Solver và phân tích what-if Bài tập: Cho 1 bộ dữ liệu data chưa được xử lý và một số yêu cầu tính toán và phân tích đơn giản.

  • Analysis Toolpak:
    • Lấy mẫu
    • Thống kê mô tả
    • ANOVA
    • Kiểm định thống kê
    • Hồi quy
  • Vẽ biểu đồ
  • Tạo báo cáo

Vận dụng được Excel cơ bản và nâng cao và kiến thức đã được học để xử lý dữ liệu và phân tích

  • Hướng dẫn bài tập, giải đáp thắc mắc
  • Góp ý bài làm của học viên
  • Chia sẻ kinh nghiệm thực tế khi đi làm

  • Giới thiệu về trực quan hóa dữ liệu và công cụ trực quan hóa dữ liệu (ưu nhược điểm).
    • Tableau
    • Power BI
    • Google Data Studio
    • Ngoài ra có thể sử dụng Python hoặc R. (Nêu một số thư viện để visualize).
  • Xử lý dữ liệu
    • Data Join;
    • Unions;
    • Measures và Dimensions;
    • Hierarchies;
    • Filter;
    • Sorting;
    • Group
  • Các loại biểu đồ:
    • Biểu đồ phân tán
    • Biểu đồ cột → cột cạnh nhau/cột chồng nhau
    • Biểu đồ nến
    • Biểu đồ đường → nhiều đường
    • Biểu đồ miền → nhiều miền
    • Biểu đồ quạt/biểu đồ donut → phân cấp
    • Kết hợp với bản đồ địa lý

  • Tiền xử lý dữ liệu với Tableau Prep
  • Tổng quan về xử lý dữ liệu với Tableau Prep;
  • Các bước xử lý dữ liệu trong Tableau Prep;
  • Các ưu điểm của Tableau Prep.

  • Giới thiệu
  • Tính toán cơ bản:
    • Trên một dòng
    • Tổng hợp (aggregation)
  • Tính toán theo mức chi tiết (LOD):
    • INCLUDE
    • EXCLUDE
    • FIXED
  • Tính toán trên bảng Bài tập: Cho bộ data và một số yêu cầu tính toán và vẽ chart để học viên thực hành

  • Các mức độ áp dụng bộ lọc:
    • Bộ lọc trích xuất (extract)
    • Bộ lọc nguồn dữ liệu
    • Bộ lọc ngữ cảnh
    • Bộ lọc chiều dữ liệu
    • Bộ lọc độ đo
    • Bộ lọc tính toán trên bảng
  • Tham số:
    • Các loại tham số
    • Sử dụng tham số với nguồn dữ liệu

  • Relationships:
    • Định nghĩa
    • So sánh với Join
  • Data Blending:
    • Định nghĩa
    • Lưu ý

Vận dụng được Tableau để giải quyết yêu cầu thực tế.

  • Hướng dẫn bài tập, giải đáp thắc mắc
  • Góp ý bài làm của học viên
  • Giải đáp thắc mắc của học viên kiến thức của toàn khóa học

Phân tích và trực quan hóa một tập dữ liệu về:

  • Y tế
  • Tài chính (giá vàng, tiền mã hóa)
  • Dân số

  • Học viên hoàn tất bài kiểm tra cuối khóa
  • Học viên báo cáo đồ án cuối khóa

Sản phẩm của học viên tại Kmin
Giao diện trang web thời trang: Male Fashion

Giao diện trang web thời trang: Male Fashion cho phép người dùng tìm kiếm, lọc, chấm điểm sản phẩm. Không dừng lại ở đó, khách hàng còn có thể thêm, chỉnh sửa giỏ hàng và tiến hành mua sản phẩm.

Xem thêm

Vì sao bạn nên học tại Kmin?

Lớp học hạnh phúc

Phương pháp PIB

Giảng viên chất

Hỗ trợ học viên

Và còn nữa...

🗻 Lộ trình học bài bản, thực tế

Đề cương được thiết kế tinh gọn và thực tế, dựa trên sự nghiên cứu và qua quá trình làm việc để hiểu nhu cầu tuyển dụng của doanh nghiệp. Những gì học được là những điều doanh nghiệp cần.

📲 Làm dự án giả lập

Học viên được rèn luyện kỹ năng làm việc (kỹ năng mềm và kỹ năng chuyên môn) theo quy trình làm việc chuyên nghiệp thông qua các thử thách lập trình và dự án khóa học.

👫 Lớp học như một gia đình

Lớp học chỉ tối đa 10 học viên cùng với giảng viên và các trợ giảng để đảm bảo chất lượng dạy và học. Mọi người xem nhau như một gia đình, cùng giúp đỡ nhau về đích.

Học viên nói gì về Kmin?

Trải qua các khoá học tại Kmin từ cơ bản đến nâng cao, mình tự tin hơn trong việc code cũng như có thêm nhiều động lực để học tập. Cám ơn Kmin và các thầy cô đã hỗ trợ mình rất nhiều

Xuân Yến

ĐH Bách Khoa TP.HCM

Cám ơn thầy Bảo và Kmin, vì đã giúp mình có nhiều động lực để học lập trình hơn. Sẽ ghé lại Kmin tham gia các khoá học nhiều hơn nữa trong tương lai.

Trịnh Trung Trựt

CĐ KT Cao Thắng

Học viên Kmin đang làm việc tại các doanh nghiệp

Đội ngũ giảng viên nhiệt huyết

Vũ Đình Bảo

✓ Nhà sáng lập và điều hành Kmin Academy ✓ Thạc sĩ Khoa học Máy tính ✓ Sinh viên học vượt tốt nghiệp loại giỏi trường Đại học Khoa học Tự nhiên - ĐHQG HCM ✓ Từng là Project Manager tại UNIGWORK, Kmin Technology ✓ Lĩnh vực nghiên cứu và làm việc: Data Science, Front-end, Back-end, Education

Các lớp sắp khai giảng

SB - Lập trình Scratch cơ bản dành cho thiếu nhi

Khám phá tiềm năng của trẻ với ngôn ngữ lập trình Scratch. Giúp trẻ làm quen với tư duy và kỹ năng lập trình, phát huy khả năng sáng tạo. Trẻ sẽ có những cảm nhận và nền tảng đầu tiên về lập trình, từ đó có thể phát triển tài năng công nghệ sớm.

Các câu hỏi thường gặp

Kmin hỗ trợ tài chính bằng hình thức trả học phí theo đợt, trả góp học phí bằng thẻ tín dụng. Học bổng khoá học/lộ trình cho các trường hợp đặc biệt (hoàn cảnh khó khăn, hoặc thành tích học tập xuất sắc. Hãy gửi thư đề đạt nguyện vọng cho Kmin qua email: academy@kmin.edu.vn nhé)

Hiện tại Kmin có 3 hình thức học: offline tại cở sở quận 3, học online tại nhà qua zoom với GV, học qua bộ video.

Kmin hỗ trợ việc làm cho các học viên theo các lộ trình tại Kmin bao gồm: Front-end, Back-end, Fullstack.

Lịch học của Kmin thường diễn ra vào buổi tối các ngày trong tuần và ban ngày thứ 7, chủ nhật. Thời lượng của mỗi buổi học tuỳ hình thức học sẽ kéo dài từ 2-2.5h

Các khoá học tại Kmin đều được đạt chứng nhận và hồ sơ năng lực khi đạt các tiêu chí của khoá học.