Làm sao để có tư duy phân tích dữ liệu tốt?

Liên hệ QC
Status
Không mở trả lời sau này.
Tôi tuân thủ nội quy khi đăng bài

AnMin

Thành viên mới
Tham gia
20/12/22
Bài viết
4
Được thích
1
Nhiều người thường bảo làm DA ko phải chỉ biết dùng tool mà cần có tư duy logic, tư duy phân tích insight.... bla bla. Vậy thì cái tư duy ấy là gì? Với vài năm kn thì mình xin chia sẻ góc nhìn, làm rõ vấn đề này.

Sai lầm có lẽ các bạn DA sẽ hay gặp phải đó là không hiểu yêu cầu của doanh nghiệp hoặc của khách, sai từ bước ban đầu dẫn đến kết quả báo cáo của mình không đưa ra những thông tin có giá trị với họ. Do vậy các bạn khi làm nghề cần hiểu và xác định được yêu cầu và mục tiêu phân tích dữ liệu của doanh nghiệp hoặc của khách hàng. Ko phải tự nhiên mà những bạn background kinh tế có lợi thế hơn trong nghề DA, và các công ty ưu tiên tuyển người có domain trong lĩnh vực của cty.

Vậy ngay ở bước xác định yêu cầu phân tích, làm thế nào để đảm bảo có hướng giải quyết bài toán đúng? Mình xin chia sẻ kinh nghiệm làm mà mình đã học hỏi đc và hay áp dụng trong việc phân tích dữ liệu

Khi mới phân tích tại 1 tổ chức doanh nghiệp, cần nắm được mô hình kinh doanh và vẽ quy trình nghiệp vụ Khi mới vào phân tích dữ liệu ở 1 công ty, sẽ có bạn bị bị bối rối, không hiểu các số liệu của công ty, không biết lấy dữ liệu từ đâu. Do đó, trước hết các bạn cần hiểu được mô hình kinh doanh của công ty và vẽ ra quy trình nghiệp vụ của công ty đó.

Ví dụ như trong trung tâm Tiếng Anh, mô hình hoạt động của họ là kết nối với giáo viên, mở các lớp dạy tiếng Anh (sản phẩm) và tuyển sinh học viên (khách hàng). Hiện đang có 2 lớp IELTS for newbie, giờ sếp muốn mở thêm 3 lớp đấy, muốn bạn phân tích để tính ra được KPI mà marekting và sales cần đạt được để tuyển sinh đủ lớp.

➡️ Vậy thì bạn cần nắm được cả quy trình tuyển sinh (bán hàng) của họ, thì mới biết hướng phân tích từ đâu (lấy chỉ số từ sales tính ra KPI cho marketing hay ngược lại?) và hiểu tất chỉ số mà họ quy ước (ví dụ: L1 là kh mới đăng ký, L2 là đã sale đã gọi, L3 là khách hàng có quan tâm, L4 là khách muốn học, L5 là khách đã chốt hợp đồng), biết liên hệ với bộ phận nào để khai thác thông tin mình cần.

Tư duy phân tích dữ liệu đa chiều

Phân tích đa chiều là gì? Cùng 1 chủ điểm phân tích, chúng ta sẽ xem xét dưới nhiều góc nhìn khác nhau (doanh số chi tiết theo từng sản phẩm là bao nhiêu, theo từng khu vực, từng quý là bao nhiêu,..., hoặc chi tiết hơn nữa vd như chi tiết doanh thu theo doàng sản phẩm A trong quý 2 là bao nhiều). Khi chúng ta có thể trả lời những câu hỏi đấy 1 cách nhanh chóng theo thời gian thực bằng dashboard hoặc các phân tích BI, thì đấy gọi là phân tích đa chiều. Các bước phân tích đầu bài với phương pháp phân tích đa chiều

✔️Bước 1: Xác định Dim - Fact

Trước hết, Fact là các chủ điểm phân tích dữ liệu từ yêu cầu, ví dụ yêu cầu phân tích doanh số và sản lượng bán ra trong năm nay, thì doanh số và sản lượng chính là Fact.

Dimension là các khía cạnh phân tích. Ví dụ phân tích doanh số, chúng ta có thể xem xét theo chiều thời gian (theo quý, theo tháng), theo khu vực (các chi nhánh), theo danh mục loại sản phẩm, theo nhân viên bán hàng,...

✔️Bước 2: Cần liệt kê các giá trị trong Dimension.

Ví dụ theo dimension Thời gian thì ta có các giá trị trong đó là: Tháng 1, Tháng 2, Tháng 3,... (Hoặc quý 1, quý 2,...)

Theo dimension sản phẩm thì ta có giá trị trong đó là: Sản phẩm A, Sản phẩm B, Sản phẩm C,...

Theo dimension khu vực thì trong đó ta có: Hà Nội, Hồ Chí Minh, Đà Nẵng,...
9405904f-1082-46da-b856-94aa2c8b5eee.png


✔️Bước 3: vẽ mô hình dữ liệu cho hệ thống phân tích dữ liệu

Bên tay phải có Fact (chủ điểm phân tích), và bên tay trái là Dim (chiều dữ liệu). Trong mô hình này, chúng ta hệ thống lại các chiều dữ liệu và các cấp nhỏ hơn của mỗi chiều. Cùng với đó là sự liên hệ với các chủ điểm phân tích trong hệ thống dữ liệu.

⚪ Ví dụ khi phân tích dòng sản phẩm A và ở thị trường quốc gia VN, thì chúng ta có thể phân tích về doanh số, lượng tồn kho,...

⚪ Ví dụ phân tích về giá, chúng ta không phân tích theo cửa hàng mà phân tích theo dòng sản phẩm và theo thời gian (năm, quý). Phân tích về sức mua (purchase amount) thì sẽ phân tích theo khu vực, theo dòng sản phẩm và theo thời gian, chứ không phải theo khách hàng
48045ada-fdfe-42fc-b045-5d893a5bfc1e.png


❓ Tại sao cần vẽ Data Model dạng này? Mô hình này giúp dễ dàng xác định các nhu cầu phân tích, nhu cầu làm báo cáo và xây dựng chủ điểm phân tích dễ dàng hơn.

Bên cạnh đó nó giúp hình dung các chiều dữ liệu rõ ràng hơn.

Nếu bạn chỉ cần làm 1 báo cáo nhanh bằng Excel thì việc xây dựng Data Model kiểu này giúp bạn nắm được tổng thể các chiều dữ liệu và sự liên kết trong các dữ liệu. Việc kéo thả vào pivot table, kéo thả các bar chart trong BI trở nên dễ dàng hơn. Giúp quá trình xây dựng dash tổng thể và khoa học hơn rất nhiều

Nếu bạn cần xây dựng dashboard phức tạp trên Power BI, thì mô hình này giống như 1 bản mô phỏng, giúp bạn xây dựng Data Model đầy đủ và chuẩn xác hơn
 
Nhiều người thường bảo làm DA ko phải chỉ biết dùng tool mà cần có tư duy logic, tư duy phân tích insight.... bla bla. Vậy thì cái tư duy ấy là gì? Với vài năm kn thì mình xin chia sẻ góc nhìn, làm rõ vấn đề này.

Sai lầm có lẽ các bạn DA sẽ hay gặp phải đó là không hiểu yêu cầu của doanh nghiệp hoặc của khách, sai từ bước ban đầu dẫn đến kết quả báo cáo của mình không đưa ra những thông tin có giá trị với họ. Do vậy các bạn khi làm nghề cần hiểu và xác định được yêu cầu và mục tiêu phân tích dữ liệu của doanh nghiệp hoặc của khách hàng. Ko phải tự nhiên mà những bạn background kinh tế có lợi thế hơn trong nghề DA, và các công ty ưu tiên tuyển người có domain trong lĩnh vực của cty.

Vậy ngay ở bước xác định yêu cầu phân tích, làm thế nào để đảm bảo có hướng giải quyết bài toán đúng? Mình xin chia sẻ kinh nghiệm làm mà mình đã học hỏi đc và hay áp dụng trong việc phân tích dữ liệu

Khi mới phân tích tại 1 tổ chức doanh nghiệp, cần nắm được mô hình kinh doanh và vẽ quy trình nghiệp vụ Khi mới vào phân tích dữ liệu ở 1 công ty, sẽ có bạn bị bị bối rối, không hiểu các số liệu của công ty, không biết lấy dữ liệu từ đâu. Do đó, trước hết các bạn cần hiểu được mô hình kinh doanh của công ty và vẽ ra quy trình nghiệp vụ của công ty đó.

Ví dụ như trong trung tâm Tiếng Anh, mô hình hoạt động của họ là kết nối với giáo viên, mở các lớp dạy tiếng Anh (sản phẩm) và tuyển sinh học viên (khách hàng). Hiện đang có 2 lớp IELTS for newbie, giờ sếp muốn mở thêm 3 lớp đấy, muốn bạn phân tích để tính ra được KPI mà marekting và sales cần đạt được để tuyển sinh đủ lớp.

➡️ Vậy thì bạn cần nắm được cả quy trình tuyển sinh (bán hàng) của họ, thì mới biết hướng phân tích từ đâu (lấy chỉ số từ sales tính ra KPI cho marketing hay ngược lại?) và hiểu tất chỉ số mà họ quy ước (ví dụ: L1 là kh mới đăng ký, L2 là đã sale đã gọi, L3 là khách hàng có quan tâm, L4 là khách muốn học, L5 là khách đã chốt hợp đồng), biết liên hệ với bộ phận nào để khai thác thông tin mình cần.

Tư duy phân tích dữ liệu đa chiều

Phân tích đa chiều là gì? Cùng 1 chủ điểm phân tích, chúng ta sẽ xem xét dưới nhiều góc nhìn khác nhau (doanh số chi tiết theo từng sản phẩm là bao nhiêu, theo từng khu vực, từng quý là bao nhiêu,..., hoặc chi tiết hơn nữa vd như chi tiết doanh thu theo doàng sản phẩm A trong quý 2 là bao nhiều). Khi chúng ta có thể trả lời những câu hỏi đấy 1 cách nhanh chóng theo thời gian thực bằng dashboard hoặc các phân tích BI, thì đấy gọi là phân tích đa chiều. Các bước phân tích đầu bài với phương pháp phân tích đa chiều

✔️Bước 1: Xác định Dim - Fact

Trước hết, Fact là các chủ điểm phân tích dữ liệu từ yêu cầu, ví dụ yêu cầu phân tích doanh số và sản lượng bán ra trong năm nay, thì doanh số và sản lượng chính là Fact.

Dimension là các khía cạnh phân tích. Ví dụ phân tích doanh số, chúng ta có thể xem xét theo chiều thời gian (theo quý, theo tháng), theo khu vực (các chi nhánh), theo danh mục loại sản phẩm, theo nhân viên bán hàng,...

✔️Bước 2: Cần liệt kê các giá trị trong Dimension.

Ví dụ theo dimension Thời gian thì ta có các giá trị trong đó là: Tháng 1, Tháng 2, Tháng 3,... (Hoặc quý 1, quý 2,...)

Theo dimension sản phẩm thì ta có giá trị trong đó là: Sản phẩm A, Sản phẩm B, Sản phẩm C,...

Theo dimension khu vực thì trong đó ta có: Hà Nội, Hồ Chí Minh, Đà Nẵng,...
9405904f-1082-46da-b856-94aa2c8b5eee.png


✔️Bước 3: vẽ mô hình dữ liệu cho hệ thống phân tích dữ liệu

Bên tay phải có Fact (chủ điểm phân tích), và bên tay trái là Dim (chiều dữ liệu). Trong mô hình này, chúng ta hệ thống lại các chiều dữ liệu và các cấp nhỏ hơn của mỗi chiều. Cùng với đó là sự liên hệ với các chủ điểm phân tích trong hệ thống dữ liệu.

⚪ Ví dụ khi phân tích dòng sản phẩm A và ở thị trường quốc gia VN, thì chúng ta có thể phân tích về doanh số, lượng tồn kho,...

⚪ Ví dụ phân tích về giá, chúng ta không phân tích theo cửa hàng mà phân tích theo dòng sản phẩm và theo thời gian (năm, quý). Phân tích về sức mua (purchase amount) thì sẽ phân tích theo khu vực, theo dòng sản phẩm và theo thời gian, chứ không phải theo khách hàng
48045ada-fdfe-42fc-b045-5d893a5bfc1e.png


❓ Tại sao cần vẽ Data Model dạng này? Mô hình này giúp dễ dàng xác định các nhu cầu phân tích, nhu cầu làm báo cáo và xây dựng chủ điểm phân tích dễ dàng hơn.

Bên cạnh đó nó giúp hình dung các chiều dữ liệu rõ ràng hơn.

Nếu bạn chỉ cần làm 1 báo cáo nhanh bằng Excel thì việc xây dựng Data Model kiểu này giúp bạn nắm được tổng thể các chiều dữ liệu và sự liên kết trong các dữ liệu. Việc kéo thả vào pivot table, kéo thả các bar chart trong BI trở nên dễ dàng hơn. Giúp quá trình xây dựng dash tổng thể và khoa học hơn rất nhiều

Nếu bạn cần xây dựng dashboard phức tạp trên Power BI, thì mô hình này giống như 1 bản mô phỏng, giúp bạn xây dựng Data Model đầy đủ và chuẩn xác hơn
Mình đã có dịp đọc bài này tại đây.
 
Lần chỉnh sửa cuối:
Bài này nếu ai đọc cũng hiểu thì:
1. Nếu người viết chưa mở trường dạy học thì nên mở đi. Vì khả năng diễn tả mọt vấn đề phức tạp bằng một bài luận nhỏ của bạn rất tối. Không đi dạy học rất uổng.
2. Nếu người viết đã mở trường dạy thì quý vị nên tìm học.

Nếu có người hiểu người không thì:
1. Người hiểu đã là Đi Ê hạng chiến rồi. Chả cần ai chỉ dẫn thêm.
2. Người không hiểu thì cũng không sao. Bởi có nhiều người gióng mình lắm.

Nếu không ai hiểu hết nhưng vẫn có nhiều người tin thì
- Người viết bài nên đi bán cổ phần đầu tư, hay làm báo, làm chính trị đi. Bàm nghề IT này uổng phí tiềm năng.
 
tôi chỉ chia sẻ cái mà t biết, t học được và đang áp dụng trong công việc của mk, người làm nghề trải qua rồi thì hiểu, còn ko thì đọc cho biết. anh em đang làm rồi có dịp trao đổi, anh em nào đang tìm hiểu thì đọc để chuẩn bị bản thân cho tốt, tránh vào việc r bị shock. vừa cuối năm trước nhận training cho 1 cu em fresher hỏi nhiều, nhận yêu cầu phân tích mà cứ loay hoay mãi, kết quả báo cáo ko giải quyết đúng yêu cầu sếp
 
Lần chỉnh sửa cuối:
tôi chỉ chia sẻ cái mà t biết, t học được và đang áp dụng trong công việc của mk, ...
Ở bài #3, tôi cũng dùng kinh nghiệm làm trong nghề để phân tích một mẩu dữ liệu ở bài #1.

Chú thích: có lẽ bạn chỉ giỏi phân tích chứ không hề học qua netiquette.
Bài bạn cóp đâu đó đem "chia sẻ" thì phải cho biết là mình cóp nơi nào.
 
tôi chỉ chia sẻ cái mà t biết, t học được và đang áp dụng trong công việc của mk, người làm nghề trải qua rồi thì hiểu, còn ko thì đọc cho biết. anh em đang làm rồi có dịp trao đổi, anh em nào đang tìm hiểu thì đọc để chuẩn bị bản thân cho tốt, tránh vào việc r bị shock. vừa cuối năm trước nhận training cho 1 cu em fresher hỏi nhiều, nhận yêu cầu phân tích mà cứ loay hoay mãi, kết quả báo cáo ko giải quyết đúng yêu cầu sếp
Viết tắt và viết dùng từ kiểu chat chit (mk, ko, t, r, ...) là vi phạm nội quy.
Copy không trích dẫn nguồn là cũng vi phạm nội quy.
Tôi khóa chủ đề lại.
 
Status
Không mở trả lời sau này.
Web KT
Back
Top Bottom