chào bạn
tôi có ý kiến với topic của bạn như sau, với yêu cầu này bạn phải xác định trước nó chỉ có ý nghĩa khi database của bạn ở dạng thang do (interval hay ratio)
1/bảng data của bạn ở đây là dạng Nominal (định danh) chia theo tổ (1(0-300) 2(300-600)) nên không thể đưa ra số Mean cụ thể--->vì thế Std.Dev hay Dev. cũng không thể
...đặc biệt là ngay cả khi để ở dạng phân tổ như trên thì bạn cũng đã để số liệu không tốt (ví dụ có người mua với số tiền đúng 300ngàn thì họ sẽ được nằm ở nhóm nào...từ 0-300 cũng dc mà từ 300-600 cũng dc
mình sẽ nói tiếp về ý nghĩa trong đề bài của bạn
ví dụ ta có 2 nhóm chi tiêu N1 có 4 người ...N2 có 5 người
N1: 40,60,50,90...mean=240/4=60
N2: 10,30,60,80,120...mean=300/5=60
như trên ta thấy 2 nhóm có trung bình như nhau nhưng khó có thể kết luận 2 nhóm giống nhau về múc độ chi tiêu đồng đều trong mỗi nhóm
N1: 90-40=50
N2: 120-10=110
ta thấy nhóm 2 có độ chênh lệch giữa ng thấp & cao nhất là 110...cao hơn nhóm 1 là 50 ---> đó chính là lý do ta đi tìm phương sai
tìm độ biến thiên trong mỗi nhóm = cách lấy giá trị của mỗi ng trừ đi số trung bình (mean) va cộng lại
N1: (40-60)+(60-60)+(50-60)+(90-60)=0
N2: (10-60)+(30-60)+(60-60)+(80-60)+(120-60)=0
ta thấy tổng đều = 0 nên ko phản ánh dc độ biến thiên của 2 nhóm ,mên ta cần bình phương giá trị của từng cá nhân & cộng lại...goi chỉ số này là D bình phương
N1: (40-60)^2+(60-60)^2+(50-60)^2+(90-60)^2 = 1400
N2: (10-60)^2+(30-60)^2+(60-60)^2+(80-60)^2+(120-60)^2 = 7400
ta đã có thể thấy nhóm 2 biến thiên cao hơn, nhưng để chính xác hơn ta phải chia D cho số cỡ mẫu trong mỗi nhóm trừ 1 (vì mỗi lần lấy giá trị mỗi ng trừ mean ta mất 1 thông số)
N1: 1400/(4-1) = 466,6
N2: 7400/(5-1) = 1850
...Đó chính là phương sai => vì phương sai là bình phương nên không có cùng đơn vị với Mean...
Để quy về cùng đơn vị ta khai căn 2 cho phương sai
N1 : căn2(466.7) = 21.6
N2 : căn2(1850) = 43.0...=> đây chính là độ lệch chuẩn (Std.Dev)
...kết luận nhóm N2 có độ biến thiên cao hơn N2 => mức độ đồng đều trong chi tiêu N1 đồng đều hơn N2
để định lượng hóa (Std.Dev) ta chia nó cho Mean (đây chính là lý do ta khai căn phương sai cho có cùng đơn vị với Mean) rồi nhân 100...ta sẽ có hệ số % biến thiên (coefficient of variation)
N1 = 36.0%
N2 = 71.7%
hy vọng bài có thể đóng góp với bạn phần nhỏ nào để áp dụng
Thân