Giải bằng nội suy thì đúng rồi.
Tuy nhiên, nếu theo đúng quy luật của thống kê thì gặp dữ liệu biến động phải xét giá trị tương quan (correlation) trước. Hoặc dùng Data Analysis, hoặc dùng hàm Correl.
Hệ số tương quan là bước đầu ước lương khả năng mối liên hệ, để đánh giá mối liên hệ có tồn tại hay không khá phức tạp cần sử dụng công cụ Data Analysis hoặc hàm Linest tính toán các tham số và đối chiếu với "mức ý nghĩa Alpha"
Tạm trích hướng dẫn của hàm Linest
"
Ví dụ 4: Sử dụng Thống kê F và r2
Trong ví dụ trên đây, hệ số xác định,hay r2, là 0,99675 (xem ô A17 trong kết quả của đối số
LINEST), thể hiện một quan hệ mạnh mẽ giữa các biến số độc lập và giá bán. Bạn có thể dùng thống kê F để xác định xem những kết quả này, với giá trị r2 cao như vậy, có ngẫu nhiên xảy ra hay không.
Giả sử rằng trên thực tế không có quan hệ nào giữa các biến số, nhưng bạn đã lấy một mẫu hiếm gặp về 11 tòa cao ốc văn phòng, khiến cho phân tích thống kê thể hiện một quan hệ mạnh mẽ. Thuật ngữ "Alpha" được dùng để chỉ xác xuất của kết luận sai lầm rằng có một quan hệ.
Có thể dùng giá trị F và df trong đầu ra từ hàm
LINEST để đánh giá khả năng xảy ra giá trị F cao hơn. Có thể so sánh F với giá trị tới hạn trong bảng phân bố F đã phát hành hoặc hàm
FDIST trong Excel để tính toán xác suất của giá trị F lớn hơn xuất hiện tình cờ. Phân bố F thích hợp có bậc tự do v1 và v2. Nếu n là số điểm dữ liệu và const = TRUE hoặc được bỏ qua thì v1 = n – df – 1 và v2 = df. (Nếu const = FALSE thì v1 = n – df và v2 = df.) Hàm
FDIST — với cú pháp
FDIST(F,v1,v2) — sẽ trả về xác suất của giá trị F cao hơn xuất hiện tình cờ. Trong ví dụ này, df = 6 (ô B18) và F = 459,753674 (ô A18).
Giả sử giá trị Alpha là 0,05, v1 = 11 – 6 – 1 = 4 và v2 = 6, mức quan trọng của F là 4,53. Vì F = 459,753674 cao hơn nhiều so với 4,53, rất khó có khả năng xảy ra giá trị F cao đến vậy. (Với Alpha = 0,05, giả thiết rằng không có mối quan hệ nào giữa mức quan hệ của
known_y và
của known_x là bị từ chối khi F vượt quá mức giới hạn, 4,53.) Bạn có thể dùng
hàm FDIST trong Excel để có được xác suất giá trị F cao đến mức này do vô tình xảy ra. Ví dụ,
FDIST(459,753674, 4, 6) = 1,37E-7, một xác suất cực nhỏ. Bạn có thể kết luận, bằng cách tìm mức tới hạn F trong bảng hoặc bằng cách dùng hàm
FDIST, rằng phương trình hồi quy hữu ích trong việc dự đoán giá trị định giá của các cao ốc văn phòng trong khu vực này. Hãy nhớ rằng điều quan trọng là sử dụng các giá trị đúng của v1 và v2 được tính toán trong đoạn văn trước đó.
Ví dụ 5: Tính toán thống kê t-Statistics
Một kiểm tra giả thuyết khác sẽ xác định xem mỗi hệ số độ dốc có hữu ích không trong việc ước tính giá trị định giá của một cao ốc văn phòng trong
Ví dụ 3. Ví dụ, để kiểm tra hệ số tuổi thọ cho ý nghĩa thống kê, hãy chia -234,24 (hệ số độ dốc tuổi thọ) cho 13,268 (lỗi chuẩn ước tính của hệ số tuổi thọ trong ô A15). Dưới đây là giá trị t-quan sát:
t = m4 ÷ se4 = -234.24 ÷ 13.268 = -17.7
Nếu giá trị tuyệt đối của t đủ lớn, thì có thể kết luận rằng hệ số độ dốc là hữu ích trong việc ước tính giá trị định giá của một cao ốc văn phòng trong
Ví dụ 3. Bảng sau đây thể hiện giá trị tuyệt đối của 4 giá trị t-quan sát.
Nếu bạn tham khảo bảng trong sổ tay thống kê, bạn sẽ thấy rằng t-tới hạn, hai phía, với 6 bậc tự do và Alpha = 0,05 là 2,447. Cũng có thể tìm được giá trị tới hạn này bằng cách dùng hàm
TINV trong Excel.
TINV(0,05,6) = 2,447. Vì giá trị tuyệt đối của t (17,7) lớn hơn 2,447, cho nên tuổi thọ là một biến số quan trọng khi ước tính giá trị định giá của một cao ốc văn phòng. Mỗi trong số các biến số độc lập khác có thể được kiểm tra ý nghĩa thống kê theo cách tương tự. Dưới đây là các giá trị t-quan sát cho mỗi biến số độc lập."