Hiệp phương sai đo xem hai biến có xu hướng cùng nằm trên hoặc dưới giá trị trung bình của chúng hay không. Hiệp phương sai dương nghĩa là các biến thường biến động cùng chiều so với giá trị trung bình của chúng. Hiệp phương sai âm nghĩa là một biến có xu hướng cao hơn trung bình khi biến kia thấp hơn trung bình.
Với đa số học sinh, ý chính là thế này: dấu của hiệp phương sai thường hữu ích hơn con số thô. Độ lớn của hiệp phương sai phụ thuộc vào đơn vị của cả hai biến, nên bản thân nó không phải là một thang đo mức độ mạnh rõ ràng.
Công Thức Hiệp Phương Sai Cho Mẫu Và Tổng Thể
Với một mẫu dữ liệu ghép cặp, công thức thường dùng là
Ở đây và là trung bình mẫu. Mỗi tích là dương khi cặp dữ liệu nằm cùng phía so với cả hai giá trị trung bình, và là âm khi cặp dữ liệu nằm ở hai phía đối nhau.
Nếu bạn đang làm việc với toàn bộ tổng thể thay vì một mẫu, mẫu số thường là thay vì :
Hãy dùng phiên bản cho mẫu khi dữ liệu là mẫu, và chỉ dùng phiên bản cho tổng thể khi dữ liệu đại diện cho toàn bộ tổng thể mà bạn muốn mô tả.
Cách Đọc Dấu Của Hiệp Phương Sai
Hiệp phương sai được xây dựng từ các độ lệch ghép cặp so với giá trị trung bình.
Nếu cả hai độ lệch đều dương, tích của chúng là dương. Nếu cả hai đều âm, tích của chúng cũng dương. Những cặp như vậy làm hiệp phương sai tăng lên vì các biến đang biến động cùng chiều quanh tâm của chúng.
Nếu một độ lệch dương và độ lệch kia âm, tích sẽ âm. Những cặp như vậy kéo hiệp phương sai xuống vì các biến đang biến động ngược chiều.
Vì vậy, hiệp phương sai thực chất là giá trị trung bình của “chuyển động chung quanh giá trị trung bình”.
Ví Dụ Có Lời Giải: Số Giờ Học Và Điểm Kiểm Tra
Giả sử một mẫu nhỏ ghi lại số giờ học và điểm kiểm tra:
Trước hết, tìm các giá trị trung bình:
Bây giờ tính các độ lệch và tích của chúng:
- Với :
- Với :
- Với :
Cộng các tích lại:
Vì đây là hiệp phương sai mẫu, ta chia cho :
Hiệp phương sai là số dương, nên trong mẫu này các biến biến động cùng chiều. Ở đây, thời gian học nhiều hơn đi kèm với điểm kiểm tra cao hơn.
Điều quan trọng cần lưu ý là không phải là một thang đo mức độ mạnh mang tính phổ quát. Độ lớn của nó phụ thuộc vào đơn vị ở đây: giờ nhân với điểm số. Nếu bạn thay đổi thang đo, hiệp phương sai cũng sẽ thay đổi, ngay cả khi mô hình tổng thể vẫn tương tự.
Hiệp Phương Sai So Với Tương Quan: Khác Biệt Chính
Hiệp phương sai và tương quan có liên hệ chặt chẽ, nhưng chúng trả lời những câu hỏi hơi khác nhau.
Hiệp phương sai cho biết hướng biến động chung và giữ nguyên thang đo ban đầu. Tương quan chuẩn hóa mối quan hệ đó bằng cách chia hiệp phương sai cho độ lệch chuẩn, khi các độ lệch chuẩn đó khác :
Đó là lý do tương quan không có đơn vị và dễ so sánh hơn giữa các bộ dữ liệu khác nhau. Giá trị của nó luôn nằm trong khoảng từ đến , trong khi hiệp phương sai không có khoảng giá trị cố định.
Trong thực tế:
- Dùng hiệp phương sai khi bạn quan tâm đến biến thiên chung theo đơn vị gốc hoặc khi nó xuất hiện trong một phép tính lớn hơn, chẳng hạn như ma trận hiệp phương sai.
- Dùng tương quan khi bạn muốn một đại lượng tóm tắt không có đơn vị và dễ so sánh giữa các bộ dữ liệu.
Những Sai Lầm Thường Gặp Với Hiệp Phương Sai
Cho Rằng Hiệp Phương Sai Lớn Thì Tự Động Là Mạnh
Hiệp phương sai bằng không tự động “mạnh hơn” hiệp phương sai bằng . Có thể chỉ là các biến được đo trên thang đo lớn hơn.
Nhầm Lẫn Giữa Công Thức Cho Mẫu Và Tổng Thể
Nếu dữ liệu của bạn là mẫu, chia cho là cách chuẩn. Nếu dữ liệu là toàn bộ tổng thể cần xét, chia cho là phiên bản cho tổng thể.
Nghĩ Rằng Hiệp Phương Sai Bằng 0 Nghĩa Là Không Có Quan Hệ Nào
Hiệp phương sai gần nghĩa là có rất ít sự đồng biến tuyến tính quanh các giá trị trung bình. Điều đó không loại trừ khả năng tồn tại quan hệ phi tuyến.
Nếu hai biến độc lập và hiệp phương sai tồn tại, thì hiệp phương sai bằng . Chiều ngược lại không phải lúc nào cũng đúng.
Hiểu Hiệp Phương Sai Như Là Quan Hệ Nhân Quả
Hiệp phương sai chỉ mô tả cách các biến cùng biến thiên. Nó không giải thích vì sao chúng cùng biến thiên.
Khi Nào Hiệp Phương Sai Được Sử Dụng
Hiệp phương sai xuất hiện trong thống kê, tài chính, học máy và phân tích dữ liệu bất cứ khi nào cần nghiên cứu các biến ghép cặp cùng nhau.
Nó đặc biệt phổ biến trong ma trận hiệp phương sai, nơi mỗi phần tử tóm tắt cách hai biến cùng biến thiên. Điều đó quan trọng trong các lĩnh vực như rủi ro danh mục đầu tư, phân tích thành phần chính và mô hình hóa đa biến.
Thử Một Bài Tương Tự
Hãy lấy bất kỳ ba hoặc bốn cặp giá trị nào, tính hai giá trị trung bình, rồi nhân các độ lệch ghép cặp trước khi lấy trung bình. Chỉ một quy trình đó thôi sẽ giúp dấu của hiệp phương sai trở nên cụ thể hơn nhiều.
Nếu bạn muốn đi tiếp, hãy so sánh cùng bộ dữ liệu đó với hệ số tương quan và để ý cách việc chuẩn hóa thang đo làm thay đổi cách diễn giải.
Cần trợ giúp giải bài?
Tải câu hỏi lên và nhận lời giải từng bước đã được xác minh trong vài giây.
Mở GPAI Solver →