Tự tương quan là gì? | Autocorrelation là gì? Tự tương quan hay còn gọi là Autocorrelation là hiện tượng mà tại đó hạng nhiễu tại thời điểm t (hay còn gọi là sai số) thường được kí hiệu là ut có tương quan với hạng nhiễu tại thời điểm (t-1) hoặc bất kỳ hạng nhiều nào trong quá khứ.
Đang xem: Hiện tượng tự tương quan và cách khắc phục hiện tượng
Ví dụ: Nếu hôm nay trời mưa, dữ liệu cho thấy ngày mai trời có nhiều khả năng mưa hơn hôm nay trời quang đãng.Khi nói đến đầu tư, một cổ phiếu có thể có tỷ suất sinh lợi tự tương quan dương mạnh mẽ, cho thấy rằng nếu nó “tăng” vào ngày hôm nay, thì nhiều khả năng nó cũng sẽ tăng vào ngày mai.
Đương nhiên, tự tương quan có thể là một công cụ hữu ích cho các nhà giao dịch sử dụng;đặc biệt là đối với các nhà phân tích kỹ thuật.
Hiện tượng tự tương quan trong kinh tế lượng hay còn gọi là Autocorrelation là hiện tượng mà tại đó hạng nhiễu tại thời điểm t (hay còn gọi là sai số) thường được kí hiệu là ut có tương quan với hạng nhiễu tại thời điểm (t-1) hoặc bất kỳ hạng nhiều nào trong quá khứ. Thường xảy ra trong dữ liệu bảng (panel data) và trong dữ liệu chuỗi thời gian (time-series).umakarahonpo.com
Tự tương quan, đôi khi được gọi là tương quan nối tiếp trong trường hợp thời gian rời rạc, là tương quan của tín hiệu với một bản sao bị trễ của chính nó như một hàm của độ trễ.https://en.wikipedia.org/wiki/Autocorrelation
Trong dữ liệu chuỗi thời gian (time-series) tự tương quan được gọi là Autocorrelation và trong dữ liệu bảng (panel-data) tự tương quan được gọi là Serial Correlation. Công thức chung như sau:
Uit = β*Uit-1 + cit
(U là hạng nhiễu tại t và t-1, Hệ số β ≠ 0 thì có TTQ và ngược lại)
( i = 0 khi là time-series)
Hiện tượng này vi phạm giả thuyết trong mô hình hồi quy tuyến tính cổ điển giả định rằng quan hệ tự tương quan không tồn tại trong các nhiễu ui .
Hiện tượng tự tương quan và tương quan chuỗi là giống nhau tuy nhiên vẫn có 1 số tác giả định nghĩa hai cụm từ này khác nhau, trong bài viết này umakarahonpo.com xem xét chúng là đồng nhất.
Cách phát hiện tự tương quan
3.2. Kiểm định tự tương quan bằng kiểm định Durbin-Watson với dữ liệu chuỗi thời gian
Nhớ khai báo dữ liệu chuỗi thời gian bằng câu lệnh: tset timevar (trong đó timevar là biến thời gian của mô hình) cho Stata nhận nhé!
Lưu ý: Sau khi hồi quy mô hình thì mới dùng 3 cách dưới để kiểm định tự tương quan.
Giả thuyết H0:
H0 : Mô hình không xảy ra hiện tượng tự tương quan
H1: Mô hình xảy ra hiện tượng tự tương quan
Cách 1:Kiểm định bằng phương pháp Durbin-Watson
Durbin-Watson luôn tạo ra dải số thử nghiệm từ 0 đến 4. Các giá trị gần 0 cho biết mức độ tương quan dương lớn hơn, các giá trị gần 4 cho biết mức độ tự tương quan âm lớn hơn, trong khi các giá trị gần giữa hơn cho thấy mức độ tự tương quan ít hơn.
Dùng lệnh: dwstat
Cách 2:Sử dụng Durbin’s alternative để hiện mức ý nghĩa cho cách 1
Bạn có biết: Kiểm định Durbin-Watson có thể được ánh xạ tuyến tính theo mối tương quan Pearson giữa các giá trị và độ trễ của chúng.
Dùng lệnh: estat durbinalt
Funfact: Trong phần này umakarahonpo.com hướng dẫn các bạn cách tra bảng kiểm định durbin watson bởi vì nó khá phức tạp và thực sự không cần thiết khi đã có các phần mềm data analysis hiện đại giúp bạn làm điều này.
Cách 3:Sử dụngkiểm định Breusch-Godfrey
Lưu ý: Tự tương quan của các bậc cao hơn và có thể áp dụng cho dù các bộ hồi quy có bao gồm độ trễ của biến phụ thuộc hay không còn được gọi là thử nghiệm Breusch-Godfrey.
Lệnh: bgodfrey
Kết quả từ cách 2 và cách 1 đều cho p-value dữ liệu bảng và setup dữ liệu cho Stata hiểu bằng câu lệnh: xtset bank YEAR
Sau khi hồi quy mô hình dùng lệnh: xtserial
Kết quả với bộ dữ liệu này thì p-value = 0.0849 > 0.05 nên chấp nhận H0 và kết luận mô hình không xảy ra hiện tượng tự tương quan.
4. Cách khắc phục hiện tượng tự tương quan trong stata
Giống như trong trường hợp của phương sai thay đổi, bạn cần sử dụng đến ước đoán dựa trên cơ sở kinh nghiệm (educated guess) hoặc một loại chuyển hóa nào đó về mô hình hồi quy gốc để trong mô hình đã được chuyển hóa không còn gặp phải vấn đề tương quan chuỗi nữa. Có nhiều cách khắc phục như sau:
4.1. Chuyển hóa sai phân bậc 1
Với cách này bạn sẽ đưa toàn bộ dữ liệu về dạng sai phân bậc 1 tức là lấy hiệu số giữa hai kỳ quan sát thứ t và t-1 cho mỗi biến trong mô hình.
May thay trong Stata bạn không cần làm phức tạp như vậy mà chỉ cần dùng lệnh D. ở phía trước các biến như sau:
reg D.Y D.X1 D.X2 D.X3
4.2. Chuyển hóa tổng hóa
Các giá trị ước lượng p của các tham số thu được vì thế được biết với tên gọi là các ước lượng bình phương bé nhất tổng quát khả thi viết tắt là FGLS (Feasible Generalized Least Squares estimators).
Tham khảo ngay nếu chưa biết Mô hình FGLS là gì? nhé!
Trong phần mềm Stata đối với dữ liệu bảng ta có lệnh sau để khắc phục hiện tượng tự tương quan:
xtgls
Với giả định ut theo cơ chế AR(1) là phù hợp, hồi quy et theo et-1, sử dụng et làm biến đại diện cho ut, một giả định có thể phù hợp trong các mẫu lớn, bởi vì trong các mẫu lớn