話說很久沒發正經一點的統計文章了。。。。

在迴歸分析中,最麻煩的事情莫過於模式鑑定。其中,又以模式是否違反變異數同質性是許多人感到最困難的。變異數同質性的道理基於殘差的變異數需呈現一個固定常數。但要達到這個需求,就必須要靠依變數的變異數 Var(Y) 不會隨著其期望值 E(Y) 的變動而變動。在一般大學的迴歸分析課程裡面,老師們通常會教學生畫一張 standardized residual (or  studentized residual) v.s. predicted value 的散佈圖。如果這張圖裡面的點是呈現水平帶狀散佈,就表示模式的變異數同質性沒有違反,如下所示:


如果是呈現某種特殊趨勢,如馬鞍狀或扇形,就表示模式違反了這個假設。圖形如下所示:

但是「看圖說故事」人人都會,有時候圖形明明出現一點趨勢,但還是可以硬凹講成水平帶狀。反正這是自由心證,也沒有科學數據來證實「多少程度水平帶狀才叫做真的水平帶狀」。此外,樣本太少也是導致誤判的因素之一。因為可能在樣本數少的時候呈現水平帶狀,但誰知道等到樣本數增加時會不會變成扇形。。。。

如果這個假設能夠使用一些真正可算出 p-value 的數據來幫助判別,那一定相當方便,也可避免硬凹的情況。不過,以前的老師沒教過,教科書上也鮮少提到。其實還是有人發明出來的,其實這個檢定早在 1979 年就由 Breusch  和 Pagan 發表出來了,就取名為 Breusch-Pagan Test。

Breusch, T. and Pagan, A. (1979), ``A Simple Test for Heteroscedasticity and Random Coefficient Variation," Econometrica, 47, 1287-1294.

接著 White 也發明了另一個檢定來進行變異數同質性檢定(取名為 White's Test)。

White, H. (1980), ``A Heteroscedasticity-Consistent Covariance Matrix Estimator and a Direct Test for Heteroscedasticity," Econometrica, 48, 817-838.

SAS 並沒有把這兩個檢定放進 PROC REG 裡面,而是放在 PROC MODEL 中。有興趣的人可以到下面的連結去 copy 程式碼。

A Simple Regression Model with Correction of Heteroscedasticity
arrow
arrow
    全站熱搜

    cchien 發表在 痞客邦 留言(1) 人氣()