3
1,
, 20.
i
i
i
i
i
Y
X
X
X
i
另外,表1計算解釋變數之間的解釋能力。
表1
反應變數
解釋變數
判定係數ܴଶ
ܺଵ
ܺଶ, ܺଷ
99.86%
ܺଶ
ܺଵ, ܺଷ
99.82%
ܺଷ
ܺଵ, ܺଶ
99.04%
請由表1計算變異數膨脹因子(variance inflation factor, VIF)評論該
分析師所配適的迴歸模型1是否合適?如果不合適,請詳細說明原
因和解決方法。(8分)
一位分析師受託分析影響縣市首長滿意度的重要因素。滿意度分數
Y(以1~10為評分範圍,分數愈高代表愈滿意)作為反應變數。該
分析師找到一些重要的解釋變數。依據他所配適的複迴歸模型,有
些預測值有超過10的情況。請問該分析師所配適的複迴歸模型是否
合適?如果不合適,請詳細說明原因和解決的方法。(6分)
一位分析師分析2017年1月至2019年12月的旅遊人數月資料。該分
析師配適的迴歸模型如下:
模型2
2
0
1
2
1
3
2
12
11
ln(
)
,
~ N(0,
)
iid
t
t
t
y
t
M
M
M
此處t 是時間,
t為獨立且具有共同分配其平均數為0變異數
2
的常
態分配,ܯ是虛擬變數,第i 個月為1,其他月份為0,i=1, 2,…, 11。
請說明在線性迴歸模型下,如何檢查誤差項的所有假設是否有違
反。圖2是模型2的標準化殘差值(studentized residual)對應時間的
殘差圖。請問該分析師所配適的複迴歸模型是否合適?如果不合
適,請詳細說明原因和解決的方法。(10分)
圖2
三、一位數據分析師受託分析於33(n=33)位男學生,其腳長(Y,以公
分為單位)和X 身高(以英吋為單位)的關係。所建立的簡單線性模
型如下:
0
1
,
1,
, .
i
i
i
Y
X
i
n
…
請使用表2部分電腦輸出報表來回答以下問題。表2第一欄是觀察值的
順序,第二欄是殘差值。
請說明何謂異常點(outlier)和高槓桿觀察值(high leverage
observation),及其之間的區別。(8分)
表2第三欄是標準化的殘差值(studentized residual)。請以此判斷是
否有異常點存在?請說明判斷準則。
表2第五欄是Student 化刪除殘差(Studentized deleted residuals,以
R-Student 表示)。第i 個R-Student 殘差是在假定將資料中的第i
個觀察值刪除,然後以剩下的n-1個觀察值來建立新的估計迴歸方
程式而標準化獲得的R-Student 殘差值。請以此判斷是否有異常點
存在?請說明判斷準則。(8分)
表2第六欄是hii(hat value),其公式為
2
2
1
(
)
1
(
)
i
ii
n
j
j
X
X
h
n
X
X
,
請問
1
n
ii
i
h
的值為何?請以此判斷是否有可能的高槓桿觀察值存
在?請說明判斷準則。表2的最後一欄,第八欄是DFFITS
(Difference in Fits)值。請以此判斷是否有可能的影響點(influential
observation)存在?請說明判斷準則。(8分)
表2
Obs
Residual
Student
Residual
Cook's D
R-
Student
Hat Diag
Cov
Ratio
DFFITS
H
1
0.541
0.443
0.011
0.438
0.101
1.173
0.147
2
0.906
0.718
0.009
0.712
0.035
1.070
0.136
3
-1.777
-1.410
0.041
-1.434
0.040
0.974
-0.293