17 4.4513 3.5915
43 4.0670 3.2145
44 4.0617 3.2093
87 3.9506 3.1013
88 3.9493 3.1001
一、何謂多重共線性(multicollinearity)?多重共線性對估計結果有何
影響?如何偵測複迴歸模型中存在多重共線性?請詳述所需要的
判斷準則。(12 分)
一位分析師進行迴歸分析資料並配適複迴歸模型如(1)。
100
,
,1
,
7
7
1
1
0
"
"
=
+
+
+
+
=
i
X
X
Y
i
i
i
i
ε
β
β
β
(1)
所獲得初步結果如圖1。請用圖1 部分統計電腦套裝軟體輸出結
果,說明這位分析師所配適的模型是否合適?如果模型(1)不合
適,請說明原因並提供所有可以解決問題的方法。(10 分)
圖1
二、醫院分析師希望研究患者滿意度(Y)與患者年齡(X1,以年為單位),
疾病嚴重程度指數(X2)以及焦慮指數(X3)之間的關係。分析師隨
機選擇了46 名患者並收集了數據。請使用圖2 部分統計電腦套裝軟
體輸出結果來回答以下問題。
圖 2
請計算額外平方和(extra sum of squares)
=
)
,
|
(
(1)
(1)
(1) 10 分
34.310
0.365
0.328
6.625
B
ܺଶ
2
44.836
0.171
0.122
13.260
C
ܺଷ
2
33.557
0.379
0.343
6.150
D
ܺସ
2
50.735
0.062
0.006
16.977
E
ܺଵ、ܺଶ
1
2
X
X
X
SSR
?(4 分)
假設這位分析師採用模型是
i
i
i
i
X
X
Y
ε
β
β
β
+
+
+
=
3
3
1
1
0
(2)
該分析師想知道在模型(2)之下,增加疾病嚴重程度指數(X2)此額
外變數,解釋其在顯著水準α=5%下是否有顯著的貢獻,並敘述對
立假設、檢定統計量之值、決策法則和結論。(8 分)
假設這位分析師採用模型是
i
i
i
i
i
X
X
X
Y
ε
β
β
β
β
+
+
+
+
=
3
3
2
2
1
1
0
(3)
請檢定疾病嚴重程度指數(X2)和焦慮指數(X3)兩個解釋變數是
否可以從模型(3)中刪除,也就是在已經有患者年齡(X1)解釋變數
之下,解釋變數X2 和X3 可否從模型中移除?請在顯著水準α=5%
檢定,並協助敘述對立假設、檢定統計量之值、決策法則和結論。
在本小題的檢定問題中,請試述需要作何假設,才能執行這些統計
檢定。(10 分)
三、一位分析師考慮對三組數據配適一個簡單迴歸模型
i
i
i
X
Y
ε
β
β
+
+
=
1
0
,其中
0
β 、
1
β 為參數,ε 為隨機誤差,且假設其為
具均數0,標準差σ 之常態分配。
配適模型後,三組數據之殘差分析圖分別為3(a)、3(b)、3(c),請
分別說明配適迴歸模型是否恰當?若模型不合適或偏離模型假設
時,請指出不恰當之處並請提出修正的方法。(21 分)
在何種情況下,需要採用加權最小平方法(Weighted least squares)
估計未知的參數?請協助提供散佈圖和殘差圖說明。(7 分)
圖3(a) 標準化殘差時間序列圖(Standardized residuals vs. time)
圖3(b) 標準化殘差對預測值圖(Standardized residuals vs. ݕො)
圖3(c) 標準化殘差對預測值圖(Standardized residuals vs. ݕො)
(2)
(2) 8 分
(3)
(3) 10 分
24.695
0.543
0.486
2.565
F
ܺଵ、ܺଷ
3
25.019
0.537
0.479
2.769
G
ܺଵ、ܺସ
3
27.841
0.485
0.421
4.548
H
ܺଶ、ܺଷ
3
32.928
0.391
0.315
7.754
I
ܺଶ、ܺସ
3
43.507
0.195
0.095
14.422
J
ܺଷ、ܺସ
3
33.540
0.380
0.302
8.139
K
ܺଵ、ܺଶ、ܺଷ
一位資料分析師受託分析一組數據,想要了解一個特定基因,稱之
GT 基因,是否有影響老鼠斷奶時的重量。該分析師預計配適模型1
和模型2。
Y=斷奶時的重量(公克為單位)
X1=年齡(以日為單位)
X2=品種(品種A=1,B=0)
X3=GT 基因(有此基因=1,無此基因=0)
X4=性別(公老鼠=1,母老鼠=0)
模型1:
,
4
4
3
3
2
2
1
1
0
i
i
i
i
i
i
X
X
X
X
Y
ε
β
β
β
β
β
+
+
+
+
+
=
模型2:
,
2
1
22.277
0.588
0.506
3.041
L
ܺଵ、ܺଶ、ܺସ
4
24.694
0.543
0.452
4.564
M
ܺଵ、ܺଷ、ܺସ
4
23.862
0.559
0.470
4.040
N
ܺଶ、ܺଷ、ܺସ
4
31.562
0.416
0.300
8.893
O
ܺଵ、ܺଶ、ܺଷ、ܺସ
4
4
3
3
2
2
1
1
0
i
i
i
i
i
i
i
i
X
X
X
X
X
X
Y
ε
β
β
β
β
β
β
+
+
+
+
+
+
=
請使用圖4 和圖5 中部分統計電腦套裝軟體輸出變異數分析
(ANOVA, Analysis of Variance)回答下列問題:
請計算模型1 和模型2 的調整的複判定係數R2(the adjusted
R-squared)。試述其意義,並判斷何種模型為佳。(8 分)
在顯著水準5%下,請檢定「GT 基因」在模型1 中是否影響老鼠的
重量?(4 分)
請解釋在考慮模型1 下,請說明如何檢定老鼠的性別之兩條迴歸線
是相同的迴歸線。並請列出虛無假設、對立假設、檢定統計量及決
策法則。(4 分)
在顯著水準5%下,請檢定X1i X2i 相乘項在模型2 中是否對解釋反
應變數Y 有顯著貢獻?請試述虛無假設、檢定統計量之值、決策法
則和結論,以及所需要之假設。請解釋X1i X2i 該項在迴歸模型的意
義。(12 分)
圖4 模型1 的變異數分析
圖5 模型2 的變異數分析
22.212
72
0.589
0.4
5.000
表中p 為各模型中迴歸係數的個數,ܵܵܧ為該模型下所得的誤差平方和(error sum of
squares),ܴଶ為其判定係數(coefficient of determination),ܴ,
ଶ為調整的判定係數
(adjusted oef cient of determination),ܥ為Mallows’ ܥ criterion。
c
fi
一、若由ܺଶ與ܺଷ的散布圖判斷,該圖中可能有一個離群值。請將該離群值排除後,
重新計算ܺଶ與ܺ相關係數。(10 分)
下列問題皆在顯著水準為0.05 下,進行統計假設檢定:
ଷ
二、檢定模型A
ଵ的迴歸係數是否為0?(10
)
(下列的問題皆是在無離群值存在的狀況下作答。)
的ܺ
分
,寫
分
檢定
是否
0 分)
四、若SSReg(ܺ|ܺ)代表給定ܺ已在模型中,ܺ加入模型中的額外平方和(extra
sum of squares)。請分別計算SSReg(ܺଶ|ܺଵ)、SSReg(ܺଶ|ܺଷ)、SSReg(ܺଶ, ܺଷ|ܺଵ)、
SSReg(ܺଵ, ܺଶ|ܺଷ, ܺସ)。(12 分)
三、針對模型O
出其變異數
析表。
其迴歸係數
同時為0。(1
五、藉由迴歸估計結果及報表,詳細說明「就業者之教育程度結構-
專及以上」
(ܺଶ)此一變數對於粗出生率的影響,是否具統計顯著意義?(
分)
大
10