對一組樣本資料(xi, yi), i = 1, ..., 200,配適一簡單線性迴歸模型
+
+
=
i
i
X
Y
1
0
β
β
,
C
其中 為i.i.d. N(0, σ2)。已知x1 = 0 且xi = 1 當2 ≤ i ≤ 100,令β0與β1之最小平方估計值
為
與
。試說明下列敘述為何是正確的:
0ˆβ
1ˆβ
i
C i
(0.99, y )及(x1, y1)必定位於樣本迴歸線上。(10 分)
(0, y1)必定位於樣本迴歸線上且殘差中至少有一取值為0。(10 分)
現有一實驗,取得有單一解釋變數與應變數之一組獨立數據
,
)
,
(
i
i y
x
n
i
,...,
1
=
,如下:
i
1
美國黃石國家公園為了協助旅客規劃其旅遊路線及行程,對其最受歡迎的景點老忠
實間歇泉,提供其噴泉時間的預測值。首先於1978 年至1979 年間蒐集了222 組數
據,將第k次噴泉的持續時間記為xk,用xk來預測yk。而yk 為第k+1 次噴泉爆發時間及
第k次噴泉爆發時間的間距。修正誤差項之相關性後,僅使用221 組數據,其迴歸
分析的結果如下:
ANOVA(Analysis of Variance)
變異來源
自由度
SS
MS
顯著值
迴歸
(a)
18975
18975
0.000
殘差
219
(b)
35.19
總和
220
(c)
Predictor
係數
標準誤
t 統計
顯著值
截距
(d)
1.428
23.75
0.000
X1
(e)
0.3822
23.22
0.000
試根據上述資料及電腦分析結果,回答下列問題:
試問分析結果的(a)至(e)及
2
221
1
)
(
∑=
−
k
k
y
y
和
之值為何?(9 分)
2
221
1
)
ˆ
(
∑=
−
k
k
k
y
y
試寫出樣本迴歸方程式、R2統計值及調整R2統計值。(9 分)
在α = 0.05 之下,請利用F 檢定及t 檢定判斷此樣本迴歸模式之顯著性?
(F0.05,1,219 = 3.8843,F0.05,1,220 = 3.8840,F0.025,1,219 = 5.0937,F0.025,1,220 =5.0934)請
寫出各檢定之虛無假設及對立假設並詳述理由。若您認為此樣本迴歸模式不合適,
請寫出您的建議模式。(7 分)
100 年特種考試地方政府公務人員考試試題
類 科: 統計
全一張
(背面)
ˆ
考慮以下數據(Yi, Xi), 1 ≤ i ≤ n,且Yi = Xi +
,其中X
i = i/50 且 為i.i.d. N(0, 1)之隨
機變數。當試著以下列3 個多項式迴歸模式來配適:
M1 : Yi = β10 +
M2 : Yi = β20 + β21Xi +
M3 : Yi = β30 + β31Xi + β32
2
i
X +
且以這3 個不同的線性迴歸模式中達到Mallow’s Cp 統計量最小者,做為最佳配適模
式。當用迴歸模式M來配適時,其Cp統計量如下:
n
M
dim
M
RSS
M
Cp
−
×
+
=
)
(
2
)
(
)
(
2
σ
於上式中,RSS(M)代表配適迴歸模式M 的殘差平方和,dim(M)代表迴歸模式M 的
未知參數個數。
以Cp為準則,請使用RSS(M1),RSS(M2),RSS(M3)此3 個統計量,寫出迴歸模式
M2被選取的條件。(6 分)
請描述相關於隨機變數RSS(M2)及隨機變數RSS(M3)的分配分別為何?(6 分)
請問迴歸模式M3被選取的機率為何?可用標準常態分配函數來表示。(10 分)
當RSS(M1) = 138.53,RSS(M2) = 102.93,RSS(M3) = 102.89 時,那個模型會被選取?
試說明理由。(3 分)
3
C 2
C
C
i
i
C i
C i
C i
9
10
11
12
xi
-3
-2
-1
-1
0
0
0
0
1
1
2
3
yi
2
6
14
9
15
14
13
17
12
16
16
13
擬以簡單線性迴歸模型
,
1
0
i
i
i
x
y
∈
+
+
=
β
β
n
i
,...,
1
=
,來描述上述應變數與解釋變數間
之迴歸關係,其中
1
0,β
β
均為未知,並假設
,
i
∈
n
i
,...,
1
=
,為i.i.d.
),
,0
(
2
σ
N
0
2 >
σ
亦
為未知。已知
,
,
。
147
12
1
=
∑=
i
i
y
2021
2
12
1
=
∑=
i
i
y
58
12
1
=
∑=
i
i
i
y
x
試寫出估計未知參數向量
之概似函數(likelihood function)。
(10 分)
T)
,
,
(
2
1
0
σ
β
β
θ =
試求θ 之最大概似估計量(maximum likelihood estimator),及
最小
平方估計量(least squares estimator)。(10 分)
T)
,
(
1
0 β
β
β =
試給出此迴歸分析之變異數分析表,及其
2
R 值。(10 分)
試求
之95%聯合信賴域(joint confidence region),並說明x 變數對
解釋y 之變異是否有幫助?(10 分)
T)
ˆ
,
ˆ
(
ˆ
1
0 β
β
β =
(
,
21
.7
9,1,
025
.0
=
F
94
.6
10
,1,
025
.0
=
F
,
48
.5
10
,2,
025
.0
=
F
,
96
.4
10
,1,
05
.0
=
F
,
12
.5
9,1,
05
.0
=
F
,
,
10
.4
10
,2
,
05
.0
=
F
65
.1
95
.0
=
z
,
96
.1
975
.0
=
z
)
二、某一工程師擬探討某機器之有效使用年限
)
(y 與使用頻率(x1)及其品牌類別間之關係。
使用頻率為每週多少小時,品牌類別共有三種,擬建立y 與二解釋變數間之線性迴
歸模型。
由於品牌類別屬於離散型數據,在進行迴歸分析前,三種品牌可以二指標變數
(indicator variables)
表之,如第一種品牌之
)
,
(
3
2 x
x
=
)
,
(
3
2 x
x
(0,0),試寫出其完
整定義
方式。(8 分)
)
,
(
3
2 x
x
根據
以及線性模型
T
x
x
x
x
)
,
,
(
3
2
1
=
∈
+
+
+
+
=
3
3
2
2
1
1
0
)
(
x
x
x
x
y
β
β
β
β
,試寫出:(12 分)
可比較品牌對有效使用年限是否有差異之假設檢定,i.e. H0 與H1 以
3
,...,
0
, =
i
iβ
表示為何?
可比較兩兩品牌間差異之假設檢定之H0 及H1。
模型中不考慮x1 與x2, x3 交互作用,其模型有何特性?
100年公務人員高等考試三級考試試題
類 科: 統計
全一張
(背面)
)
(
三、在一項有關體脂肪之研究中,收集到11 位健康女性之資料。擬探討應變數體脂肪
y ,與解釋變數手臂三頭肌皮摺厚度(x1)、臀圍(x2)及臂中圍(x3)之相關性。根據這
11 筆數據,在y 服從常態分布假設下,擬建立一y 與xi 間之線性模型
i
i
i
i
i
x
x
x
y
∈
+
+
+
+
=
3
3
2
2
1
1
0
β
β
β
β
首先得到以下x1, x2, x3 之相關矩陣(correlation matrix)
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
=
00
.1
03
.0
35
.0
03
.0
00
.1
94
.0
35
.0
94
.0
00
.1
R
試求
1
−
R ,並求各解釋變數之變異膨脹因子(variance inflation factors, VIF)之值。
(10 分)
說明xi 間是否有共線性(multicollinearity)?若有共線性,對建立上述模型有何
影響?(10 分)
完成下列變異數分析表(ANOVA table)。(10 分)
來源(Source)
平方和(SS)
自由度(df)
均方(MS)
F
迴歸(Regression)
202.59
x1
183.92
x2|x1
9.42
x3|x1, x2
9.25
誤差(Error)
28.79
總和(Total)
231.38
在
=
α
0.05 水準下檢定x2, x3 對解釋體脂肪多寡是否有幫助?(10 分)
即檢定
0
:
3
2
0
=
= β
β
H
v.s.
0
2 ≠
β
or
0
3 ≠
β
。
(
,
26
.7
6,2,
025
.0
=
F
54
.6
7,2,
025
.0
=
F
,
14
.5
6,2,
05
.0
=
F
,
74
.4
7,2,
05
.0
=
F
,
30
.4
2,
025
.0
=
t
,
,
365
.2
7,
025
.0
=
t
92
.2
2,
05
.0
=
t
,
895
.1
7,
05
.0
=
t
)