lawpalyer logo

統計 100 年迴歸分析考古題

民國 100 年(2011)統計「迴歸分析」考試題目,共 6 題 | 資料來源:考選部

0 題選擇題 + 6 題申論題

對一組樣本資料(xi, yi), i = 1, ..., 200,配適一簡單線性迴歸模型 + + = i i X Y 1 0 β β , C 其中 為i.i.d. N(0, σ2)。已知x1 = 0 且xi = 1 當2 ≤ i ≤ 100,令β0與β1之最小平方估計值 為 與 。試說明下列敘述為何是正確的: 0ˆβ 1ˆβ i C i (0.99, y )及(x1, y1)必定位於樣本迴歸線上。(10 分) (0, y1)必定位於樣本迴歸線上且殘差中至少有一取值為0。(10 分)
現有一實驗,取得有單一解釋變數與應變數之一組獨立數據 , ) , ( i i y x n i ,..., 1 = ,如下: i 1
美國黃石國家公園為了協助旅客規劃其旅遊路線及行程,對其最受歡迎的景點老忠 實間歇泉,提供其噴泉時間的預測值。首先於1978 年至1979 年間蒐集了222 組數 據,將第k次噴泉的持續時間記為xk,用xk來預測yk。而yk 為第k+1 次噴泉爆發時間及 第k次噴泉爆發時間的間距。修正誤差項之相關性後,僅使用221 組數據,其迴歸 分析的結果如下: ANOVA(Analysis of Variance) 變異來源 自由度 SS MS 顯著值 迴歸 (a) 18975 18975 0.000 殘差 219 (b) 35.19 總和 220 (c) Predictor 係數 標準誤 t 統計 顯著值 截距 (d) 1.428 23.75 0.000 X1 (e) 0.3822 23.22 0.000 試根據上述資料及電腦分析結果,回答下列問題: 試問分析結果的(a)至(e)及 2 221 1 ) ( ∑= − k k y y 和 之值為何?(9 分) 2 221 1 ) ˆ ( ∑= − k k k y y 試寫出樣本迴歸方程式、R2統計值及調整R2統計值。(9 分) 在α = 0.05 之下,請利用F 檢定及t 檢定判斷此樣本迴歸模式之顯著性? (F0.05,1,219 = 3.8843,F0.05,1,220 = 3.8840,F0.025,1,219 = 5.0937,F0.025,1,220 =5.0934)請 寫出各檢定之虛無假設及對立假設並詳述理由。若您認為此樣本迴歸模式不合適, 請寫出您的建議模式。(7 分) 100 年特種考試地方政府公務人員考試試題 類 科: 統計 全一張 (背面) ˆ
已知Y1 = α1 + ,Y2 = 2α1 − α2 + ,Y3 = α1 + 2α2 + ,其中 , 1 ≤ i ≤ 3 為i.i.d. N(0, σ2)。令 1 C 3 C C 1 C 2 α 及 2ˆα 為 1 α 及 2 α 的最小平方估計量。 當使用矩陣表達時,我們可得出下式: ⎜ ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ i C + ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ 2 1 3 2 1 X α α Y Y Y 1 C 試寫出矩陣X 及變數間是否有共線性。(8 分) 試求Cov( 1ˆα , 2ˆα )及Var( 1ˆα )。(7 分) 當使用F檢定,檢定H0 : α1 = α2 時,你需要的F分配表的自由度為何?(5 分) 當y1 = 1.8722,y2 = −0.4853,y3 = 4.5169 時, 1ˆα = 0.9031, 2ˆα = 1.0004,殘差平方 和RSS = 14.2495。在α = 0.05 時,請利用F檢定,檢定H0 : α1 = α2 vs H1 : α1≠α2。 (F0.05,1,1 =161.45,F0.05,1,2 = 18.51,F0.05,2,1 = 199.5)(10 分)
考慮以下數據(Yi, Xi), 1 ≤ i ≤ n,且Yi = Xi + ,其中X i = i/50 且 為i.i.d. N(0, 1)之隨 機變數。當試著以下列3 個多項式迴歸模式來配適: M1 : Yi = β10 + M2 : Yi = β20 + β21Xi + M3 : Yi = β30 + β31Xi + β32 2 i X + 且以這3 個不同的線性迴歸模式中達到Mallow’s Cp 統計量最小者,做為最佳配適模 式。當用迴歸模式M來配適時,其Cp統計量如下: n M dim M RSS M Cp − × + = ) ( 2 ) ( ) ( 2 σ 於上式中,RSS(M)代表配適迴歸模式M 的殘差平方和,dim(M)代表迴歸模式M 的 未知參數個數。 以Cp為準則,請使用RSS(M1),RSS(M2),RSS(M3)此3 個統計量,寫出迴歸模式 M2被選取的條件。(6 分) 請描述相關於隨機變數RSS(M2)及隨機變數RSS(M3)的分配分別為何?(6 分) 請問迴歸模式M3被選取的機率為何?可用標準常態分配函數來表示。(10 分) 當RSS(M1) = 138.53,RSS(M2) = 102.93,RSS(M3) = 102.89 時,那個模型會被選取? 試說明理由。(3 分) 3 C 2 C C i i C i C i C i
9 10 11 12 xi -3 -2 -1 -1 0 0 0 0 1 1 2 3 yi 2 6 14 9 15 14 13 17 12 16 16 13 擬以簡單線性迴歸模型 , 1 0 i i i x y ∈ + + = β β n i ,..., 1 = ,來描述上述應變數與解釋變數間 之迴歸關係,其中 1 0,β β 均為未知,並假設 , i ∈ n i ,..., 1 = ,為i.i.d. ), ,0 ( 2 σ N 0 2 > σ 亦 為未知。已知 , , 。 147 12 1 = ∑= i i y 2021 2 12 1 = ∑= i i y 58 12 1 = ∑= i i i y x 試寫出估計未知參數向量 之概似函數(likelihood function)。 (10 分) T) , , ( 2 1 0 σ β β θ = 試求θ 之最大概似估計量(maximum likelihood estimator),及 最小 平方估計量(least squares estimator)。(10 分) T) , ( 1 0 β β β = 試給出此迴歸分析之變異數分析表,及其 2 R 值。(10 分) 試求 之95%聯合信賴域(joint confidence region),並說明x 變數對 解釋y 之變異是否有幫助?(10 分) T) ˆ , ˆ ( ˆ 1 0 β β β = ( , 21 .7 9,1, 025 .0 = F 94 .6 10 ,1, 025 .0 = F , 48 .5 10 ,2, 025 .0 = F , 96 .4 10 ,1, 05 .0 = F , 12 .5 9,1, 05 .0 = F , , 10 .4 10 ,2 , 05 .0 = F 65 .1 95 .0 = z , 96 .1 975 .0 = z ) 二、某一工程師擬探討某機器之有效使用年限 ) (y 與使用頻率(x1)及其品牌類別間之關係。 使用頻率為每週多少小時,品牌類別共有三種,擬建立y 與二解釋變數間之線性迴 歸模型。 由於品牌類別屬於離散型數據,在進行迴歸分析前,三種品牌可以二指標變數 (indicator variables) 表之,如第一種品牌之 ) , ( 3 2 x x = ) , ( 3 2 x x (0,0),試寫出其完 整定義 方式。(8 分) ) , ( 3 2 x x 根據 以及線性模型 T x x x x ) , , ( 3 2 1 = ∈ + + + + = 3 3 2 2 1 1 0 ) ( x x x x y β β β β ,試寫出:(12 分) 可比較品牌對有效使用年限是否有差異之假設檢定,i.e. H0 與H1 以 3 ,..., 0 , = i iβ 表示為何? 可比較兩兩品牌間差異之假設檢定之H0 及H1。 模型中不考慮x1 與x2, x3 交互作用,其模型有何特性? 100年公務人員高等考試三級考試試題 類 科: 統計 全一張 (背面) ) ( 三、在一項有關體脂肪之研究中,收集到11 位健康女性之資料。擬探討應變數體脂肪 y ,與解釋變數手臂三頭肌皮摺厚度(x1)、臀圍(x2)及臂中圍(x3)之相關性。根據這 11 筆數據,在y 服從常態分布假設下,擬建立一y 與xi 間之線性模型 i i i i i x x x y ∈ + + + + = 3 3 2 2 1 1 0 β β β β 首先得到以下x1, x2, x3 之相關矩陣(correlation matrix) ⎟ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎜ ⎝ ⎛ = 00 .1 03 .0 35 .0 03 .0 00 .1 94 .0 35 .0 94 .0 00 .1 R 試求 1 − R ,並求各解釋變數之變異膨脹因子(variance inflation factors, VIF)之值。 (10 分) 說明xi 間是否有共線性(multicollinearity)?若有共線性,對建立上述模型有何 影響?(10 分) 完成下列變異數分析表(ANOVA table)。(10 分) 來源(Source) 平方和(SS) 自由度(df) 均方(MS) F 迴歸(Regression) 202.59 x1 183.92 x2|x1 9.42 x3|x1, x2 9.25 誤差(Error) 28.79 總和(Total) 231.38 在 = α 0.05 水準下檢定x2, x3 對解釋體脂肪多寡是否有幫助?(10 分) 即檢定 0 : 3 2 0 = = β β H v.s. 0 2 ≠ β or 0 3 ≠ β 。 ( , 26 .7 6,2, 025 .0 = F 54 .6 7,2, 025 .0 = F , 14 .5 6,2, 05 .0 = F , 74 .4 7,2, 05 .0 = F , 30 .4 2, 025 .0 = t , , 365 .2 7, 025 .0 = t 92 .2 2, 05 .0 = t , 895 .1 7, 05 .0 = t )