lawpalyer logo

統計 107 年迴歸分析考古題

民國 107 年(2018)統計「迴歸分析」考試題目,共 12 題 | 資料來源:考選部

0 題選擇題 + 12 題申論題

(請接第二頁) 107年公務人員高等考試三級考試試題 全五頁 第二頁 類 科: 統計 科 目: 迴歸分析 兩兩變數間的散布圖如下: Y X1 X2 X3 X4 (請接第三頁) 107年公務人員高等考試三級考試試題 全五頁 第三頁 類 科: 統計 科 目: 迴歸分析 下列為六個不同迴歸模型的估計結果: 估計值標準誤 截距項 5.7314 1.3622 ܺଶ 0.0605 0.0323 估計值標準誤 截距項12.5929 1.4054 ܺଷ -0.0552 0.0171 估計值標準誤 截距項11.3715 2.6355 ܺଶ 0.0185 0.0335 ܺଷ -0.0493 0.0205 估計值標準誤 截距項-36.3909 11.7069 ܺଵ 0.7256 0.2009 ܺଶ 0.0617 0.0247 估計值標準誤 截距項-25.9329 14.1083 ܺଵ 0.5948 0.2221 ܺଶ 0.0402 0.0296 ܺଷ -0.0251 0.0196 估計值標準誤 截距項-24.9931 15.3071 ܺଵ 0.5811 0.2394 ܺଶ 0.0472 0.0463 ܺଷ -0.0256 0.0205 ܺସ -0.2671 1.3228 (請接第四頁) 107年公務人員高等考試三級考試試題 全五頁 第四頁 類 科: 統計 科 目: 迴歸分析 下表為配適線性迴歸模型,不同 所得之模 選取準則的 。 變數 ܵܵܧ௣ 型 ܴ௣ ଶ 結果 ܴ௔,௣ ଶ 模型 模型中的變數 p ܥ௣ A ܺଵ
17 4.4513 3.5915 43 4.0670 3.2145 44 4.0617 3.2093 87 3.9506 3.1013 88 3.9493 3.1001 一、何謂多重共線性(multicollinearity)?多重共線性對估計結果有何 影響?如何偵測複迴歸模型中存在多重共線性?請詳述所需要的 判斷準則。(12 分) 一位分析師進行迴歸分析資料並配適複迴歸模型如(1)。 100 , ,1 , 7 7 1 1 0 " " = + + + + = i X X Y i i i i ε β β β (1) 所獲得初步結果如圖1。請用圖1 部分統計電腦套裝軟體輸出結 果,說明這位分析師所配適的模型是否合適?如果模型(1)不合 適,請說明原因並提供所有可以解決問題的方法。(10 分) 圖1 二、醫院分析師希望研究患者滿意度(Y)與患者年齡(X1,以年為單位), 疾病嚴重程度指數(X2)以及焦慮指數(X3)之間的關係。分析師隨 機選擇了46 名患者並收集了數據。請使用圖2 部分統計電腦套裝軟 體輸出結果來回答以下問題。 圖 2 請計算額外平方和(extra sum of squares) = ) , | (
(1)
(1)
(1) 10 分
34.310 0.365 0.328 6.625 B ܺଶ 2 44.836 0.171 0.122 13.260 C ܺଷ 2 33.557 0.379 0.343 6.150 D ܺସ 2 50.735 0.062 0.006 16.977 E ܺଵ、ܺଶ
1 2 X X X SSR ?(4 分) 假設這位分析師採用模型是 i i i i X X Y ε β β β + + + = 3 3 1 1 0 (2) 該分析師想知道在模型(2)之下,增加疾病嚴重程度指數(X2)此額 外變數,解釋其在顯著水準α=5%下是否有顯著的貢獻,並敘述對 立假設、檢定統計量之值、決策法則和結論。(8 分) 假設這位分析師採用模型是 i i i i i X X X Y ε β β β β + + + + = 3 3 2 2 1 1 0 (3) 請檢定疾病嚴重程度指數(X2)和焦慮指數(X3)兩個解釋變數是 否可以從模型(3)中刪除,也就是在已經有患者年齡(X1)解釋變數 之下,解釋變數X2 和X3 可否從模型中移除?請在顯著水準α=5% 檢定,並協助敘述對立假設、檢定統計量之值、決策法則和結論。 在本小題的檢定問題中,請試述需要作何假設,才能執行這些統計 檢定。(10 分) 三、一位分析師考慮對三組數據配適一個簡單迴歸模型 i i i X Y ε β β + + = 1 0 ,其中 0 β 、 1 β 為參數,ε 為隨機誤差,且假設其為 具均數0,標準差σ 之常態分配。 配適模型後,三組數據之殘差分析圖分別為3(a)、3(b)、3(c),請 分別說明配適迴歸模型是否恰當?若模型不合適或偏離模型假設 時,請指出不恰當之處並請提出修正的方法。(21 分) 在何種情況下,需要採用加權最小平方法(Weighted least squares) 估計未知的參數?請協助提供散佈圖和殘差圖說明。(7 分) 圖3(a) 標準化殘差時間序列圖(Standardized residuals vs. time) 圖3(b) 標準化殘差對預測值圖(Standardized residuals vs. ݕො௜) 圖3(c) 標準化殘差對預測值圖(Standardized residuals vs. ݕො௜)
(2)
(2) 8 分
(3)
(3) 10 分
24.695 0.543 0.486 2.565 F ܺଵ、ܺଷ 3 25.019 0.537 0.479 2.769 G ܺଵ、ܺସ 3 27.841 0.485 0.421 4.548 H ܺଶ、ܺଷ 3 32.928 0.391 0.315 7.754 I ܺଶ、ܺସ 3 43.507 0.195 0.095 14.422 J ܺଷ、ܺସ 3 33.540 0.380 0.302 8.139 K ܺଵ、ܺଶ、ܺଷ
一位資料分析師受託分析一組數據,想要了解一個特定基因,稱之 GT 基因,是否有影響老鼠斷奶時的重量。該分析師預計配適模型1 和模型2。 Y=斷奶時的重量(公克為單位) X1=年齡(以日為單位) X2=品種(品種A=1,B=0) X3=GT 基因(有此基因=1,無此基因=0) X4=性別(公老鼠=1,母老鼠=0) 模型1: , 4 4 3 3 2 2 1 1 0 i i i i i i X X X X Y ε β β β β β + + + + + = 模型2: , 2 1
22.277 0.588 0.506 3.041 L ܺଵ、ܺଶ、ܺସ 4 24.694 0.543 0.452 4.564 M ܺଵ、ܺଷ、ܺସ 4 23.862 0.559 0.470 4.040 N ܺଶ、ܺଷ、ܺସ 4 31.562 0.416 0.300 8.893 O ܺଵ、ܺଶ、ܺଷ、ܺସ
4 4 3 3 2 2 1 1 0 i i i i i i i i X X X X X X Y ε β β β β β β + + + + + + = 請使用圖4 和圖5 中部分統計電腦套裝軟體輸出變異數分析 (ANOVA, Analysis of Variance)回答下列問題: 請計算模型1 和模型2 的調整的複判定係數R2(the adjusted R-squared)。試述其意義,並判斷何種模型為佳。(8 分) 在顯著水準5%下,請檢定「GT 基因」在模型1 中是否影響老鼠的 重量?(4 分) 請解釋在考慮模型1 下,請說明如何檢定老鼠的性別之兩條迴歸線 是相同的迴歸線。並請列出虛無假設、對立假設、檢定統計量及決 策法則。(4 分) 在顯著水準5%下,請檢定X1i X2i 相乘項在模型2 中是否對解釋反 應變數Y 有顯著貢獻?請試述虛無假設、檢定統計量之值、決策法 則和結論,以及所需要之假設。請解釋X1i X2i 該項在迴歸模型的意 義。(12 分) 圖4 模型1 的變異數分析 圖5 模型2 的變異數分析
22.212 72 0.589 0.4 5.000 表中p 為各模型中迴歸係數的個數,ܵܵܧ௣為該模型下所得的誤差平方和(error sum of squares),ܴ௣ଶ為其判定係數(coefficient of determination),ܴ௔,௣ ଶ為調整的判定係數 (adjusted oef cient of determination),ܥ௣為Mallows’ ܥ௣ criterion。 c fi 一、若由ܺଶ與ܺଷ的散布圖判斷,該圖中可能有一個離群值。請將該離群值排除後, 重新計算ܺଶ與ܺ相關係數。(10 分) 下列問題皆在顯著水準為0.05 下,進行統計假設檢定: ଷ 二、檢定模型A ଵ的迴歸係數是否為0?(10 ) (下列的問題皆是在無離群值存在的狀況下作答。) 的ܺ 分 ,寫 分 檢定 是否 0 分) 四、若SSReg(ܺ௜|ܺ௝)代表給定ܺ௝已在模型中,ܺ௜加入模型中的額外平方和(extra sum of squares)。請分別計算SSReg(ܺଶ|ܺଵ)、SSReg(ܺଶ|ܺଷ)、SSReg(ܺଶ, ܺଷ|ܺଵ)、 SSReg(ܺଵ, ܺଶ|ܺଷ, ܺସ)。(12 分) 三、針對模型O 出其變異數 析表。 其迴歸係數 同時為0。(1 五、藉由迴歸估計結果及報表,詳細說明「就業者之教育程度結構- 專及以上」 (ܺଶ)此一變數對於粗出生率的影響,是否具統計顯著意義?( 分) 大 10
請詳細說明前述各模型選取準則的定義,包括ܵܵܧ௣、ܴ௣ଶ、ܴ௔,௣ ଶ及ܥ௣。並說明他 們在模型選取的判斷原則為何?(12 分)
在不同的p 下,請依各準則判斷其所得之最適模型。(12 分)
請決定一個影響粗出生率的最適迴歸模型,並說明理由。(6 分) 九、計算所得的最適迴歸模型的均方誤(MSE),並說明其意義。(6 分) 十、寫出線性迴歸模型之誤差項的假設。並針對誤差項的各項假設,分別提出一種 殘差分析的圖形,及說明在符合假設下各圖形應呈現的型態。(12 分) (請接第五頁) 107年公務人員高等考試三級考試試題 全五頁 第五頁 類 科: 統計 科 目: 迴歸分析 α tα