lawpalyer logo

統計 103 年迴歸分析考古題

民國 103 年(2014)統計「迴歸分析」考試題目,共 14 題 | 資料來源:考選部

1 題選擇題 + 13 題申論題

考慮簡單線性迴歸模型如下: x x X Y E 1 0 ) | (     (1) 若解釋變數X 的值替代為Z=aX+b,a≠0 且b 為常數,則模型(1)改寫為: z z Z Y E 1 0 ) | (     (2)  請比較 0 與 0 、 1 與1 的關係。(10 分) 請問模型 (1)與模型(2)的判定係數是否改變?(回答是或否即可)(2 分)
(1)
(1)
(2) 10 分
(1)
(2) 2 分
014.0616.1341.2ˆxxy及變異數分析(ANOVA)表SourceSum of SquaresdfFPR>FModel5550.8 (A) (D)0.000Error (B) (C)Corrected Total5784.5試填入ANOVA 表中(A)、(B)、(C)和(D)內之數字。(5 分)試問上述迴歸模型是否顯著(α = 5%)?(5 分)若X 為資料中之設計矩陣(design matrix),且 000001.000004.0-00008.0-00004.0-0027.000445.0-00008.0-00445.0-1132.0)(1XX試檢定jiHH:vs.:1 > 答案:?
若反應變數為Y,解釋變數為 j X ,j=1,2,..,p,及n 個觀測值。考慮線性迴歸模型如下: i ip p i i i X X X Y             2 2 1 1 0 , i=1,2,…,n (3) 其中 i為均數是0,變異數是 2 的隨機誤差項。若將模型(3)以向量及矩陣方式 表達如下:   X Y (4)  請分別定義Y、X、β 及ε 之向量及矩陣之表達式,並標示其行與列的大小。(8 分)  試求模型(4)中,β 的最小平方估計式。(10 分) 證明題所得的 最小平方估計式為不偏的。(5 分)  若欲求得β 的最大概似估計式,需對誤差ε 有如何的假設?(2 分)
(3)
(3)
(4) 8 分
(4) 10 分
100,任意2,1,0,ji;i 不等於j。請寫出檢定統計量之分布和自由度(α = 5%)。(臨界值(critical value)= 3.44。)(15 分)二、迴歸模型中解釋變數間若存在共線性(multicollinearity)對估計結果影響甚鉅。變異數膨脹因子(variance inflation factor, VIF)是判斷共線性的一個指標。VIF 之意涵為何?試說明VIF 和共線性的關係。(10 分)某組資料有5 個解釋變數x1, x2, x3, x4, x5 所得迴歸係數估計結果如下:VariablebjseVIFIntercept0.8300.318x1-0.0120.647(0.002)-1x20.1990.483(0.001)-1x3-0.1170.178(0.010)-1x4-0.3670.294(0.008)-1x50.1860.147(0.009)-1其中jb 為迴歸係數j之估計值,se 為其標準誤。試評估解釋變數中是否存在共線性?(5 分)103年公務人員高等考試三級考試試題全一張(背面)三、在有三個解釋變數之一組資料配適迴歸模型後,得到所有部分集合之變數選擇(allpossible subsets selection)結果如下(jb 為迴歸係數j之估計值):p-1R2Cpb0b1b2b310.03275.450.770.32510.70511.850.271.36110.70711.67-0.361.10320.7598.79-0.29-0.4631.25520.8083.12-0.190.7810.63320.8302.03-0.930.6551.487 > 答案:?
表一為民國101 年縣市有關教育的資料(最後兩列分別為各變數值的加總與平方後 之加總),圖一為其對應之兩兩變數散布圖矩陣(Scatter matrix),表二為這些變 數之變異共變異矩陣(Variance-covariance matrix)。若考慮 3 X 及
0.8314.00-0.120.7371.589-0.094何謂Cp,試說明其意義。(10 分)由表中結果來看,最佳模型為何?為什麼?(10 分)四、下述資料為某幼稚園自80 年後至90 年之幼童入學學費。年8182838485868788899080 年後之年分, x123 > 答案:?
X 放入模型中, 表三為其估計結果。表四為僅考慮 4 X 放入模型中的估計結果。 以題二中迴歸模型(4)的表達方式,表五為僅考慮 3 X 在模型中 1 ) (  X X T 與 ) ( Y X T 的結果(上標T 代表矩陣的轉置)。 請回答下列問題:  在Y 與 1 X 的散布圖中,可看到一個明顯的離群值(Outlier),請說明為那一個縣 市?(2 分)  請計算所有變數之兩兩變數間的相關係數矩陣(Correlation matrix)。(10 分) (請接第二頁) 103年特種考試地方政府公務人員考試試題 全五頁 第二頁  若將題 中所發現的離群值排除後,再計算Y 與 1 X 的相關係數。另外,若將該離 群值排除,已知不會影響 3 X 及 4 X 的相關係數。請建議後續統計分析(包含迴歸 分析)該如何處理此一離群值。(6 分)  請說明表三中三個「t statistic」的意義,及其值與所對應之p value 所代表之結論。 (6 分)  請說明表三中「Residual standard error」的意義。(5 分)  請說明表三中「F-statistic」的意義,及其值與所對應之p value 所代表之結論。 (5 分)  請比較題 及題 的結論是否一致?無論一致與否,皆請說明為何能有這樣的結 果。(5 分)  表三與表四中所得到 4 X 的迴歸係數估計皆為正的,是否可說明「國中生視力不 良率愈高,大專以上學歷所占比例愈高;高視力不良率可提升國民的教育程度, 因此視力不良率很高不是一件不好的事。」請評論引號中的話。(5 分)  請說明為何表四的「Multiple R-squared」比表三的值小,但表四的「Adjusted R-squared」卻比表三的值大。(5 分)  僅考慮 3 X 在模型中的簡單線性迴歸模型,請計算其截距與斜率的估計值。(6 分)  若考慮下列三個模型:         4 41 3 31 01 X X Y       3 32 02 X Y       4 43 03 X Y 那一個模型為最適模型?請寫出理由及所根據的準則。(8 分) (請接第三頁) 103年特種考試地方政府公務人員考試試題 全五頁 第三頁 表一 15 歲以上民間人 口之教育程度結 構-大專及以上 (Y,%) 平均每一教師 教導學生數- 國小 ( 1 X ) 平均每一教師 教導學生數- 國中 ( 2 X ) 視力不良率- 國小 ( 3 X ,%) 視力不良率- 國中 ( 4 X ,%) 新北市 37.9 15.0 14.4 54.6 77.6 臺北市 63.3 12.8 12.7 52.4 78.1 臺中市 39.0 16.3 14.0 53.4 78.1 臺南市 34.9 15.9 14.6 49.6 75.9 高雄市 37.6 16.0 14.0 51.2 74.1 宜蘭縣 29.2 13.6 13.4 43.3 68.2 桃園縣 35.1 17.1 14.3 49.5 74.1 新竹縣 34.8 15.2 12.8 47.0 70.1 苗栗縣 27.1 12.9 12.1 43.9 67.2 彰化縣 28.1 16.0 14.5 52.7 79.6 南投縣 27.7 11.8 13.1 41.4 66.8 雲林縣 24.7 13.5 13.8 44.9 65.8 嘉義縣 22.9 12.1 12.8 41.5 67.4 屏東縣 27.0 13.5 14.6 38.9 61.2 臺東縣 19.4 9.5 11.8 31.1 55.1 花蓮縣 29.4 10.9 12.3 36.6 59.5 基隆市 35.1 14.8 12.5 53.0 74.4 新竹市 46.1 16.7 13.2 49.7 73.3 嘉義市 49.8 17.5 14.7 54.0 78.7 總和 649.1 271.1 255.6 888.7 1345.2 平方和 24124.55 3957.55 3454.52 42366.01 96138.94 表二 (請接第四頁) Y 1 X 2 X 3 X 4 X Y 108.29 11.24 1.91 47.15 49.93 1 X 11.24 4.97 1.50 12.37 12.70 2 X 1.91 1.50 0.89 3.36 3.65 3 X 47.15 12.37 3.36 44.35 45.79 4 X 49.93 12.70 3.65 45.79 49.93 103年特種考試地方政府公務人員考試試題 全五頁 第四頁 表三 Estimate Std Err t statistic p value Intercept -26.12 29.4966 -0.886 0.389 3 X 0.58 1.2380 0.468 0.646 4 X 0.47 1.1667 0.402 0.693 Residual standard error: 8.048 on 16 degrees of freedom Multiple R-squared: 0.4683, Adjusted R-squared: 0.4018 F-statistic: 7.046 on 2 and 16 DF, p-value: 0.006388 表四 Estimate Std Err t statistic p value Intercept -36.63 18.6525 -1.964 0.06611 4 X 1.00 0.2622 3.813 0.00139 Residual standard error: 7.861 on 17 degrees of freedom Multiple R-squared: 0.461, Adjusted R-squared: 0.4293 F-statistic: 14.54 on 1 and 17 DF, p-value: 0.00139 表五 1 ) (  X X T Intercept 3 X Intercept 2.7933940 -0.0585962 3 X -0.0585962 0.0012528 T TY X ) ( = (649.1 31209.5) (請接第五頁) 103年特種考試地方政府公務人員考試試題 全五頁 第五頁 Y 10 12 14 16 35 40 45 50 55 20 30 40 50 60 10 12 14 16 x1 x2 12.0 13.0 14.0 35 40 45 50 55 x3 20 30 40 50 60 12.0 13.0 14.0 55 60 65 70 75 80 55 60 65 70 75 80 x4 圖一
(4) 2 分
> 答案:?
> 答案:?
> 答案:?
> 答案:?
> 答案:?
> 答案:?
學費(千元), y6.16.87.58.59.310.511.512.625 13.975 14.975由(xy,)之散布圖(scatter plot)發現y 和x 的關係較接近xey。欲得一線性模型,須將y 作何轉換(transformation)?試寫出轉換後的模型。(10 分)令iz 為反應變數iy 轉換後的值,且686.133783.22101101iiiiizxz,。試求α 和β 的最小平方估計量(least square estimate)。(10 分)根據之結果,預測100 年時該幼稚園之幼童入學學費。(10 分)五、假設(ii xy ,)滿足niεxxyiippii,...,1110,。令jb 為迴歸係數j之最小平方估計量,pj,...,1,0。著名的高斯-馬可夫(Gauss-Markov)定理是對pjjjl0之估計有興趣,其中pll ...,,0是已知的實數。試敘述Gauss-Markov定理及其假設條件。(10分) > 答案:?