lawpalyer logo

統計 110 年迴歸分析考古題

民國 110 年(2021)統計「迴歸分析」考試題目,共 9 題 | 資料來源:考選部

0 題選擇題 + 9 題申論題

下表為中華民國110 年10 月底人口數、性別比例及人口密度統計表。 縣市 土地面積 (平方公里) 人口數 性別比例(每百女 子所當男子數) 人口密度(每平 方公里人口數) 總計 男 女 新北市 2,052.57 4,014,869 1,960,442 2,054,427 95.43 1,956.02 臺北市 271.7997 2,538,299 1,208,385 1,329,914 90.86 9,338.86 桃園市 1,220.95 2,272,663 1,125,386 1,147,277 98.09 1,861.38 臺中市 2,214.90 2,815,477 1,382,072 1,433,405 96.42 1,271.15 臺南市 2,191.65 1,864,799 928,682 936,117 99.21 850.86 高雄市 2,951.85 2,749,293 1,355,140 1,394,153 97.20 931.38 宜蘭縣 2,143.63 451,175 227,222 223,953 101.46 210.47 新竹縣 1,427.54 574,806 293,417 281,389 104.27 402.66 苗栗縣 1,820.31 538,940 277,786 261,154 106.37 296.07 彰化縣 1,074.40 1,257,033 638,686 618,347 103.29 1,169.99 南投縣 4,106.44 485,983 248,298 237,685 104.47 118.35 雲林縣 1,290.83 671,182 346,966 324,216 107.02 519.96 嘉義縣 1,903.64 494,293 256,417 237,876 107.79 259.66 屏東縣 2,775.60 805,717 410,328 395,389 103.78 290.29 臺東縣 3,515.25 213,718 109,715 104,003 105.49 60.80 花蓮縣 4,628.57 321,971 162,726 159,245 102.19 69.56 澎湖縣 126.8641 106,147 54,656 51,491 106.15 836.7 基隆市 132.7589 364,766 181,861 182,905 99.43 2,747.58 新竹市 104.1526 452,844 223,672 229,172 97.60 4,347.89 嘉義市 60.0256 265,208 128,102 137,106 93.43 4,418.25 金門縣 151.656 141,180 70,367 70,813 99.37 930.92 連江縣 28.8 13,516 7,822 5,694 137.37 469.31 若性別比例為X,人口密度為Y,且∑ܺ=2,256.69、∑ܻ=33,358.11、 ∑ܺଶ=233,202.3、∑ܻଶ=147,581,075 及∑ܻܺ=3,226,744,計算性別比例 與人口密度之相關係數。(10 分)
某地區房屋成交紀錄包括了房價及坪數等資訊共70 筆,以坪數為預 測變數,簡單線性迴歸預測房價的殘差顯示,變異數並不是常數,如 圖1-1: 圖1-1轉換前殘差圖 圖1-2轉換後殘差圖 將資料依房價排序後,每5筆計算房價平均數及標準差,並分別取其自然 對數(LN)值,共14筆,其敘述性統計及相關係數如表1-1a、1-1b。 表1-1a 敘述統計 個數 平均數 標準差 房子坪數 70 57.7 22.5 房價 70 4197207.0 2574255.1 平均房價 14 6191190.0 3441255.7 房價標準差 14 3383348.3 2156645.7 LN(平均房價) 14 15.471 .640 LN(房價標準差) 14 14.809 .729 有效的N(完全排除) 14 表1-1b 相關 房子 坪數 房價 平均 房價 房價 標準差 LN(平均 房價) LN(房價 標準差) 房子坪數 Pearson 相關 個數 1 70 .859** 70 .379 14 .279 14 .469 14 .368 14 房價 Pearson 相關 個數 .859** 70 1 70 .975** 14 .772** 14 .984** 14 .803** 14 平均房價 Pearson 相關 個數 .379 14 .975** 14 1 14 .766** 14 .951** 14 .785** 14 房價標準差 Pearson 相關 個數 .279 14 .772** 14 .766** 14 1 14 .779** 14 .973** 14 LN (平均房價) Pearson 相關 個數 .469 14 .984** 14 .951** 14 .779** 14 1 14 .811** 14 LN (房價標準差) Pearson 相關 個數 .368 14 .803** 14 .785** 14 .973** 14 .811** 14 1 14 **.在顯著水準為0.01 時(雙尾),相關顯著。 運用上述資訊,Box-Cox 轉換函數進行房價轉換後,以坪數預測房價 轉換的殘差,如圖1-2,迴歸模式的變異數分析表及係數預測的推論 如表1-2a、表1-2b。 表1-2a Anovaa 模式 平方和 df 平均平方和 F 顯著性 1 迴歸 17.418 1 17.418 262.236 .000b 殘差 4.517 68 .066 總數 21.935 69 a.依變數:房價轉換 b.預測變數:(常數),房子坪數 表1-2b 係數a 模式 未標準化係數 標準化 係數 t 顯著性 相關 B 之 估計值 標準 誤差 Beta 分配 零階 偏 部分 1 (常數) 13.803 .085 161.874 .000 房子 坪數 .022 .001 .891 16.194 .000 .891 .891 .891 a.依變數:房價轉換 請運用表1-1a、1-1b 的資訊,說明將使用的統計方法,並提出您建 議的Box-Cox 轉換函數為何?(20 分) 轉換後的模式適切性,有那些假設需要驗證?圖1-2 可以驗證那一 項假設?(10 分) 假設轉換後的模式適切性完全符合,請運用表1-2a、表1-2b 的資 訊,寫出房子坪數對房價轉換的預測模式,並依照您在第題的建 議,改寫出房子坪數對於房價的預測模式,並說明坪數每增加一單 位對房價的影響。(10 分)
依題一的資料,以人口密度作為反應變數,其他皆為解釋變數進行迴歸 模型分析,得到以下參數估計結果: Estimate Std error (Intercept) 10,890.376 3,076.995 土地面積 -0.550 0.178 人口數總計 0.053 0.0101 人口數男 -0.110 0.022 人口數女 NA NA 性別比例 -76.789 28.760 參數估計表中之「NA」表示估計結果是不可得到的;詳述「人口數女」 之參數估計結果為「NA」之原因。(5 分) 詳述「土地面積」之迴歸係數估計值的意義。(5 分) 在顯著水準為0.01 下,檢定各解釋變數之顯著性;並依此結果決定那 些變數可被剔除。(10 分)
某研究團隊隨機觀察兩歲內男童的月齡(Month)與體重(weight) 的數據共125 筆,0~24 月齡各5 筆。月齡vs 體重的散布圖如下。 研究團隊考慮以月齡的4 次多項式迴歸模式來預測體重。預測變數為 中心化月齡(ݔ= Month_c = Month −mean(Month)),考慮一~四 次多項式模式,如下: M1:weight = ߚ଴+ ߚଵݔ+ ε M2:weight = ߚ଴+ ߚଵݔ+ ߚଶݔଶ+ ε M3:weight = ߚ଴+ ߚଵݔ+ ߚଶݔଶ+ ߚଷݔଷ+ ε M4:weight = ߚ଴+ ߚଵݔ+ ߚଶݔଶ+ ߚଷݔଷ+ ߚସݔସ+ ε 各模式的變異數分析表如下: 在5%的顯著水準下,請依序檢定下列虛無假說,ܪ଴ଶ:ߚଶ= ߚଷ= ߚସ= 0、ܪ଴ଷ:ߚଷ= ߚସ= 0、ܪ଴ସ:ߚସ= 0,直到不拒絕ܪ଴௜,以確定 多項式迴歸模式的最高次為何。(30 分)(提示:若拒絕 ܪ଴௜, ݂݋ݎ݈݈ܽ݅≤ܽ,且不拒絕ܪ଴௜, ݂݋ݎ݈݈ܽ݅> ܽ,則多項式模式最高 次為ܽ) 請根據上述結果寫出多項式預測模式,並預測月齡為10 月的男童 體重,假設月齡為10 月的男童體重估計變異數為 2 ˆ ( ) 0.298 s Y  ,請 求出該男童體重的95%預測區間。(15 分) 由於每個月齡都有5 筆資料,純誤差平方和(pure error sum of square, SSPE)為25.54,請根據的結果,在5%的顯著水準下, 完成該模式適合度檢定(test for lack of fit)。(15 分) 平方和 df 平均平方和 F 顯著性 M1 迴歸 567.658 1 567.658 1008.633 .000 殘差 69.224 123 .563 總數 636.883 124 M2 迴歸 594.740 2 297.870 862.311 .000 殘差 42.143 122 .345 總數 636.883 124 M3 迴歸 601.539
依題二的迴歸模型分析,得到以下變異數分析(Analysis of variance, ANOVA)表: Source of variation Degrees of freedom Sum of squares Mean square F Regression (1) (4) (6) (8) Error (2) 18,022,930 (7) Total (3) (5) 寫出ANOVA 表中(1)至(8)的值。(8 分) 計算判定係數R²及調整判定係數ܴ௔ଶ,並詳述兩者之意義與差異。(10 分) 下表為各解釋變數之變異膨脹因子(variance inflation factor,VIF): 土地面積人口數總計 人口數男 性別比例 VIF 1.178 2,876.474 2,870.672 1.341 詳述何謂VIF 及其值的意義。(12 分)
(1)
(6)
(2)
(7)
(3)
(1)
(8) 8 分
200.513 686.460 .000 殘差 35.344 121 .292 總數 636.883 124 迴歸 605.486
若SSR 表示迴歸平方和(sum of squares for regression) 詳述「額外的平方和(Extra sum of squares)」SSR(ܺଵ, ܺସ|ܺଶ, ܺଷ)的意 義。(5 分) 詳細推導 SSR(ܺଵ, ܺଶ, ܺଷ, ܺସ) = SSR(ܺଵ) + SSR(ܺଶ|ܺଵ) + SSR(ܺଷ|ܺଵ, ܺଶ) +SSR(ܺସ|ܺଵ, ܺଶ, ܺଷ)。(10 分)
151.371 578.540 .000 殘差 31.397 120 .262 總數 636.883 124 M4 ANOVA 標準化係數 B 之估計值 標準誤 Beta 分配 M1 month_c .296 .009 .944 31.759 .000 (常數) 9.356 .067 139.427 .000 M2 month_c .296 .007 .944 41.028 .000 Month_c2 -.010 .001 -.210 -9.125 .000 (常數) 9.887 .078 126.726 .000 M3 month_c .227 .017 .724 13.446 .000 Month_c2 -.010 .001 -.210 -9.805 .000 Month_c3 .001 .000 .240 4.456 .000 (常數) 9.887 .073 136.166 .000 M4 month_c .227 .016 .724 14.207 .000 Month_c2 .003 .003 .058 .802 .424 Month_c3 .001 .000 .240 4.708 .000 Month_c4 -9.787E-05 .000 -.279 -3.884 .000 (常數) 9.685 .086 112.476 .000 係數 未標準化係數 t 顯著性 Month_c Month_c Month_c2 Month_c Month_c2 Month_c3 Month_c Month_c2 Month_c3 Month_c4 (常數) (常數) (常數) (常數) 附表 ∞ ∞ F分配的百分位點 分子自由度 分 母 自 由 度 F0.05 v1, v2
若考慮一因子變異數分析有t 個處理,每個處理有r 個觀測值,其模型 表示如下: ܻ௜௝= ߤ+ ߬௜+ ߝ௜௝, i=1,2,…,t ,j=1,2,..,r , 其中ߤ為總平均數,߬௜為第i 個處理效應,ߝ௜௝是隨機誤差項。 若以線性迴歸模型 ܇= ܆઺+ ઽ 改寫上述一因子變異數分析模型,請定義܇,܆,઺及ઽ,並詳述其維度。 (10 分) 為統計推論之目的,說明隨機誤差項所需的假設。(5 分) 若欲檢定是否存在處理效應,請詳述此檢定之虛無假設、對立假設、 檢定統計量及其拒絕域。(10 分) t分配表 tα