lawpalyer logo

統計 101 年迴歸分析考古題

民國 101 年(2012)統計「迴歸分析」考試題目,共 8 題 | 資料來源:考選部

0 題選擇題 + 8 題申論題

假定y表示公司產品一年銷售量。與y相關的變數(如廣告費用、人事成本等)有x1, x2,…, xp,我們考慮線性迴歸(Regression)模型: y = β0 + β1x1 +…+ βp xp + ε 其中ε服從常態分配。公司一資深經理認為,變數x2為x1的兩倍效力而x3又為x2的3 1 倍效力。請問當我們有n個觀察值(yi, xi1,…,xip), i = 1, …, n時,您要如何驗證這個經理 的說法是否正確(請說明您的假設)。(25 分)
若n=10, X =70, Yi=185, ∑ i ∑ ∑X =652,
假定我們有一線性迴歸模型: yi = ix′β + εi, i = 1, …, n 其中ε1,…, εn為iid隨機變數其平均數為0 及變異數為σ2。令 為 之預測值。 iyˆ iy 請問若ε1,…, εn不具有常態分配,那 =0 是否仍是對的。請驗證。(13 分) ∑ = − n i i i y y 1 ) ˆ ( 我們假設ε1,…,εn為iid N(0,1)的隨機變數。令ε 為ε1,…,εn的平均,請找出ε 的 )% 1( 100 α − 信賴區間。(12 分)
i ∑Y =3793, 2 i ∑XiY =1537,請計算 表中所列~的簡單線性迴歸的參數估計值與標準誤。(16 分) i 參數 估計值 標準誤 0 β 0 b =   1 β 1 b =   二、下表所列為四個自變數X1,X2,X3,X4的複迴歸問題,分別以其中一個為因變數, 而以其他三個為自變數時,所得到的判定係數R2。請計算~變異數膨脹因子 (Variance Inflation Factor, VIF)。(8 分) 因變數 判定係數R2 變異數膨脹因子VIF X1 0.0842  X2 0.9642  X3 0.1141  X4 0.5687 
我們考慮一個工業產品某一品質變數y,它滿足下面迴歸模型: n i x y i i i ,..., 1 , = + ′ = ε β 其中xi包含截距項的(p+1)向量且ε1,…,εn為iid N(0, σ 2)的變數。若有一向量xa想知道這 時對應變數ya的表現。我們重複觀察m次產生下面樣本模型: m j x y aj a aj ,..., 1 , = + ′ = ε β 其中 s aj′ ε 與 s i′ ε 獨立且具相同分配,令 ∑ = = m j aj a y m y 1 1 。 找出ya的 )% 1( 100 α − 信賴區間。(13 分) 令 β a a a x x y E ′ = ) | ( ,考慮假設 3 ) | ( : 0 = a a x y E H vs. ,請導出顯 著水準為α 的檢定。(12 分) 3 ) | ( : 1 > a a x y E H 101年特種考試地方政府公務人員考試試題 代號: 類 科: 統計 全一張 (背面) 31570
某公司受委託進行飲料公司飲料自動販賣機的定期維修。該公司發現自動販賣機的 每半個月維修費支出(Y:以元為單位),與自動販賣機之銷售量(X:以千元為 單位)密切相關,為進一步瞭解二者間之關係,隨機抽取若干台飲料自動販賣機, 記錄其每半個月維修費支出及銷售量金額,使用簡單線性迴歸模式進行分析。假設 取得之樣本為: i 1 2 3
令y表示嬰兒身高。一奶粉公司考慮如何選取對身高有益的元素(變數)。現有x1, x2, x3, x4四種變數供選取。若A, B為x1, x2, x3, x4的部分集合。我們令 ) , ( ) | ( B A MSE B A F = ) | ( B A MSR , 表示當B集合變數已在模型內時A集合變數的部分F(partial F)檢定統計量。 再令P(A|B)表示F(A|B)觀察值的P值。我們現在有下面P值: P(x1) = 0.03, P(x2) = 0.02, P(x3) = 0.01, P(x4) = 0.02 P(xi|x1) = 0.04, i = 2,3, P(x4|x1) = 0.01 P(xi|x2) = 0.02, i = 1,3, P(x4|x2) = 0.01 P(x1|x3) = 0.04, P(x2|x3) = 0.05, P(x4|x3) = 0.035 P(xi|x4) = 0.05, i = 1, 2, 3, P(xi|x1, x2) = 0.06, i = 3, 4 P(xi|x1, x3) = 0.07, i = 2, 4, P(xi|x1, x4) = 0.07, i = 2, 3 P(xi|x2, x3) = 0.06, i = 1, 4, P(xi|x2, x4) = 0.06, i = 1, 3 P(xi|x3, x4) = 0.06, i = 1,2 我們考慮Forward selection 選取變數。在下面問題請說明理由及每階段選取結果。 當α = 0.05 時,請找出選取的模型。(15 分) 當α = 0.03 時,請找出選取的模型。(10 分)
9 10 11 Xi 2.5 2.7 3.2 3.8 4.0 4.4 4.8 5.4 6.9 7.9 8.8 Yi 63 60 64 69 70 76 93 102 111 128 133 請利用最小平方法計算參數 與 之估計值。(10 分) 0 β 1 β 請計算判定係數R2之值。(5 分) 請計算參數 估計值 之估計標準誤(standard error)。(5 分) 1 β 1 b 101年公務人員高等考試三級考試試題 類 科: 統計 (請接第三頁) 全三頁 第二頁 四、若因變數Y和三個自變數X1,X2,和X3的複迴歸所得之ANOVA表如下: Source df SS Reg Res 3 18 1029.9 575.8 Total 21 1605.7 且參數估計值等表列如下: 參數 估計值 標準誤 p-value 型一SS 0 β 48.63 18.56 0.0173 113654 1 β -0.0258 0.172 0.8826 597.56 2 β -0.507 0.235 0.0445 1.57 3 β 1.237 0.337 0.0018 430.76 請計算檢定 E[Y]=β : H0 3 3 1 1 0 X β X β + + vs. Ha: E[Y]=β 3 3 2 2 1 1 0 X β X β X β + + + 之檢 定統計值。(3 分) 請計算檢定 E[Y]= : H0 1 1 0 X β β + vs. Ha: E[Y]= 3 3 2 2 1 1 0 X β X β X β β + + + 之檢定統計 值。(3 分) 次若Y對X3之迴歸的ANOVA表如下: Source df SS Reg Res 1 20 849.9  Total 21  請計算、及檢定 E[Y]=β : H0 3 3 0 X β + vs. Ha: E[Y]= 3 3 2 2 1 1 0 X β X β X β β + + + 之 檢定統計值。(6 分) 又若樣本數n=22,且因變數Y與自變數X1、X2、X3之複迴歸所得的相關係數矩陣如 下: Y X1 X2 X3 Y 1.0 -0.610 0.019 0.728 X1 1.0 -0.082 -0.703 X2 1.0 0.439 X3 1.0 請計算偏相關係數(partial correlation coefficients)rY1.2(3 分)和rY2.13(6 分)之 值。 五、若已知n=23,且算出 1 / ) X X ( −= ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ 74 .0 76 .0 34 .0 78 .2 76 .0 02 .1 47 .0 70 .1 34 .0 47 .0 33 .0 28 .1 78 .2 70 .1 28 .1 93 . 18 ,b= ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − 91 .3 94 .5 92 .1 73 .6 ,與 MSE=3.64 之線性複迴歸問題,則: 請以bonferroni 法計算 , 與 之94% 聯合信賴區間(simultaneous confidence intervals)。(12 分) 1 β 2 β 3 β 請計算 的96%信賴區間。(8 分) 3 2 1 β β 2β + + 101年公務人員高等考試三級考試試題 類 科: 統計 全三頁 第三頁 六、去年一年中,某市區裝有冷氣機的四層樓公寓頂樓住戶,平均月付電費(Y:單位 元)及每月平均溫度,但每月平均溫度分為低(10.0-15.0℃)、中(15.1-25.0℃) 和高(25.1℃以上)三級,得到紀錄如下表: 月份 1 2 3 4 5 6 月平均溫度 低 低 中 中 中 高 月電費:Y 1088 1107 1178 1288 1455 1981 月份 7 8 9 10 11 12 月平均溫度 高 高 高 中 中 低 月電費:Y 2370 2659 2577 1937 1553 1170 研究人員設法探究月平均溫度與月電費Y 之間的關係,考慮利用虛擬變數: ⎩ ⎨ ⎧ = = , 高, 若月平均溫度 otherwise ,0 ,1 Di1 ⎩ ⎨ ⎧ = = , 中, 若月平均溫度 otherwise ,0 ,1 Di2 建構並適配複迴歸模式: i i2 2 i1 1 0 i ε D β D β β Y + + + = ∀i=1, 2,..., 12 但在編寫電腦程式時,誤使用以月平均溫度為因子之單因子變異數分析模式,得到 下列之變異數分析表: Source df SS 處理 2 3,182,320.7 誤差 9 621,360.2 總和 11 3,803,680.9 請計算檢定 0 β β : H 2 1 0 = = 1 a β : H vs. 與 不全為0 的檢定統計值。(6 分) 2 β 請計算 , 與 之估計值。(9 分) 0 β 1 β 2 β (請接第三頁)