lawpalyer logo

經建行政 114 年統計學考古題

民國 114 年(2025)經建行政「統計學」考試題目,共 16 題 | 資料來源:考選部

0 題選擇題 + 16 題申論題

藉由過去數年的資料蒐集與分析,某段道路發生交通事故的次數,為 每星期平均2 次的卜瓦松分配(Poisson distribution)。試問:(計算 至小數點後4 位)(每小題10 分,共20 分) 在12 月第一個星期的時間內,此段道路上發生2 次及2 次以上交 通事故之機率。 在12 月最後二個星期的時間內,此段道路上發生1 次及1 次以下 交通事故之機率。
某研究者以樣本數 20 n  的資料建立了一個迴歸模型,已知依變數Y 的 樣本變異數為
假設X 與Y 的二元機率密度函數為(每小題4 分,共20 分) f(x, y)= C(x+2y) 0≦x ≦1; 0 ≦y ≦1 =0 其他 計算C 值。 計算X 的期望值。 計算機率P(X>0.5)。 計算Y 的期望值。 計算Y 大於1/3 的機率。
依據調查,臺灣18 歲以下青少年近視比率為87.2%。若對全國18 歲 以下青少年進行簡單隨機抽樣,試回答下列問題: 隨機抽取8 人,隨機變數X 代表近視的人數,寫出X 的機率分配 函數。(6 分) 承,計算會抽到超過2 人為近視的機率(亦即P(X > 2))。(6 分) 隨機抽取1000 人,剛好880 人為近視的機率(請以常態分配機率 近似)。(12 分) 若隨機變數Y 為抽到第十位為近視者的人數,寫出Y 的機率分配 函數。(6 分) 31920 50620
10.53 ys  ,且該模型的殘差平方和(Sum of Squared Errors) 為SSE 30  。 請說明如何利用這些已知的資訊計算出判定係數(Coefficient of Determination) 2 0.85 R  ,並請解釋判定係數所代表的統計意涵。(10 分) 一般而言,若模型能解釋約85%的變異,常被認為是「非常好」的模 型。請就「擬合程度」、「解釋性」與「預測性」三個面向加以討論, 說明高 2 R 並不必然代表模型具有良好的整體表現。(10 分) 二、某疾病在一般族群中的盛行率(發生率)為1%。某快速檢驗的敏感度 (即確實患病者被檢測為陽性的機率)為95%,特異度(即未患病者被檢 測為陰性的機率)為90%。請回答下列問題: 當檢驗結果呈陽性時,個體實際罹患該疾病的條件機率(即「陽性預 測值」,Positive Predictive Value, PPV)為何?請說明完整的計算過程, 並給出具體數值結果。(10 分) 在此例中,若政府大量採用此快速檢驗作為篩檢工具,雖具有快速與 低成本的優點,但也可能導致高誤判率與高社會成本。請具體說明造 成此現象的統計原因,並討論若採用此快速檢驗兩次(兩次都陽性才 認定為陽性),是否能有效降低誤判與社會成本,並說明原因。(10 分) 13450
三家A、B、C 品牌之洗衣機用戶,各隨機抽取400、600 和800 人, 調查其下次會再買同一品牌洗衣機之意願。調查數據如下: 意願\品牌 A B C 願意 100 300 600 不願意 300 300 200 總和 400 600 800 請檢定三家用戶下次購買相同品牌之洗衣機比例是否全部相等。 ⑴列出虛無假設H0 和對立假設H1。(3 分) ⑵寫出檢定統計量及其在H0 為真下的分配。(5 分) ⑶以臨界值方法決定檢定結果。顯著水準為0.05。(3 分) ⑷計算p 值,並據以決定檢定結果。顯著水準為0.05。(5 分) 若只有A 和B 兩種品牌,請檢定A 和B 品牌用戶下次購買相同品 牌的比例是否相等。 ⑴列出H0 和H1。(3 分) ⑵請使用和不同的檢定統計量,寫出其在H0 為真下的分配。請 說明何以為此分配。(6 分) ⑶計算p 值,並據以決定檢定結果。顯著水準為0.05。(5 分) 23320 23420
下表是全國姓名統計前五大姓氏(及其他)的全國占比,及從臺北市 隨機抽取2694 人,其姓氏之分布情形。 姓氏 全國比例(%) 臺北市(人) 陳 11.21 304 林 8.33 217 黃 6.00 143 張 5.30 147 李 5.13 146 其他 64.03 1737 總計 100.00 2694 試問: 建構臺北市姓氏為陳者的母體比例之99%區間估計。(8 分) 在顯著水準為0.05 下,檢定臺北市姓氏為黃者的母體比例是否小於 全國姓氏為黃者的比例。(10 分) 在顯著水準為0.05 下,檢定臺北市各姓氏的比例是否與全國各姓氏 的比例一致。(12 分)
政府想知道年資超過10 年的計程車司機月收入是否高於4.9 萬。隨機抽 取年資超過10 年的資深司機20 位,月收入(萬元)如下(已由小到大): 2.16, 2.54, 2.78, 3.62, 3.88, 4.26, 4.70, 4.80, 4.92, 5.00, 5.08, 5.54, 6.02, 6.12, 6.46, 6.66, 6.94, 7.76, 8.06, 11.00 請根據上述數據,以 0.05  的顯著水準,討論並完成下列分析與檢定: 若接受資料為近似常態,現欲採用母體平均數檢定: 0 : 4.9 H  , : 4.9 a H  直觀而言,我們以樣本平均X 作為母體平均數的估計,因此可設 { } X c  為拒絕域。請給出c 的明確式子(包含樣本變異數 2 S 、樣本數 以及分布分位數),並說明其原理。接著,利用本資料判定此拒絕域是 否成立,即是否拒絕 0 : 4.9 H  。(20 分) 若資料分布明顯偏離常態,可考慮採中位數m 檢定(sign test): 0 : 4.9 H m  , : 4.9 a H m  請說明此檢定所使用的統計量、p 值的計算,並就本資料說明是否拒 絕 0 H 。(20 分)
工程師想知道供應商生產的電池平均壽命是否小於240 小時。隨機 抽取電池36 件(n=36),其樣本平均值為235 小時。 假設電池壽命服從常態分配且母體標準差為12 小時。 請檢定電池平均壽命是否低於240 小時。顯著水準為0.1。(5 分) 續上題,寫出檢定統計量分配的拒絕區之臨界值,並寫出此臨界值 對應之樣本平均值。(4 分) 若真實的電池壽命平均值分別為236 和235 小時,請分別計算他 們的型II 誤差機率及檢定力。(8 分) 若只有隨機抽取的電池改為100 件(n=100),其他不變。若真實的 電池壽命平均值分別為236 和235 小時,請分別計算他們的型II 誤差機率及檢定力。顯著水準為0.1。(8 分)
某縣政府想評估四種流程(A、B、C、D 表示之)辦理某一業務的效 率,在申請該項業務的民眾中,各隨機抽取6 位民眾至每一種流程, 觀測其完成程序所需的時間,彙整於下表: 辦理流程 程序完成所需時間(分) 平均 標準差 A 132.0 21.10 B 141.5 19.89 C 149.0 6.22 D 151.5 7.14 在顯著水準為0.05 下,檢定各辦理流程完成程序的平均所需時間是 否相等。(15 分) 詳細說明進行之分析所需的假設。(5 分) 31920 50620 卡方分配表 Table of the Chi-square Distribution 31920 50620 標準常態分配表 31920 50620 F 分配機率表
某公司欲了解其品牌產品的平均使用年限,隨機抽取樣本7 件,其使用 年限(單位:年)如:5, 7, 4, 4, 5, 4, 6 請試著以不偏的樣本偏態係數(skewness)來說明該分布是否近似常 態。(10 分) 根據中央極限定理(Central Limit Theorem, CLT),說明在本例樣本數 7 n  的情況下,若直接以常態近似來建立平均數信賴區間,會產生什 麼問題?產生的問題可以怎麼處理?(10 分) 註: 若隨機變數 1 ~ n T t 分布,則(1 )   分位數 1 , 1 n t   定義為 1 , 1 ( ) 1 n P T t       。常見的數值有 0.95,19 1.729 t  , 0.975,19 2.093 t  , 0.95,20 1.725 t  ,0.975,20 2.086 t  若隨機變數 ~ (0,1) Z N 分布,則(1 )   分位數 1z   定義為 1 ( ) 1 P Z z      。常見的數值有 0.95 1.645 z  , 0.975 1.96 z 
A 和B 兩家公司皆生產相同規格之端子。分別自A 和B 公司隨機抽 取端子並衡量其膜厚,數據如表所示。 公司 膜厚(單位:mm) A
3 5 7
4 B
7 9 9
6 假設兩家生產的端子膜厚變異數相等,請寫出膜厚變異數之估計量 及估計值。(6 分) 請寫出兩家膜厚平均值差之估計量及估計值。(4 分) 續題,欲比較兩家膜厚之平均值是否有差異,請問該用什麼統計 方法?結論為何?顯著水準為0.05。假設兩家膜厚皆服從常態分 配。(10 分) 續題,請估計兩家膜厚平均值差之95%信賴區間。(5 分) 23320 23420 附表一:Z 值表 23320 23420 附表二:t 值表 23320 23420 附表三:X^2 值表