lawpalyer logo

經建行政 112 年統計學考古題

民國 112 年(2023)經建行政「統計學」考試題目,共 19 題 | 資料來源:考選部

0 題選擇題 + 19 題申論題

疫苗效力(vaccine efficacy)定義為參加實驗的自願者中,染疫人數中注 射安慰劑(沒有疫苗保護)的百分比。某藥廠開發一款COVID-19 疫苗, 宣稱其疫苗效力為92%。假設該疫苗被核准上市,且該疫苗的施打涵蓋 率約為80%。以2023 年COVID-19 發生率為每10 萬人約5,000 人感染 為基礎,請問施打該疫苗的民眾中染疫的機率有多少?又未施打疫苗的 民眾中,染疫的機率有多少?(20 分)
考慮兩壽命分別為 1 X 及
令Xଵ, ⋯, X଺表示服從指數分配(Exponential distribution)Exp(ߠ)的隨機樣本, 其機率密度函數為݂(ݔ) = ଵ ఏ݁ିೣ ഇ, ݔ> 0。(每小題8分,共24分) 計算E(Xଵ)。(E:Expectation)(須列出計算過程) 令Y = ∑ ܺ௜ ଺ ௜ୀଵ ,求隨機變數Y的動差母函數(moment generating function),並回答Y的機率分配名稱。(須列出計算過程) 令Yഥ= ∑ ௑೔ ల ೔సభ ଺ ,求隨機變數Yഥ的動差母函數(moment generating function), 並回答Yഥ的機率分配名稱。(須列出計算過程)
民意調查機構想要規劃一份問卷調查,調查民眾對於特定議題的支持度 (從不支持到支持以1~10 尺度測量支持的程度)。根據過去的經驗,各 支持尺度的比率如下表: 支持度 1 2
X 的電子零件,假設 1 X 及 2 X 為兩互相獨立且具 平均壽命為1 年的指數分配之隨機變數,若將此兩電子零件串聯在一起, 試問:(每小題10 分,共20 分) 此系統壽命之機率密度函數為何? 承小題,此系統的平均壽命為幾年? 二、某教師設計三種不同的教學方法,想要了解那一種教學方法可以提高學 生的成績,隨機抽取若干學生分別參與這三種教學方法的課程,並於課 程結束後測試學生的學習成果,得其成績分別如下: 教學方法一 教學方法二 教學方法三 94 75 70 86 77 65 91 68 72 82 70 68 81 73 68 84 65 65 84 76 平均值 86 72 68 變異數 23 20 7.6 如果這些資料滿足變異數分析的所有假設,檢定三種教學方法對平均成績 表現是否有顯著不同時,試問:(每小題10 分,共20 分) 根據資料所建立的變異數分析表為何? 若只使用教學方法一和二,試問檢定兩種教學方法對平均成績表現是 否有顯著不同時,則計算出來的T 檢定統計量為何?
考慮簡單線性迴歸模型,ݕ௜= ߚ଴+ ߚଵݔ௜+ ߳௜, ߳௜݅݅݀ ~ ܰ(0, ߪଶ),ߚመ଴和ߚመଵ分 別為β0與β1之最小平方估計式,計算下列各子題:(每小題10分,共20分) 計算Cov(ݕ,ഥߚመଵ),其中ݕഥ為反應變數Y之平均數,Cov是指共變異數 (Covariance)。 計算Var(ߚመ଴+0.8ߚመଵ),Var是指變異數(Variance)。
一位球場老闆宣稱他的球場地形比較複雜,以至於高爾夫球員打一回合 後會丟失一打或更多的高爾夫球。一位高爾夫球員懷疑這位球場老闆誇 大的宣稱。他蒐集完成一回合的15 位高爾夫球員的隨機樣本,並記錄每 人丟失的高爾夫球數如下: 1,14,8,15,17,10,12,6,14,21,15,9,11,4,8 假設丟失的高爾夫球數服從常態分配。在5%的顯著水準下,以上數據能 否推翻球場老闆誇大的宣稱?(15 分)
假設我們有6 筆成對資料( , ) x y ,統計資料為 6 1 21 i i x    , 6 2 1 91 i i x    , 6 1 48 i i y    , 6 2 1 496 i i y    和 6 1 203 i i i x y    ,利用這6 筆資料建構簡單線性迴 歸模型 0 1 1, 2, , 6 i i i y x i         , ,在滿足迴歸模型誤差項 i平均值 為0 及變異數為 2 之常態的基本假設下,試問利用最小平方法求取 1 的 估計量 1ˆ(estimator),則:  1ˆ的抽樣分配(sampling distribution)為何?(20 分)  1 的最小平方估計值為何?(5 分)
有關於汽車碳氫化合物排放量(克/英里)的研究,記錄碳氫化合物排放 量Y(100克/公里),和相對應的累積里程數X(以1000公里為單位)。初步 整理樣本資料如下所示: 2 1 1 1 11 190.2356 212.9375 4086.6461 n n n i i i i i i n x y x           , , , , 2 1 1 4152.344 3808.8281 n n i i i i i y x y       , 。 使用以上資料回答下列問題,請詳細將所使用之公式及計算過程列出。 (每小題9分,共36分) 計算最小平方迴歸線。(計算至小數點後4位數) 迴歸判定係數(ܴଶ)為何? 顯著水準為0.05,檢定迴歸斜率是否顯著異於0.16。 在x=25時,求對應之反應變數Y預測值的95%預測區間。 (10,0.025 9,0.025 10,0.05 9,0.05 2.228 2.262 1.812 1.833 t t t t     , , , ) 33480
某雜誌蒐集兩家超市A 和B 的顧客滿意度評級。每位調查受訪者都被 要求根據多種因素對指定超市進行評分,例如:產品品質、價格、結帳 效率、服務等。整體滿意度得分總結了每位受訪者的評分,分數100 表 示受訪者在所有因素方面都完全滿意。樣本數據整理如下: (每小題15 分,共30 分) A 超市:250 位客戶,整體滿意度平均分數86。 B 超市:300 位客戶,整體滿意度平均分數85。 某雜誌假設兩家超市整體滿意度的母體標準差皆為12,在0.05 顯著 水準下,試以p 值方式檢定兩家超市的整體滿意度平均分數是否有顯 著差異。 試計算兩家超市的整體滿意度平均分數的差異之95%的信賴區間,並 以此信賴區間檢定兩家超市的整體滿意度平均分數是否有顯著差異。
考慮兩生產線零件的不良率 1p 及 2p ,今要比較兩生產線零件不良率 1p 及 2p 的高低,取自兩生產線獨立樣本的結果如下: 樣本1: 1 250 n  1ˆ 0.04 p  樣本2: 2 250 n  2ˆ 0.03 p  1n 、 2n 及 1ˆp 、 2ˆp 分別代表從兩生產線所抽樣的零件樣本數及樣本中的 不良率,假設檢定為: 0 1 2 : 0, H p p   1 2 : 0 a H p p   ,則: (每小題5 分,共25 分) 檢定統計量之值為何? 檢定統計量對應的P 值為何? 當顯著水準 0.1  時,結論為何? 如假設檢定為左尾檢定,則P 值為何? 如假設檢定為雙尾檢定,則P 值為何?
觀察記錄某一城市在最近三個月內(90天)每天汽機車意外事故的次數, 其次數分配如下所示: 意外事故次數 0 1 2 3 4 觀察天數 32 34 17 6 1 檢定每天汽機車意外事故次數是否服從波松(Poisson)分配。 寫出虛無假設與對立假設。(5分) 在顯著水準α=0.05時,寫出檢定統計量、棄卻域和結論。(須列出計算 過程)(15分) ( 2 2 2 2,0.025 3,0.025 4,0.025 7.38 9.35 11.14       , , , 2 2 2 2,0.05 3,0.05 4,0.05 5.99 7.81 9.49       , , ) 波松分配累積機率表 x λ = E(X) 0.5 1.0 2.0 0 0.607 0.368 0.135 1 0.910 0.736 0.406 2 0.986 0.920 0.677 3 0.998 0.981 0.857 4 1.000 0.996 0.947
下列資料是根據國家顧客滿意度指數蒐集的三家公司連續兩年的平均 滿意度分數。假設每家公司每年隨機抽取60 名客戶做為樣本。假設此三 家公司每年滿意度分數的標準差均為6 分。 公司 今年 去年 A 72 75 B 81 83 C 79 80 資料顯示此三家公司今年的滿意度分數均較去年降低。若以α 0.05  進行 假設檢定,試問下降分數須有多大才具有統計顯著性?(15 分) 32180
常態分配及T 分配在統計資料分析上是兩個常用到的資料分配,試比較常 態分配及T 分配之機率密度函數曲線或資料結構的異同?(10 分)
1.000 0.999 0.983
在完全隨機的設計中,有一個因子包含五個水準,每個水準下都使用了 七個實驗單元。變異數分析表如下: 變異來源 平方合 自由度 均方 F 處理 300 4 誤差 總合 460 試寫下F 值對應之虛無與對立假設,並在α 0.05  的顯著水準下,以p 值 方式進行假設檢定。(15 分)
1.000 1.000 0.995
1.000 1.000 0.999
9 10 比率 3% 5% 8% 14% 10% 10% 12% 13% 15% 10% 在95%的信賴度下,抽樣誤差設定為10%時,所需的最小的樣本數為 何?(15 分) 如果我們只需要針對是否支持(1~5 視為不支持,6~10 視為支持) 做推論,在95%的信賴度下,抽樣誤差設定為2%時,所需的最小樣 本數為何?(10 分) 對於這份調查你的樣本數規劃建議為何?(5 分) 三、某高中模擬考隨機抽出女、男各50 位同學的成績敘述性統計如下表。假 設各科分數服從常態分配。請建立適當的參數符號,完成下列推論。 女生 男生 2nd lst 2nd lst mean 68 63 76 68 stdev 12.8 24.9 15.3 28.7 corr 0.6723 0.4658 請分別計算女生、男生兩次模擬考差的平均值的95%信賴區間。(24 分) 在α 5%  的顯著水準下,請檢定女生、男生兩次模擬考總和平均值是 否有顯著性差異。(26 分) 表1.常態分配表 表2.卡方分配表 表3. t 分配表