lawpalyer logo

統計 107 年抽樣方法考古題

民國 107 年(2018)統計「抽樣方法」考試題目,共 10 題 | 資料來源:考選部

0 題選擇題 + 10 題申論題

某一種分層抽樣設計將母體分成三層,並且取得以下關於母體與樣本的 相關資訊: z 第一層有100 個抽樣單元、樣本數是50、樣本平均是10、樣本變異 數是800; z 第二層有100 個抽樣單元、樣本數是50、樣本平均是20、樣本變異 數是700; z 第三層有100 個抽樣單元、樣本數是50、樣本平均是30、樣本變異 數是600; 請回答:(t0.025(147) = 1.976233) 估計母體平均數。(5 分) 請提供信賴區間所需t 分配的自由度。(10 分) 承上小題,提供母體平均數的95%信賴區間(答案請四捨五入到第二 位小數)。(10 分)
(147) 5 分
假設F 是一個僅僅包含四個元素的小規模有限母體(finite population),而四個元素的研究變數(study variable)值分別為y1=1、y2=3、y3=3 以及y4=9。我們採用不置回的簡單隨機抽樣(simple random sampling without replacement)從母體 之中抽出樣本大小(sample size)為n=2 的樣本組合,並以 Y1, Y2 來表示此樣本組合中的兩個樣本數據(註:採用大寫英文字母Y,表示樣本 數據皆為隨機變數)。試求Y1 與Y2 的聯合機率分佈(joint probability distribution) 以及Y1 與Y2 的共變異數(covariance)。(15 分) { 4 3
承上題。假設研究者想試算簡單隨機抽樣的結果。(t0.025(49) = 2.009575) 請單獨根據第一層的資訊估計母體平均數及提供母體平均數的95% 信賴區間(答案請四捨五入到第二位小數)。(10 分) 請單獨根據第二層的資訊估計母體平均數及提供母體平均數的95% 信賴區間(答案請四捨五入到第二位小數)。(10 分) 請單獨根據第三層的資訊估計母體平均數及提供母體平均數的95% 信賴區間(答案請四捨五入到第二位小數)。(10 分)
(49) 10 分
1 , , , u u u u = F 假設前一小題之中抽出樣本大小為n=3 的樣本組合,並以Y1 ,Y2,Y3 來表示此樣本組 合中的三個樣本數據。試求Y1 與Y3 的共變異數。(5 分) 二、假設某一個有限母體可被完整地切割為L個互不相交的層別(strata),其中第h層 之層大小(stratum size)為Nh,第h層之第j個元素的研究變數值為yhj,h=1,…,L, j=1,2,…,Nh。母體大小(population size)、母體平均數(population mean)以及母體 變異數(population variance)的數學式分別為 母體大小: 1 2 L N N N N = + + + L ; 母體平均數: 1 1 1 h N L hj h j y N μ = = = ∑∑ ; 母體變異數: 2 2 1 1 1 ( ) h N L hj h j y N σ μ = = = − ∑∑ 。 其次,母體中第h 層之層平均數(stratum mean)以及層變異數(stratum variance) 的數學式分別為 第h 層之層平均數: 1 1 h N h h j h y N μ = = j ∑ ; 第h 層之層變異數: 2 2 1 1 ( ) h N h hj j h y N σ h μ = = − ∑ 。 試證明下列等式: 2 2 1 1 ( ) L L h h h h h h W W σ σ 2 μ μ = = = + − ∑ ∑ , 其中 h h N W N = 為第h 層的層比重(stratum weight), 。(10 分) 1, , h L = L 使用分層隨機抽樣(stratified random sampling)之後,抽樣者應如何推估(未知其 值的)母體平均數?需要什麼假設條件?請詳細說明。(4 分) 在使用分層隨機抽樣之前,抽樣者必須事先決定將要採用何種較為適當的配置, 例如比例配置(proportional allocation)、尼門配置(Neyman allocation)。請詳細說 明在使用事後分層(post-stratification)的方法之前,抽樣者是否也必須事先決定 採用何種配置?(5 分) 請詳細說明在什麼情況之下,抽樣者需要借助於雙重抽樣(double sampling)之方 法,來進行分層隨機抽樣並推估母體的平均數(或是推估母體的其他參數)。 (5 分) 107年公務人員高等考試三級考試試題 全一張 (背面) 類 科: 統計 科 目: 抽樣方法
假設總樣本數是150。再假設研究者把母體分成三層並且取得以下相關 資訊: z 第一層有100 個抽樣單元、母體變異數16; z 第二層有200 個抽樣單元、母體變異數25; z 第三層有300 個抽樣單元、母體變異數36; 請回答:假設抽樣成本是一致的,請問根據最佳分配原則, 第一層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分) 第二層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分) 第三層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分)
某水果商訂購了一卡車的椰子,並打算採用比值估計(ratio estimation)之方法來推 估整輛卡車裝載所有的椰子如果全數被剖開之後的椰子汁總重量。該水果商採用不置 回的簡單隨機抽樣之方法從整輛卡車的椰子之中抽出了10 顆椰子。試說明該水果商 應該如何利用被抽出的10 顆椰子來取得樣本數據以及如何進行比值估計,並寫出點 估計量的數學式。(15 分)
某大學某系所 60 位學生針對107 年公投議題進行假投票,他們的座號 從「01」開始一直編到「60」。抽樣方法課的授課師長為了示範系統抽 樣,私底下先詢問了全班每一位同學對「議題甲」的個人意見。發現座 號「04, 05, 07, 10, 15, 17, 19, 25, 27, 28, 29, 30, 31, 32, 37, 39, 45, 46, 50, 53, 58, 60」的這幾位同學表示支持議題甲。現在引用「每5 個取 1 個」 的系統抽樣估計支持者的比例。 請回答:如果系統抽樣的起始座號是03, 支持議題甲的樣本比例等於多少(答案請用分數表達)?(15 分) 估計上述樣本比例的變異數(答案請四捨五入到第四位小數)。(10 分) 假設估計誤差被定義為上述變異數放大4 倍後的正方根,請問第一小 題樣本比例的估計誤差等於多少(答案請四捨五入到第四位小數)? (5 分)
迴歸分析(regression analysis)課程中的最小平方估計量(least squares estimator),在 抽樣方法的理論中有何可用之處?請詳細說明並寫出相關的估計量數學式。 (10 分)
某一間大學的學術部門打算採用二階段集群抽樣(two-stage cluster sampling)之方 法來推估校內全體專任教師在前一個學年度的學術論文平均產量(亦即,推估任 何一位專任教師在前一個學年度的學術論文平均發表篇數),並且將校內的每一個 科系視為一個集群。試就比值估計(ratio estimation)以及不偏估計(unbiased estimation)兩種情況分別說明如何進行二階段集群抽樣以及如何推估,並寫出點 估計量的數學式。(13 分) 假設前一小題之中的學術部門打算改變為採用集群抽樣(cluster sampling)之方法來 推估校內全體專任教師在前一個學年度的學術論文平均產量,並且依舊將校內的每 一個科系視為一個集群。試就比值估計(ratio estimation)以及不偏估計(unbiased estimation)兩種情況分別說明如何進行集群抽樣以及如何推估,並寫出點估計量的 數學式。(13 分) [註] 集群抽樣又稱之為單階段集群抽樣(single-stage cluster sampling)
在什麼情況之下,使用系統抽樣(systematic sampling)之方法來推估母體的平均數, 其推估之效果會優於使用簡單隨機抽樣的推估效果?請詳細說明。(5 分)