lawpalyer logo

統計 92 年抽樣方法考古題

民國 92 年(2003)統計「抽樣方法」考試題目,共 12 題 | 資料來源:考選部

0 題選擇題 + 12 題申論題

解釋下列名詞:(25 分) 抽樣母體(Sampling population) 簡單隨機抽樣(Simple random sampling) 精確性(Precision) 不偏估計式(Unbiased estimator) 非機率抽樣(Non-probability sampling)
試對以下的抽樣設計方法作優劣性的比較:(20 分) 簡單隨機抽樣 分層抽樣 一階段群集抽樣 多階段群集抽樣
假設母體總數N=15000,考慮以不放回簡單隨機抽樣方式(簡稱為SRS)自母體中 抽出n=15 個樣本。 試問樣本空間中有多少種不同的結果。(5 分) 依據 說明滿足何種條件則稱之為SRS。(5 分) 依據 證明母體中任何一個體在樣本中的機率為1000 1 。(10 分)
茲有一N=6 之有限母體,其觀察值分別為y1=98, y2=102, y3=154, y4=133, y5=190, y6=175,今有一抽樣設計自此母體中抽出樣本數n=3 的隨機樣本,其可能出現的結 果如下表: 可能結果之編號 1 2
在1987 年間美國銀行共有150 家海外分行。為了調查這些海外分行的資產,於是 隨機取出30 家海外分行進行資產調查,得此30 家海外分行的平均資產為$18 億美 元,且標準差為$4 億美元。 試求這150 間海外分行的平均資產95%的近似信賴區間。(5 分) 試求這150 間海外分行的總資產的95%的近似信賴區間。(5 分) 假設在150 家海外分行中,隨機取出30 家海外分行進行在英國具有一間以上的 分行數的調查,得此30 家海外分行有30%的海外分行在英國具有一間以上的分 行,試求這些海外分行在英國具有分行比例的95%近似信賴區間?若希望估計具 有分行比例P 的誤差界限為B=5%,則須要抽取多少家海外分行方能達到我們的 要求? (10 分)
假設從全國250 所大學中,以SRS 抽樣抽出50 所大學。學生人數(表示為Yi)和 老師人數(表示為Xi)如下所示: 樣本數 (n) ∑ = 50 1 Y i i ∑ = 50 1 X i i 2 50 1 Y ∑ = i i i i iY X 50 1∑ = 2 50 1 X ∑ = i i 50
樣本結果,S {y1,y4,y6} {y2,y3,y6} {y1,y3,y5} 樣本結果出現的機率,P(S) 1/4 1/2 1/4 令 y µ 表示母體平均數,y表示樣本平均數,且已知∑ = = 6 1 i i 852 y ,∑ = = 6 1 i 2 i 128138 y 。 試根據此抽樣設計的結果求下列各值:(20 分) y的期望值 ) y ( E =? y的變異數 ) y ( V =? y的偏誤 ) y ( Bias =? y的均方差 ) y ( MSE =? 三、何謂分層隨機抽樣?分層的目的為何?使用分層隨機抽樣法時,各層樣本大小之配 置(allocation)主要有那些方法?請用適當的符號列出這些配置方法的公式。(30 分)
某一工會擬對2000 名會員進行雇工人數調查,以去年每一會員平均雇用之勞工人數作 為分層之標準,由會員中以分層隨機抽樣法抽出100 名會員,其樣本資料如下:(40 分) 層(h) Nh nh h y Sh 1 1150 50 15 8 2 400 10 24 7 3 250 20 36 8
10 2. 30 × 3 10 02 .2 × 6 10 1. 30 × 6 10 7.1 × 6 10 11 .0 × 利用上述資料說明如何估計 T S N N R = ,其中NS 和NT 分別為250 所大學學生和老師 總人數。(10 分) 說明 所提出的估計值是否為R 的不偏估計。(10 分) 利用上述資料建構R 的95%區間估計。(10 分) 三、 假設母體分為兩層。令N1 和N2 分別表示第一層和第二層已知之母體總數,令σ1 2 和σ2 2 分別表示第一層和第二層之母體變方(σ1 2 和σ2 2 未知)。考慮以分層抽樣方式 自母體兩層中分別以SRS 抽出n1 和n2 個樣本並以 ∑ = = 2 1 h h h st y w y 估計母體平均值,其 中 1y 和 2 y 分別表示第一層和第二層樣本平均值, ) 2 ,1 ( = = h N N w h h , 2 1 N N N + = 。 我們希望在給定的預算c 下選擇n1 和n2 使得 st y 的變方 ) ( st y Var 最小。 假設 ∑ = + = 2 1 0 h h hn c c c ,其中c0 和ch (h=1, 2) 為已知之正數。 當c1=c2 時,說明如何選擇n1 和n2?(10 分) 由於σ1 2 和σ2 2 未知,因此 所選擇的n1 和n2 在實際應用上有何困難?(5 分) 另一簡單之樣本數配置方法稱之為比例配置。何謂比例配置並說明在何種情形下 適用。(10 分)
某統計專家擬調查某甘蔗試驗農場改良種「台灣一號甘蔗」的含糖量,但因不知甘 蔗總株數N,致不宜採用簡單隨機抽樣,故決定改用〝七中取一〞的系統抽樣法, 下表所列資料是所抽甘蔗樣本的含糖量百分比(%)。(25 分) 甘蔗樣本 1 2 3 … 210 211 212 含糖量yi(%) 82 76 83 … 84 80 79 且經計算得下列資料:∑ = = 212 1 i i 17066 y ,∑ = = 212 1 i 2 i 1486800 y 。 試估計該農場改良種甘蔗的平均含糖量µ之值,及其估計的95%誤差界限。 註:設Z~N(0,1),令 = Φ ) z ( dt e 2 1 2 t2 − π ,已知 95 .0 ) 645 .1( = Φ , 975 .0 ) 96 .1( = Φ 。 ∫ z ∞ −
200 20 60 18 總數 2000 100 試求全部會員平均雇工人數的分層估計值。 試求 中分層估計量標準誤的估計值。 試求全部會員平均雇工人數的95%近似誤差界限B。 試求全部會員平均雇工人數的95%近似信賴區間。 試求全部會員總雇工人數的分層估計值,並求每一層雇工人數的分層估計值。 試求全部會員總雇工人數分層估計量標準誤的估計值。 試求全部會員總雇工人數的95%近似誤差界限B。 試求全部會員總雇工人數的95%近似信賴區間。 九十二年公務人員升官等考試試題 代號: 科 別: 統計 全一張 (背面) 31960 四、在一個具有母體大小為M=500 以及子群集為N=20 的抽樣母體中,以簡單隨機抽樣 法自此抽樣母體中隨機抽出四個群集作為樣本。若樣本中每一個群集內的母體大小 Mi,某類別的總個數Ai 如下表所示:(20 分) 集群(i) Mi Ai 1 2 3 4 10 20 30 40 8 10 18 24 總和 100 60 試求母體比例P 的群集估計值及母體比例P 的群集估計量標準誤的估計值。 試求母體比例P 的95%近似信賴區間。 若此題我們將變數資料視為簡單隨機樣本, 試求母體比例P 的簡單估計值及母體比例的簡單估計量標準誤的估計值。 試求母體比例P 的95%近似信賴區間。
今欲估計某一製鞋工廠在某一天所生產鞋子不良品所佔之比例(表示為P)。工廠共 有24 個生產線 (i=1, …, 24)。第i 個生產線每天生產Mi 雙鞋子。考慮以比例集群抽 樣方式(即第i 個生產線被抽中之機率和Mi 成正比)抽出一個樣本。 說明如何利用均勻分配U(0, 1) 亂數抽出一隨機樣本。(10 分) 假設抽中第3 個生產線,M3=100,不良品個數為2 個。說明如何估計P。(10 分) 在實際應用上,當Mi 太大時,無法每件檢查。有何處理方法?(5 分)