lawpalyer logo

統計 103 年抽樣方法考古題

民國 103 年(2014)統計「抽樣方法」考試題目,共 11 題 | 資料來源:考選部

0 題選擇題 + 11 題申論題

請說明何謂PPS(Probability Proportional to Size)抽樣。(10 分)
假定有一母體中共有N=3 個單元,各單元編號i 及其母體變數值(value of population variable of interest)yi 如下: i 1
某縣市政府為規劃民眾在地旅遊,針對該縣市的民眾進行一項旅遊狀況調查。此調 查主要的估計重點為家庭每月的平均旅遊支出,若根據上個月以簡單隨機抽樣抽出 1,068 戶(n)的調查結果,平均每個家庭花在縣內旅遊的支出每月約為5,000 元 ) X ) S ) N ( , 且標準差為3,500 元( 。該縣市共有175,000 戶( 。請問: x 請針對調查結果,對該縣市所有家戶的每月總旅遊支出,計算點估計值及估計其 95%的信賴區間。(5 分) 若希望估計平均每戶旅遊支出之誤差在150 元以內,且估計的信賴水準在95%, 則上述所抽出之樣本數是否足夠?應抽出多少樣本數?(10 分) 根據過去經驗,每戶外食之餐飲支出與旅遊支出存在著一個比率r 關係;若已知r 之 變異數為82.25,上述1,068 戶在餐飲上的每戶平均花費每月為8,000 元 ) (Y 。請對該 縣市所有家戶每月之餐飲費用,計算點估計值及估計其95%信賴區間。(10 分)
一家公司想要去估計某一個月所有員工的耗損工時數,而公司內的三大部門(勞 工、技術人員、管理人員)因為工作內容及型態不同,應該會有不同的耗損工時 數。因此決定採用依部門分層的分層隨機抽樣。 如果設定估計總耗損工時數之誤差在100 小時之內,在95%的信賴水準下,請使 用表一的資訊(Ni 表層i 的人數),以紐曼配置(Neyman allocation)法,計算所 需要的總樣本數及各層樣本數。(10 分) 公司實際進行分層隨機抽樣,各層的調查樣本數 及回收後的樣本平均數 ) ni ( ) ( ix 及 標準差 如表二所示。請估計公司平均耗損工時數之95%信賴區間。(15 分) ) ( iS 表一 層I (勞工) 層II (技術人員) 層III (管理人員) 耗損工時數之全距= 24 耗損工時數之全距= 20 耗損工時數之全距= 28 N1 = 132 N2 = 90 N3 = 33 表二 I (n1 = 18) II (n2 = 10) III (n3 = 5) 1x = 9.72 S1 = 8.33 2x = 6.70 S2 = 7.10 3x = 6.2 S3 = 3.11 103年公務人員特種考試關務人員考試、103年公務 人員特種考試身心障礙人員考試及103年國軍 上校以上軍官轉任公務人員考試試題 考 試 別: 關務人員考試 類 科: 關稅統計 全一張 (背面)
yi 5 7 15 今以一取出放回之設計D,每次以下表之選擇機率(draw-by-draw selection probability)選擇一個單元觀察後放回,再以同樣的選擇機率選擇下一個單元,共 選擇n=2 個樣本單元,選擇機率如下: i 1 2 3 P(i) 1/6 1/3 1/2  試求設計D 下第一個單元(i=1)之包含機率(inclusion probability),亦即以本設 計選擇之一組樣本,其中包含第一個單元之機率。(5 分)  若以觀察值樣本平均,記為 n y ,推估本母體平均μ,請問 n y 在設計D 下是否為不 偏估計?(5 分)  請提出一個在設計D 下,μ的不偏估計量,請說明其何以不偏,並計算您提出的 不偏估計在樣本s=(1,3)時μ之估計值。(10 分) 二、在某鎮所進行的年度家庭醫療支出調查中,調查戶為以簡單隨機抽樣取出不放回 (simple random sampling without replacement)在全鎮10,000 戶中所選取之1,000 戶 樣本戶。調查結束後所得之家戶醫療支出樣本平均為150 仟元。今欲進一步探討家 戶收入在50 仟元/月以下之低收入戶醫療支出概況,因無財稅資料可供查考,故僅 能由樣本資料判定受訪戶是否為符合前述定義之低收入戶,但無法得知本鎮符合定 義之低收入戶總戶數。 檢視樣本資料後,符合此一定義之受訪戶共有100 戶,而該100 戶之年醫療支出總 和為8,000 仟元,另該100 戶之年醫療支出平方和為2×1012。(亦即若令 iy 為第i 戶 之年醫療支出, ds 為樣本戶中之低收入戶集合,則 6 10 8  d s i iy 以及 12 2 10 2  d s i iy 。)  若以80 仟元作為該鎮低收入戶之平均年醫療支出之估計量,請問該估計量是否 為一不偏估計?並請說明理由或證明。(8 分)  請估計 中估計量之95%信賴區間,請以仟元為單位,並請四捨五入至小數點下 第二位。(8 分)  請問該鎮所有低收入戶之醫療總支出之不偏估計量為何?請以仟元為單位,並說 明或證明該估計量之不偏性。(10 分)  請估計 中估計量之95%信賴區間,請以仟元為單位,並請四捨五入至整數位。 (10 分) 103年公務人員高等考試三級考試試題 全一張 (背面) 三、在某鎮所進行的家庭月支出調查中其主抽樣設計如下:依家戶所得將全鎮家戶分為 高收入戶(家戶月收入300 仟元以上之100 戶),一般收入戶(家戶月收入50 仟 元至299,999 元之5,400 戶)及低收入戶(家戶月收入49,999 元以下共500 戶), 然後在各類收入家戶中選擇欲觀察之樣本。 在各類收入戶中再視需要以不同之抽樣設計選擇該類收入戶樣本戶,在各類家戶中 之次抽樣設計及調查方法如下:  高收入戶採全查面訪;月支出平均值為200 仟元,月支出標準差為30 仟元。  一般收入戶中,因其戶數眾多,故先在全鎮40 個里中隨機選擇5 個里,而在各 選擇的里中,再以簡單隨機抽樣取出不放回選擇若干里內樣本戶。  低收入戶中以簡單隨機抽樣取出不放回選擇200 戶面訪調查;另因低收入戶之支 出狀況為調查重點之一,為求慎重起見,再由該200 樣本戶中以簡單隨機抽樣取 出不放回選擇其中50 戶,而該50 戶另加以記帳調查蒐集其當月支出資料。  請問本調查中之主抽樣設計為何?同時請說明本調查採本設計之可能原因及優 點。(8 分)  在一般收入戶中調查資料如下: 里編號 里內總戶數 里內樣本戶數 里內月支出樣本 平均(仟) 2 100 25 80 18 400 50 75 19 120 30 60 30 200 40 90 38 800 100 65 請以比例估計(ratio estimation)推估一般收入戶之平均月支出,並請說明在此採 比例估計之可能優點及其原因。(8 分)  在低收入戶中若面訪戶之樣本為s,其中記帳戶樣本為s’ (s’為s 之子集合),以下 為樣本統計量(均以仟元為觀察單位): 統計量 s s’ 面訪樣本平均 28 25 記帳樣本平均 NA 30 面訪樣本變異數 25
某保養品公司想要了解平均每一位客戶願意花費的金額,因此針對來參加體驗活動 的1,000 位民眾進行重複系統抽樣以推估之。若希望能有5 個系統抽樣樣本,各樣 本的平均花費金額 ) (yi 如下表所示,且總共抽出200 位受訪者。請以下列資訊估計 平均每一位客戶願意花費的金額及估計其95%信賴區間。(10 分) 樣本代號 iy 1 5,300 2 5,325 3 8,200 4 3,500
記帳樣本變異數 NA 9 另在s’中記帳與面訪所得之月支出相關係數為0.68,請問本類家戶中所使用的抽 樣設計為何?並請以適當的方式推估低收入戶之家庭月支出平均。(8 分)  請推估本鎮家戶月支出平均,並說明(不須計算)其估計量之變異數估計程序。 (10 分)  明年度的調查仍欲採類似方式進行,然而因經費所限,故高收入戶將改採簡單隨 機抽樣取出不放回之抽樣調查以取代全查,但仍欲將該類母體平均之最大推估誤 差在95%之信心水準下,控制為10 仟元以下,請問欲達此一精確度要求之所需 最小樣本數。(10 分)
7,500 五、年底五都市長要改選,若要估計臺中市某一個里的投票率,由該里的1,000 戶中隨 機抽取10 戶來進行調查,詢問家戶中會去投票的人數,被抽到的10 戶之資料如下 所示。 家戶 家戶中年滿20 歲 有投票權之人數 會去投票的人數 1
4 2 3 2 3 3 1 4 2 2 5 5 3 6 10 3
1 0
1 1 9 3 1 10 4 2 合計 38 19 請運用集群抽樣的觀念,估計該里之投票率,及估計投票率之95%信賴區間。(10 分) 承上題,若希望估計投票率之誤差小於0.03,請問現有的抽樣家戶數是否足夠? 若不足應加抽多少戶?(10 分) 若上述的抽樣來自於依家戶人數多少之PPS 抽樣,請估計總投票人數之95%信賴 區間。(10 分)