lawpalyer logo

統計 112 年抽樣方法考古題

民國 112 年(2023)統計「抽樣方法」考試題目,共 11 題 | 資料來源:考選部

0 題選擇題 + 11 題申論題

M N i i m   ),再由這N 個集群中用簡單隨機抽樣法抽出n 個集群,被 抽中的集群中的每一個元素均被調查。假設 iy 為第i 個集群中所有觀測 值的總和,欲估計母體的總和。母體總和τ的估計量有: 比率估計量⑴: 1 1 ˆ n i i n i i y M m       不偏估計量⑵: 1 ˆ n i i N y n     或是由這N 個集群中用pps(sampling with probabilities proportional to size)抽出n 個集群,被抽中的集群中的每一個元素均被調查。則母體總 和τ的估計量: pps 估計量⑶: 1 ˆ n i pps i i y M n m     請說明此三估計量之使用時機。(15 分) 某公司在臺灣一共有100 個廠區,因最近疫情關係供貨吃緊,總經理想要 估計所有100 個廠區員工未來一年請病假的總天數。100 個廠區可細分 為70 家小廠及30 家大廠。從過去經驗,小廠員工請假天數約在0~100 天 病假,大廠員工請假天數約在10~210 天病假,估計誤差界限設為500 天。 請找出可達到這個界限的適當樣本大小及各層配置樣本大小。(15 分) 表一為臺灣60 大城市之11 月份降雨量(單位:公厘mm)。城市1 至城 市60 排列方式是依地理位置從北到南依序排列。城市號碼愈小所在位 置也就愈偏臺灣北部,城市號碼愈大所在位置也就愈偏臺灣南部。 假設用簡單隨機抽樣法抽出 10 n  個臺灣大城市(10 個樣本的號碼如 下:2、12、16、20、24、27、32、40、47、56),試估計臺灣60 大城 市之11 月份平均降雨量( ˆ) 及其估計變異數( ˆ( )ˆ ) V  ?(10 分) 選擇一組10 個樣本的系統樣本,為統一起見,一律採用起始號碼3。 試以此組系統樣本估計臺灣60 大城市之11 月份平均降雨量( ˆ) 及其 估計變異數( ˆ( )ˆ ) V  ?假設母體為隨機排列。(10 分) 如果採重複系統抽樣,抽出兩個"12 取1"的系統樣本,為統一起見, 一律採用起始號碼1 及6。試以此兩組重複系統樣本估計臺灣60 大城 市之11 月份平均降雨量( ˆ) 及其估計變異數( ˆ( )ˆ ) V  ?(15 分) 表一臺灣60 大城市之11 月份降雨量 單位:mm 城市 1
有關單位為瞭解我國農家所得狀況,於本年度進行一項農家所得調查, 調查目的除了要推估全體農耕戶之平均所得之外,也需要瞭解不同經營 類別(亦即主要種植作物,如稻米、蔬菜、水果等)之農戶所得。所採 用之抽樣設計以農林漁牧普查資料中農牧戶為抽樣母體,將農牧戶依其 經營類別分為稻作、蔬菜、水果、其他農作物及畜牧戶共五大類,在各 經營類別農家中,以簡單隨機抽樣取出不放回的方式,各選取若干樣本 戶,資料蒐集方式為家戶問卷面訪。 本年度調查結束後之檢討會議中,有人提出因為農家多分布於鄉下甚至 偏鄉地區,樣本戶與樣本戶之間多半間隔相當之距離,調查員需要花費 相當多的時間及交通費成本完成訪查。因此建議於下年度調查時,將抽 樣設計修正為先以簡單隨機抽樣取出不放回的方式,在全國約7,500 個 村里中隨機選取,再派遣調查員至樣本村里訪問所有農戶,如此應能有 效降低調查所需之時間及交通費成本。 請回答下列問題: 執行本年度調查使用的抽樣設計之主要注意事項為何?(6 分) 會議中所建議下年度採用的是何種抽樣設計?並請說明此一抽樣設 計之主要優缺點。(6 分) 會議中所建議下年度採用的抽樣設計對於本調查之需求目的是否合 宜?理由為何?(8 分)
欲了解某一工業園區N家製造業者AI人才的需求狀況,下述三種抽樣設計 可用以推估該工業園區有AI人才需求的業者家數比例及總需求人數: ⑴如果園區各業者的營業規模已知,首先將業者依其營業規模分成L層 (1, , L  ),每層家數分別為 1, , L N N  ,再由每層抽取一簡單隨機樣 本,分別為 1, , L n n  ,以調查業者的AI人才需求狀況。 ⑵如果園區各業者的營業規模未知,但已知園區業者營業規模的比例分 別為 1, , L W W  ,首先由N家業者抽取一簡單隨機樣本(n)調查業者規 模及AI人才需求狀況後,再根據調查結果依其規模分成L層進行推估。 ⑶如果沒有園區業者營業規模的資訊,首先由N家業者抽取一簡單隨機樣 本n,取得營業規模資訊,而後根據營業規模資訊將n家業者依其營業 規模分成L層( 1, , L n n    ),再由每層抽取一簡單隨機樣本,分別為 1, , L n n  ,調查業者的AI人才需求狀況。 說明前述三種抽樣設計的抽樣方法為何?(10分) 若欲估計園區AI總需求人數(Y ),分別列出對應前述三種抽樣方法的 估計量(estimator)及該估計量之變異數的估計量。(15分)
成功里里長進行一項調查,以瞭解里內家戶的家犬飼養狀況,在全里500 戶家戶中以簡單隨機抽樣的方式選擇50 戶樣本戶進行調查。在這50 戶 樣本戶中,有12 戶飼養家犬,而這12 戶家戶養犬平均每月花費2,000 元,每月養犬平均花費之樣本變異數為1,000,000 平方元。請回答下列問 題: 若以2,000 元作為養犬戶的每月平均養犬花費的推估值,請問該推估 值之變異數估計為何?(5 分) 請推估成功里每月養犬之總花費。(8 分) 請問建構成功里養犬之總花費的95%信賴區間所需標準誤之估計為 何?(12 分)
某一縣市共4000家養雞戶分散在20個村里(cluster),欲透過調查了解該 縣市養雞戶的所得狀況,抽樣方法可採用一階段集體抽樣(single-stage cluster sampling)或二階段集體抽樣(two-stage cluster sampling)。 若抽樣方法採一階段集體抽樣,首先由20個村里以簡單隨機抽樣(SRS) 抽出3個村里,就抽得的3個村里之養雞戶全數調查,調查結果村里內養 雞戶數及平均年所得列於下表: 村里 (cluster) i 養雞戶數 ( i M ) 村里內養雞戶 平均每戶年所得(百萬元) ( iy ) 1 150 4 2 200 8
銘興大學以該校學生為對象,進行一項學校行政滿意度調查,抽樣設計 為依學制將學生分為大學部、碩士班及博士班三類,於各類學生中以簡 單隨機抽樣的方式各選擇200 位學生作為樣本並加以訪談,記錄其對學 校行政效率是否滿意。其調查結果概要如下: 學制 學制樣本滿意比例 學制學生總數 大學部 0.25 3000 碩士班 0.65 1000 博士班 0.55 500 請回答下列問題: 請推估銘興大學學生對該校行政效率滿意之比例以及該推估量之標 準誤估計值。(10 分) 銘興大學校方為提升行政效率,每學期固定實施一次調查。請問在下 次調查時,於總樣本數為600 的條件下,各學制皆為200 位學生之樣 本數配置是否恰當?請敘述理由。若認為各學制學生樣本數應重新配 置,請提出配置結果(包含規畫樣本數配置應考慮之因素、如何計算 以及計算結果)。(15 分)
250 5.6 採用集體大小比率估計量(ratio-to-size estimator, Ry )估計該縣市養雞 戶平均每戶年所得(以百萬元為單位)及該估計量之標準誤。(10分) 若抽樣方法採二階段集體抽樣,首先由20個村里以簡單隨機抽樣抽出3 個村里,再就抽得的3個村里之養雞戶以簡單隨機抽樣分別抽出1/10養 雞戶進行調查,調查結果養雞戶之平均所得列於下表: 村里 (cluster) i 農戶數 ( i M ) 抽出養雞戶數 ( i m ) 村里內抽得之養雞戶平均 每戶年所得及標準差 (百萬元) ( , i i y s ) iy is 1 150 15
澄清里里長為瞭解里內2000 位里民對里內公園設施的滿意程度,進行 一項調查,在全里的20 個鄰中,隨機選擇5 個鄰,再請鄰長在其鄰內里 民中隨機選擇10 位里民做為樣本,詢問其對鎮內公園設施是否滿意,調 查資料如下: 鄰編號 鄰內里民數 鄰內樣本滿意比例 3 100 0.3 6 80 0.5 11 100 0.3 12 200 0.5 17 50 0.2 請回答下列問題: 請問此一抽樣設計為何種抽樣設計?(5 分) 請根據此一調查資料,推估澄清里里民對里內公園設施的滿意比例, 並提出根據此一估計結果建構信賴區間所需之變異數估計。(15 分)
1 2 200 20 7 3 3 250 25 6 2 試問:(15分) ⑴本抽樣設計第一階段的抽樣單位(primary sampling unit, PSU)及第 二階段的抽樣單位(secondary sampling unit, SSU)分別為何? ⑵採用不偏估計量(unbiased estimator, y )估計該縣市養雞戶平均每 戶年所得(以百萬元為單位)及該估計量之標準誤。 三、欲了解某區域養殖漁戶營運狀況,該區域共有800家養殖漁戶,首先由該 區域抽得一個包含500戶(第一重樣本 500 n )的簡單隨機樣本以取得養 殖型態(是否為漁電共生的層別資訊),調查得知其中100戶為漁電共生 戶,進而以簡單隨機抽樣由漁電共生及非漁電共生的養殖漁戶分別抽20% 以調查其營運成本資訊,調查結果整理如下表: 養殖型態(層別) 第一重樣本 (戶) hn  第二重樣本 (戶) hn 養殖漁戶年營運成本 平均年營運成本 iy (十萬元) 標準差 is (十萬元) 漁電共生(I) 100 20 120 100 非漁電共生(II) 400 80 50 60 合計 500(n) 100(n ) 75(s) 估計該區域養殖漁戶平均年營運成本(Y )(以十萬元為單位)及該估計 量的標準誤。(10分) 如果此調查總預算為44,500元,取得養殖型態的單位成本為9元,調查 營運成本的單位成本為400元( 9, 400 h c c   ),有關標準差、各層權 重、各層平均年營運成本及標準差之母體資訊分別以前述樣本資料(s, i i n w n   , iy , is )取代。試求:(15分) ⑴決定分層雙重抽樣的最佳抽樣設計(Optimum double sample plan), 亦即求算 h n n 、。 ⑵就⑴的抽樣設計求算平均年營運成本估計量(以十萬元為單位)的 變異數。 四、欲了解2022年國內汽車銷售概況,就2000家汽車銷售業者進行調查,汽車 銷售業者分為兩大類:國產型(I)及進口型(II),業者家數分別為 1 N =1500 及 2 N =500。抽樣方法採用分層隨機抽樣,依類別分層,從每一層分別隨 機抽出10家業者進行調查。假設2021年(x)各類業者的年平均銷售量已 知為: 1 X =220(輛); 2 X =140(輛)。 調查結果20家業者在2021年(x)及2022年(y)的銷售量統計如下: 層別 (h)變數 樣本均數 , i i y x (輛) 比率 (ˆ h R ) 樣本共變異數 xyh s 樣本標準差 hs I y 240 1.2 7200 100 x 200 80 II y 180 1.8 2200 60 x 100 40 合計 ys =110, xs =90, xy s =9000 利用下列估計量估計年平均銷售量(Y )及該估計量的變異數:(15分) ⑴ st y ,分層隨機抽樣結合簡單均數估計量(mean per unit estimator)。 ⑵ Rs y ,分層隨機抽樣結合分開比率估計量(separate ratio estimator)。 ⑶ Rc y ,分層隨機抽樣結合混合比率估計量(combined ratio estimator)。 求算估計量 st y 、 Rs y 、 Rc y 對單位均數估計量(y )之相對效率(relative efficiency),並說明那個估計量具有較佳精確度。(10分)
請說明何謂抽樣權重(sampling weight),說明其與包含機率(inclusion probability)及母體數N 之關係,以及如何利用抽樣權重建構母體總和 (τ)以及平均(μ)之不偏估計量。(10 分)
9 10 降雨量 4.9 4.7 4.8 4.4 4.7 4.8 3.7 3.6 4.5 3.0 城市 11 12 13 14 15 16 17 18 19 20 降雨量 4.2 3.5 3.9 3.0 4.3 3.4 3.5 3.6 2.9 4.8 城市 21 22 23 24 25 26 27 28 29 30 降雨量 4.2 7.4 2.9 3.4 1.8 2.2 2.9 1.2 1.5 2.7 城市 31 32 33 34 35 36 37 38 39 40 降雨量 2.9 1.8 2.7 2.0 2.6 1.1 3.2 1.8 2.6 4.5 城市 41 42 43 44 45 46 47 48 49 50 降雨量 2.7 2.4 1.9 0.8 2.1 0.6 0.6 0.6 1.7 1.3 城市 51 52 53 54 55 56 57 58 59 60 降雨量 1.4 0.7 0.5 1.0 0.3 0.8 0.5 0.3 0.7 0.5 針對新移民做的一項抽樣調查,想獲得他們對於臺灣移民政策的看法。 從政府的登記資料知道新移民中有60%的女性與40%的男性。一共抽樣 1,000 人,有87%(870 位)是女性,13%(130 位)是男性。在870 位 回答的女性中有566 位贊成,在130 位回答的男性中有102 位贊成。由 此事後分層,請估計新移民贊成此移民政策的比例( ˆ ) st p 及其估計的變異 數ˆ ˆ ( ( )) p st V p 。(10 分) 請比較簡單隨機估計、比率簡單估計、差異估計、迴歸估計的相對有效 性。(15 分)