lawpalyer logo

統計 111 年抽樣方法考古題

民國 111 年(2022)統計「抽樣方法」考試題目,共 13 題 | 資料來源:考選部

0 題選擇題 + 13 題申論題

某一新創產業的營運狀況調查,目的是想了解新創產業的營業額。抽樣方 法採一段集體抽樣(one-stage cluster sampling),新創產業共600 家公司 分散在30 個園區(cluster),首先由30 個園區抽出3 個園區,這3 個園 區內的新創公司數及總營業額列於下表。 園區(cluster) 公司數 ( i M ) 園區總營業額 (百萬元) ( iy ) 1 15 90
南興社區疑似爆發某流行病之群聚感染,為規劃後續防疫措施,亟需先 行瞭解該社區染病人數。現有兩種檢測方法可用於檢測是否染病,檢測 方法A 可迅速得到結果,但其精確程度較不理想,而檢測方法B 雖可提 供相當精確之結果,但其所需檢驗程序繁複,若要爭取時效,僅能施測 30 位。今先以方法A 對該社區所有之500 位居民進行檢測,驗得其陽 性比例為0.6,再以簡單隨機抽樣取出不放回之方式,由全社區之居民中 選擇30 位以方法B 進行施測,驗得其陽性為15 人,而這30 位受測者 以方法A 施測之陽性人數為13 人,且30 人中有26 位以方法A 及方法 B 檢驗之結果相同。請回答下列問題: 若僅以方法B 施測所得之結果推估本社區染病人數,請問其估計值及 95%信賴區間為何?(5 分) 是否可以整合兩種方法推估本社區染病人數?若您認為可以,請敘述 您採用的推估方式、本社區染病人數推估值及其95%信賴區間,同時 請問在上述兩種推估方式中,您會採取那一種及您的理由。(15 分)
25 110
在某大學所進行的某滿意度調查中,樣本為以簡單隨機抽樣取出不 放回所選擇出的n = 400 位大學部學生,該校大學部學生共5000 名, 400 位學生依其年級分類及各年級滿意樣本比例整理如下表: 大一 大二 大三 大四 樣本數( ix ) 200 100 50 50 滿意比例( ip ) 0.4 0.8 0.8 0.8 則全體學生滿意比例之不偏估計為200 0.4 100 0.8 50 0.8 50 0.8 0.6 400         根據註冊組提供之資料,該校大學部學生之各年級比例如下: 大一 大二 大三 大四 母體比例( i Q ) 0.3 0.3 0.2 0.2 請檢定在α = 0.05之水準下樣本比例與母體比例是否相符(請參考下表 之卡方分配95%百分位數)。(5 分) 根據子題之結論,請問滿意度0.6 的結果是否應加以修正?請敘明 理由,若您認為需要修正,請提供修正後之母體比例。(10 分) 自由度 1 5 10 20 2 0.95  3.84 11.07 18.31 31.41
40 280 分別就下列兩種抽樣設計利用對應的不偏估計量以估計整體新創產業的 總營業額及該估計量的標準誤。 若前述一段集體抽樣係結合簡單隨機抽樣(SRS)(one-stage cluster sampling with SRS)抽得該3 個園區。(15 分) 若前述一段集體抽樣係結合抽出機率與園區大小成比例(PPS)(one- stage cluster sampling with PPS)的抽樣方式抽得該3 個園區。(15 分) 二、欲估計2021 年某鄉鎮的總農民所得(Y),由300 家農戶抽樣調查30 家 農戶,定義x 為普查年(2016 年)所得,y 為2021 年所得。母體資料x 與 y 之變異數( 2 2 , x y S S )、共變數( xy S )及y 對x 之比率(R)如下所示: 2 2 2500, 6400, 3600, 1.3 x y xy S S S R     。 (母體變異數 2 S 係以 1 N 為分母,例如, 2 2 1 ( ) 1 N i x x X S N     ,式中X 為母 體均數。) 計算迴歸估計量(ܻ෠௟௥)、比率估計量(ܻ෠ோ)及均數估計量(ܻ෠)的變異 數。(15 分) 根據之結果,比較估計量的相對效率(relative efficiency),你認為那 個估計量精確度比較高?說明理由。(10 分) 三、針對某一社區2000 個家戶進行抽樣調查,以了解該社區有老人(65 歲 以上)的家戶比例(P)及平均家戶年所得(Y )。若欲在95%的信心水 準下,估計有老人家戶的比例之估計誤差低於3%的範圍,且估計平均 家戶年所得之估計誤差低於實際平均家戶年所得(Y )4%的範圍。實際 上,如果有老人的家戶比例落在20%到40%的範圍內,而實際平均家戶 年所得Y =1,000(千元)且變異數為400,000(千元)。若採用簡單隨機 抽樣方式欲同時滿足前述兩個估計精確度的要求,應抽多大的樣本? (20 分)
金芒鄉是主要的芒果產區,鄉內農戶有專門種植芒果之專業果農,也有 混種其他作物而僅部分種植芒果之農戶,專業芒果之農戶名冊可由農林 漁牧業普查資料中獲得,但兼種芒果之農戶時有變動,無法經由普查資 料中確認,惟為求精準推估金芒鄉本年度芒果產值,亦須將兼種芒果之 農戶之芒果產值列入。在本鄉一共500 戶農戶中,有100 戶為專業種植 芒果的農戶,而此100 戶中,有5 戶為大型農戶,95 戶為中小型農戶。 本調查以下列方式選擇樣本農戶進行金芒鄉本年度之調查:5 戶大型專 業芒果農戶全數加以調查。接下來在全金芒鄉之11 個村中,以簡單隨機 抽樣取出不放回之方式選擇其中6 個村,每個樣本村中再以簡單隨機抽 樣取出不放回之方式選擇5 戶中小型專業芒果農戶,若該村中小型專業 芒果農戶數不足或等於5 戶,則該村中所有中小型專業芒果農戶全數加 以調查。另外以簡單隨機抽樣取出不放回之方式在其餘農戶中選擇其中 50 戶作為樣本戶。 本調查各類農戶所得資料綜整如下: ⑴大型專業芒果農戶:平均值為125 萬元,標準差為20 萬元。 ⑵中小型專業芒果農戶:6 個樣本村之資料如下: 村別 文新村 文景村 文佑村 金河村 同億村 同欣村 總戶數 16
在某一城市裡有N=300 家餐廳,簡單隨機抽出2/3 為樣本('n =200 家 餐廳)以取得其餐廳大小(類別)的資訊。餐廳依其大小分成兩類(層): 小型餐廳和大型餐廳。進而再由每一類(層)餐廳抽幾家(n)調查其 2021 年的營業額(y),得到資料如下: 類別(層別) ' hn hn 平均每家營業額 iy (百萬元) 標準差 is 小型餐廳 120 10 20 10 大型餐廳 80
3 12 2 13 平均值(萬元) 30 25 30 25 20 30 標準差(萬元)
80 60 合計 200 15 請說明這是何種抽樣方式?(5 分) 就前述調查資料估計該城市餐廳平均每家營業額(Y )及該估計量之標 準誤。(20 分)
10
8 2 平均短漏報金額(萬元) 15 10 8 4 短漏報金額標準差(萬元) 40 30 50 10 配合前述抽樣設計,回答以下問題:(20 分) 估計平均短漏報金額(Y )及該估計量之標準誤。 估計短漏報比例(P)及該估計量之標準誤。 假設前述資訊已知,原樣本配置方式改為何種配置方式將可提高估計 精確度?(5 分) 依所建議之配置方式回答以下問題:(10 分) 若針對估計均數Y ,如何配置樣本n=100 到各層? 若針對估計比例P,如何配置樣本n=100 到各層? (註:答案如有小數,請計算至第二位) 四、欲調查某國家公園內的樹感染病蟲害的情況,該國家公園內共分成10 個 區域,首先由10 個區域隨機抽出4 個區域,再就被抽出的區域隨機抽 出5%的樹進行調查,調查結果如下表: 區域 i 樹種植 數量 i M 樹抽出 數量 im 樹感染病蟲害 數量 ia 1 200 10 1 2 300 15 5 3 300 15 5 4 400 20 4 說明此抽樣設計的名稱及兩階段的抽樣單位(Primary Sampling Units 及Secondary Sampling Units)。(15 分) 試估計該國家公園內的樹感染病蟲害的比例(P),並提供95%信賴區 間。(20 分) (註:答案如有小數,請計算至第二位)
5 8 8 ⑶其餘農戶:50 戶樣本戶中,有10 戶種植芒果,而這10 戶之平均芒果 產值為12 萬元,標準差為8 萬元。 請回答下列問題(請以萬元為單位作答): 請提出兩種不同估計方式,推估金芒鄉中小型專業芒果農戶之年度芒 果總產值,以及其相對應之變異數估計,並比較您提出之方法於本調 查之適用性。(20 分) 若以其他農戶之50 戶樣本戶中,10 戶有兼種芒果之農戶的平均芒果 產值12 萬元,做為全體兼種芒果農戶之平均芒果產值推估值,請問其 變異數估計值為何?(5 分) 請推估金芒鄉兼種芒果農戶之年度芒果總產值,並提出其變異數 估計值。(10 分) 四、今有一母體,其中有三個單元,各單元編號݅及其主要母體變量值ݕ௜ 如下表: ݅ 1 2 3 ݕ௜
5 3 若要從該母體中選擇2 個單元作為樣本,在不考慮抽樣順序及可重複選擇 之情形下,共有6 種可能之樣本組合,考慮一抽樣設計為每組樣本組合   , s i j  ,被選擇到之選擇機率為   / 24 p s i j   ,例如樣本組合(2,3)之 選擇機率為5/24,(1,1)被選擇之機率為2/24……等。 請回答下列問題(建議以分數計算及作答): 請問在本抽樣設計下,第݅個單元被選到之包含機率(Inclusion Probability)若為 i,則 2 為何?(5 分) 請問若以樣本平均 2 i i s y y   作為母體平均 3 1 3 i i y    之估計量,則y 在 本設計下推估之偏誤(Bias)為何?(5 分) y 在本設計下之均方誤差(Mean square error;MSE)為何?(5 分) 請就本設計提出一不偏估計量,請問您提出之估計量在樣本組合分別 為(2,3)及(3,3)的情況下之估計值為何?並證明或以本母體為例驗 證該估計量為不偏。(10 分) 請試述您要如何評估您所提出之不偏估計與y 在本設計下孰優孰劣? (不須計算實際數值)(5 分)