統計 111 年抽樣方法考古題

資料由法律人 LawPlayer整理提供·歷屆國考試題完整收錄 / 法律人 LawPlayer 編輯整理

統計 111 年抽樣方法考古題

民國 111 年（2022）統計「抽樣方法」考試題目，共 13 題 | 資料來源：考選部

切換年份：114 113 112 111 110 109 108 107 106 105 104 103 102 101 100 99 98 97 96 95 94 93 92 91

0 題選擇題 + 13 題申論題

某一新創產業的營運狀況調查，目的是想了解新創產業的營業額。抽樣方法採一段集體抽樣（one-stage cluster sampling），新創產業共600 家公司分散在30 個園區（cluster），首先由30 個園區抽出3 個園區，這3 個園區內的新創公司數及總營業額列於下表。園區（cluster）公司數（ i M ）園區總營業額（百萬元）（ iy ） 1 15 90

南興社區疑似爆發某流行病之群聚感染，為規劃後續防疫措施，亟需先行瞭解該社區染病人數。現有兩種檢測方法可用於檢測是否染病，檢測方法A 可迅速得到結果，但其精確程度較不理想，而檢測方法B 雖可提供相當精確之結果，但其所需檢驗程序繁複，若要爭取時效，僅能施測 30 位。今先以方法A 對該社區所有之500 位居民進行檢測，驗得其陽性比例為0.6，再以簡單隨機抽樣取出不放回之方式，由全社區之居民中選擇30 位以方法B 進行施測，驗得其陽性為15 人，而這30 位受測者以方法A 施測之陽性人數為13 人，且30 人中有26 位以方法A 及方法 B 檢驗之結果相同。請回答下列問題： 若僅以方法B 施測所得之結果推估本社區染病人數，請問其估計值及 95%信賴區間為何？（5 分） 是否可以整合兩種方法推估本社區染病人數？若您認為可以，請敘述您採用的推估方式、本社區染病人數推估值及其95%信賴區間，同時請問在上述兩種推估方式中，您會採取那一種及您的理由。（15 分）

25 110

在某大學所進行的某滿意度調查中，樣本為以簡單隨機抽樣取出不放回所選擇出的n = 400 位大學部學生，該校大學部學生共5000 名， 400 位學生依其年級分類及各年級滿意樣本比例整理如下表：大一大二大三大四樣本數（ ix ） 200 100 50 50 滿意比例（ ip ） 0.4 0.8 0.8 0.8 則全體學生滿意比例之不偏估計為200 0.4 100 0.8 50 0.8 50 0.8 0.6 400         根據註冊組提供之資料，該校大學部學生之各年級比例如下：大一大二大三大四母體比例（ i Q ） 0.3 0.3 0.2 0.2 請檢定在α = 0.05之水準下樣本比例與母體比例是否相符（請參考下表之卡方分配95%百分位數）。（5 分） 根據子題之結論，請問滿意度0.6 的結果是否應加以修正？請敘明理由，若您認為需要修正，請提供修正後之母體比例。（10 分）自由度 1 5 10 20 2 0.95  3.84 11.07 18.31 31.41

40 280 分別就下列兩種抽樣設計利用對應的不偏估計量以估計整體新創產業的總營業額及該估計量的標準誤。 若前述一段集體抽樣係結合簡單隨機抽樣（SRS）（one-stage cluster sampling with SRS）抽得該3 個園區。（15 分） 若前述一段集體抽樣係結合抽出機率與園區大小成比例（PPS）（one- stage cluster sampling with PPS）的抽樣方式抽得該3 個園區。（15 分）二、欲估計2021 年某鄉鎮的總農民所得（Y），由300 家農戶抽樣調查30 家農戶，定義x 為普查年（2016 年）所得，y 為2021 年所得。母體資料x 與 y 之變異數（ 2 2 , x y S S ）、共變數（ xy S ）及y 對x 之比率（R）如下所示： 2 2 2500, 6400, 3600, 1.3 x y xy S S S R     。（母體變異數 2 S 係以 1 N 為分母，例如， 2 2 1 ( ) 1 N i x x X S N     ，式中X 為母體均數。） 計算迴歸估計量（ܻ෠௟௥）、比率估計量（ܻ෠ோ）及均數估計量（ܻ෠）的變異數。（15 分） 根據之結果，比較估計量的相對效率（relative efficiency），你認為那個估計量精確度比較高？說明理由。（10 分）三、針對某一社區2000 個家戶進行抽樣調查，以了解該社區有老人（65 歲以上）的家戶比例（P）及平均家戶年所得（Y ）。若欲在95%的信心水準下，估計有老人家戶的比例之估計誤差低於3%的範圍，且估計平均家戶年所得之估計誤差低於實際平均家戶年所得（Y ）4%的範圍。實際上，如果有老人的家戶比例落在20%到40%的範圍內，而實際平均家戶年所得Y =1,000（千元）且變異數為400,000（千元）。若採用簡單隨機抽樣方式欲同時滿足前述兩個估計精確度的要求，應抽多大的樣本？（20 分）

金芒鄉是主要的芒果產區，鄉內農戶有專門種植芒果之專業果農，也有混種其他作物而僅部分種植芒果之農戶，專業芒果之農戶名冊可由農林漁牧業普查資料中獲得，但兼種芒果之農戶時有變動，無法經由普查資料中確認，惟為求精準推估金芒鄉本年度芒果產值，亦須將兼種芒果之農戶之芒果產值列入。在本鄉一共500 戶農戶中，有100 戶為專業種植芒果的農戶，而此100 戶中，有5 戶為大型農戶，95 戶為中小型農戶。本調查以下列方式選擇樣本農戶進行金芒鄉本年度之調查：5 戶大型專業芒果農戶全數加以調查。接下來在全金芒鄉之11 個村中，以簡單隨機抽樣取出不放回之方式選擇其中6 個村，每個樣本村中再以簡單隨機抽樣取出不放回之方式選擇5 戶中小型專業芒果農戶，若該村中小型專業芒果農戶數不足或等於5 戶，則該村中所有中小型專業芒果農戶全數加以調查。另外以簡單隨機抽樣取出不放回之方式在其餘農戶中選擇其中 50 戶作為樣本戶。本調查各類農戶所得資料綜整如下： ⑴大型專業芒果農戶：平均值為125 萬元，標準差為20 萬元。 ⑵中小型專業芒果農戶：6 個樣本村之資料如下：村別文新村文景村文佑村金河村同億村同欣村總戶數 16

在某一城市裡有N=300 家餐廳，簡單隨機抽出2/3 為樣本（'n =200 家餐廳）以取得其餐廳大小（類別）的資訊。餐廳依其大小分成兩類（層）：小型餐廳和大型餐廳。進而再由每一類（層）餐廳抽幾家（n）調查其 2021 年的營業額（y），得到資料如下：類別（層別） ' hn hn 平均每家營業額 iy （百萬元）標準差 is 小型餐廳 120 10 20 10 大型餐廳 80

3 12 2 13 平均值（萬元） 30 25 30 25 20 30 標準差（萬元）

80 60 合計 200 15 請說明這是何種抽樣方式？（5 分） 就前述調查資料估計該城市餐廳平均每家營業額（Y ）及該估計量之標準誤。（20 分）

8 2 平均短漏報金額（萬元） 15 10 8 4 短漏報金額標準差（萬元） 40 30 50 10 配合前述抽樣設計，回答以下問題：（20 分） 估計平均短漏報金額（Y ）及該估計量之標準誤。 估計短漏報比例（P）及該估計量之標準誤。 假設前述資訊已知，原樣本配置方式改為何種配置方式將可提高估計精確度？（5 分） 依所建議之配置方式回答以下問題：（10 分） 若針對估計均數Y ，如何配置樣本n=100 到各層？ 若針對估計比例P，如何配置樣本n=100 到各層？（註：答案如有小數，請計算至第二位）四、欲調查某國家公園內的樹感染病蟲害的情況，該國家公園內共分成10 個區域，首先由10 個區域隨機抽出4 個區域，再就被抽出的區域隨機抽出5%的樹進行調查，調查結果如下表：區域 i 樹種植數量 i M 樹抽出數量 im 樹感染病蟲害數量 ia 1 200 10 1 2 300 15 5 3 300 15 5 4 400 20 4 說明此抽樣設計的名稱及兩階段的抽樣單位（Primary Sampling Units 及Secondary Sampling Units）。（15 分） 試估計該國家公園內的樹感染病蟲害的比例（P），並提供95%信賴區間。（20 分）（註：答案如有小數，請計算至第二位）

5 8 8 ⑶其餘農戶：50 戶樣本戶中，有10 戶種植芒果，而這10 戶之平均芒果產值為12 萬元，標準差為8 萬元。請回答下列問題（請以萬元為單位作答）： 請提出兩種不同估計方式，推估金芒鄉中小型專業芒果農戶之年度芒果總產值，以及其相對應之變異數估計，並比較您提出之方法於本調查之適用性。（20 分） 若以其他農戶之50 戶樣本戶中，10 戶有兼種芒果之農戶的平均芒果產值12 萬元，做為全體兼種芒果農戶之平均芒果產值推估值，請問其變異數估計值為何？（5 分） 請推估金芒鄉兼種芒果農戶之年度芒果總產值，並提出其變異數估計值。（10 分）四、今有一母體，其中有三個單元，各單元編號݅及其主要母體變量值ݕ௜ 如下表： ݅ 1 2 3 ݕ௜

5 3 若要從該母體中選擇2 個單元作為樣本，在不考慮抽樣順序及可重複選擇之情形下，共有6 種可能之樣本組合，考慮一抽樣設計為每組樣本組合   , s i j  ，被選擇到之選擇機率為   / 24 p s i j   ，例如樣本組合（2,3）之選擇機率為5/24，（1,1）被選擇之機率為2/24……等。請回答下列問題（建議以分數計算及作答）： 請問在本抽樣設計下，第݅個單元被選到之包含機率（Inclusion Probability）若為 i，則 2 為何？（5 分） 請問若以樣本平均 2 i i s y y   作為母體平均 3 1 3 i i y    之估計量，則y 在本設計下推估之偏誤（Bias）為何？（5 分） y 在本設計下之均方誤差（Mean square error；MSE）為何？（5 分） 請就本設計提出一不偏估計量，請問您提出之估計量在樣本組合分別為（2,3）及（3,3）的情況下之估計值為何？並證明或以本母體為例驗證該估計量為不偏。（10 分） 請試述您要如何評估您所提出之不偏估計與y 在本設計下孰優孰劣？（不須計算實際數值）（5 分）

統計 111 年其他科目

國文外國文(英文)抽樣方法與迴歸分析法學知識法學知識與英文統計學統計實務(以實例命題)經濟學資料處理公民與英文統計學大意資料處理大意統計學概要統計實務概要經濟學概要資料處理概要迴歸分析統計實務概要(以實例命題)英文中華民國憲法與英文策略規劃與問題解決統計學研究統計實務研究(以實例命題)統計實務(以實務命題)企業管理概要鐵路法概要中華民國憲法概要中華民國憲法公民與本國史地大意公共衛生學概要專業知識測驗(統計學概要)微生物學概要流行病學概要綜合知識測驗(一)(中華民國憲法概要、本國歷史、地球科學)綜合知識測驗(二)(法學緒論、數的推理)政府統計線性模式統計實務公共衛生學專業知識測驗(統計學、資料處理)流行病學生物統計學綜合知識測驗(一)(中華民國憲法、法學緒論、數的推理)綜合知識測驗(二)(本國歷史、地球科學、英文)醫用微生物及免疫學醫療制度與衛生法規

查看所有考試的「抽樣方法」考古題 →

本頁資料來源：考選部歷屆試題·整理提供：法律人 LawPlayer· lawplayer.com