lawpalyer logo

統計 110 年抽樣方法考古題

民國 110 年(2021)統計「抽樣方法」考試題目,共 19 題 | 資料來源:考選部

0 題選擇題 + 19 題申論題

利用簡單隨機抽樣法(simple random sampling),自母體{6, 7, 8, 9, 10}中 抽出3 個數為一組樣本,樣本中的最大值以X 表示,最小值以Y 表示。 請列出X,Y 的聯合機率分配(joint probability distribution)f(x, y)。 (10 分) 請求算機率( 10, 7) p X Y   。(5 分) 請求算期望值( | 6) E X Y  。(5 分) 令 + Z X Y  ,請計算期望值( ) E Z 。(5 分)
工廠領班想了解生產線上發生意外事件時,作業員的臨場反應及危機處 理能力;遂欲估計作業員在面臨生產線發生意外事件時的平均反應時 間。已知該工廠共有作業員750 人,其中早班作業員有450 人,晚班作 業員有300 人。因工廠領班認為早、晚班不同班別的作業員在反應時間 上可能有所差異;故決定以班別來進行分層調查,而每位作業員的調查 成本是相同的。以前的調查資料顯示早班作業員的反應時間為4 到19 秒,晚班作業員的反應時間為10 到20 秒。 試決定早、晚班各層最佳的樣本配置率。(10 分) 在信賴度為95%且誤差界限為1 秒下,現欲估計作業員在面臨生產 線發生意外事件時的平均反應時間,需要調查多少位早、晚班作業 員?(10 分) 若調查總費用的預算為2,000 元,而每位作業員的調查成本是35 元, 為使估計式的變異數最小,則需調查多少位早、晚班作業員才能達到 此目的。(5 分) 註: 0.025 0.05 1.96 1.645 z z   , ;標準差約為全距的1/4。
某人欲研析某地區街貓數目,將該地區劃分為四等份並編號i=1, 2, 3, 4 如下: 1
公司在全國250 個銷售據點販賣新產品A,為了解A 產品的市場接受度, 行銷部門依全國地理位置分為甲、乙、丙、丁四個區域,其中甲區有85 個 銷售據點,乙區有70 個銷售據點,丙區有60 個銷售據點,丁區有35 個 銷售據點。現將每個區域視為一個層別,以分層隨機抽樣(stratified random sampling)法,自甲、乙、丙、丁各區中分別抽出15,12,8,5 個銷售據 點,調查每個銷售據點A 產品一週的銷售數量。由於各區幅員及交通狀況 不同,調查費用也隨之不同,已知甲、乙、丙、丁各區,調查每個銷售據 點的成本分為6.25、4、9、9(單位:萬元)。調查結果得A 產品在每個 銷售據點一週銷售數量的平均數及標準差資料如下: 區域 甲 乙 丙 丁 平均數 80.6 165 304 482 標準差 32.5 95.2 129.6 269.1 估計A 產品一週的總銷售量並計算其95%信賴區間。(10 分) 現公司的管理高層欲估計A 產品一週的總銷售量,及要求估計的95% 誤差界限為5000,則各區須調查多少個銷售據點,才能使調查總費用 最低?同時計算需花費多少的調查費用?(14 分) 若調查總費用的預算為350 萬元,請問各區銷售據點最佳的調查數量為 何,方能達到的要求?(6 分)
甲大學共有12 個系,120 個班級,7,450 名學生。為了解學生的平均體 重,該校學務處隨機自全校中抽出15 個班級,且對班級內的所有學生測 量體重。請問此次調查是採用那種抽樣方法?參數(parameter)為何? 抽樣單位(sampling unit)為何?母體大小(population size)為何?樣本 大小(sample size)為何?(25 分)
某貿易商進口了一批5000 箱的機能飲料,每箱飲料依序編號且每一箱內含 有20 瓶飲料。現貿易商的主管想了解每瓶飲料的平均咖啡因含量,遂依每 箱飲料編號順序,以每隔500 箱抽出一箱方式,自此批飲料中抽出10 箱, 檢測每箱飲料的咖啡因含量,分別為 1 2 10 , ,..., y y y 。(每小題10 分,共20 分) 請問貿易商的主管採用何種抽樣方法?母體大小為何? 參數為何?請寫出該參數的估計量。
某次資格考試共有N 個考生報考,若考試分數大於50 分即取得資格, 現欲了解此次考生取得資格的比例,遂自考生成績總表中抽出n 個成績 計算以估計之。已知考生成績總表有2 種形式:第一種是依考生准考證 的號碼列示,第二種是依考生成績的高低依序列示。試根據上述不同的 成績總表,說明適合採用何種抽樣方法來取得樣本,估計考生取得資格 的比例,並列出估計式。(25 分)
報名參加減肥中心春季班的班員共有200 人,經減肥中心量測得平均體重 為72.5 公斤。每位班員均採用減肥中心提供之飲食餐3 個月後,減肥中 心主管想了解班員體重情況,於是從班員中隨機選了10 位班員,並且測 量其體重。得這10 位班員減肥前及減肥後體重資料如下: 班員 1 2 3 4
某運動健身連鎖集團,全國共有100 個運動據點,現調查10 個據點,得 每個據點的員工人數及員工一天使用自家運動設備的總時數如下: 運動據點 員工人數 使用總時數 1 30 78 2 12 26 3 39 72 4 52 98
而其所採之抽樣設計分兩階段進行如下: ⑴首先隨機選擇一個區域並觀察該區域街貓數目(y୧)。 ⑵若y୧> 10,則繼續觀察其相鄰之兩個區域作為樣本區域,否則若y୧≤ 10,則隨機選擇剩下未觀察之三個區域中的其中一個區域作為樣本區 域。 例如若第1 個區域在第⑴階段被選,且y୧≤10,則在其他第2, 3, 4 等三 個區域中再隨機選擇一個區域觀察,若y୧> 10,則繼續觀察第2 及3 個 區域。注意:第1 及第4 個區域不相鄰,同理第2 及第3 個區域不相鄰。 今假設該地區街貓實際分布如下: yଵ= 7 yଶ= 13 yଷ= 19 yସ= 1 請根據此抽樣設計及母體,回答下列問題:(每小題5 分,共20 分) 若不考慮樣本出現順序,樣本組合為s = (2, 3)之機率為何? 第4 個區域之抽樣包含機率(inclusion probability)? 若以觀察值之平均值,記為y ,為母體平均之估計量,請問y 之偏誤 (bias)為何? 請問y 之均方誤差(mean square error)為何? 二、某人於康寧鄉進行一項有關110 年6 月農牧業從業戶之生產成本及收入 調查,該鄉共有3 戶養豬場,10 戶養雞場,農業從業戶之戶數不詳,但 由航空測量之空照圖可判明康寧鄉之農地面積為300 公頃,而根據公務 資料,康寧鄉6 月之雞隻在養隻數為10,000 隻。 其抽樣設計如下:養豬場全選,養雞場及農業戶則分別以簡單隨機抽樣 取出不放回之方式各選擇4 戶養雞場及10 戶農業戶,調查所得資料如 下: 養豬場: 6 月平均在養豬頭數 500 750 200 6 月生產成本(萬元) 300 450 150 養雞場: 6 月平均在養雞隻數 500 1500 300 200 6 月生產成本(萬元) 35 120 15 30 農業戶: 耕地面積(公頃) 2 0.5
考慮集群抽樣,若母體總數M 已知,請問母體總和的估計量為何?若 不知母體總數M,但知道集群總數N 時,請問母體總和的估計量為 何?(5 分) 考慮兩階段集群抽樣,證明母體平均估計量 1 1 n i i i M y n M     是母體平 均的不偏估計量。其中M =M/N。提示: 1 2|1 ( ) ( ) E E E    (10 分) 考慮兩階段集群抽樣,由相等大小集群M 抽取相等大小樣本m,且當 N 很大時,證明在固定抽樣成本下,使 2 2 1 ( ) ( ) w b V n m      值最小的m 為 2 1 2 2 w b c m c    ,其中1c 是第一階段每一觀察值的成本,2c 是第二階段每 一觀察值的成本, 2 b 是集群平均間的變異數, 2 w 是集群內元素間的變 異數。(10 分)
37 74
1 0.3 2 1.2 3 1 4 6 月生產成本(萬元) 2
33 57
6 1 5 5 2 3 5 5 請回答下列問題: 請以您認為合適的估計量推估康寧鄉養雞場平均6 月每場之生產成本 以及其95%信賴區間,並說明使用該估計量之理由,並據以計算如果 下年度想針對康寧鄉的養雞場再執行一次生產成本調查以推估該年 度6 月平均每場生產成本,並希望能將95%最大抽樣誤差控制在6 萬 元以內,請問所需最小樣本數為何?(15 分) 請問康寧鄉畜牧戶從業戶6 月平均每場之生產成本以及其95%信賴區 間為何?(10 分) 請以您認為合適的估計量推估康寧鄉6 月總生產成本以及其95%信賴 區間,並說明使用該估計量之理由。(10 分) 請問康寧鄉6 月農牧業總生產成本以及其95%信賴區間為何?(5 分) 三、龍江大學企業管理學系規劃於系館增設一性別友善廁所,事前先行對全 系學生進行意願調查,調查方式是以簡單隨機抽樣取出不放回的方式於 全系240 位學生(其中有200 位女學生及40 位男學生)中,選擇60 位 學生作為調查樣本,並詢問其對增設性別友善廁所之意見。 於60 位樣本學生中,共有24 位學生表示贊成。而60 位樣本學生中有 30 位男同學,30 位女同學,男同學中有6 位表示贊成,女同學中則有 18 位表示贊成。(每小題10 分,共20 分) 請以您認為合適的估計量推估龍江大學企業管理學系學生贊成增設性 別友善廁所之比例及其95%信賴區間,並說明採用此一估計量之理由。 會計學系也想參考企業管理學系的經驗,規劃設立性別友善廁所並先 對學生意見進行調查。系主任計劃分別由女同學及男同學中各以簡單 隨機抽樣取出不放回的方式選擇若干同學,總計希望能由會計學系的 250 位學生中選擇100 位學生作為調查樣本。因為會計學系男女生比 例為4:6,因此系主任規劃男學生之樣本數為40,而女學生之樣本數 為60。請問您是否認同此一樣本數配置,請說明您的理由,同時如果 您不認同,請提出您認為較適當的樣本數配置。 四、為推估三民市內之便利商店每日營業額以作為評估是否應該投入經營 便利商店之參考,某人在三民市內總數為50 間的便利商店中,以簡單隨 機抽樣取出不放回的方式選擇了10 間便利商店,並詢問其店長當日該 店預估之營業額,同時並提供200 元之禮券以答謝店長之合作。調查所 得資料中,10 間樣本便利商店之日營業額資料如下:(樣本平均為6 萬 元,樣本變異數為2.67(萬元)2) 商店編號 1 5 6 14 17 21 32 42 43 45 日營業額 (萬元) 5 3 6 6 6
41 76
9 10 減肥前體重 58 82 64 76 64 76 54 50 88 94 減肥後體重 52 70 64 64 58 70 52 46 76 82 分別以比率估計量(ratio estimator)、廻歸估計量(regression estimator) 及差數估計量(difference estimator),估計班員減肥後的平均體重,並 計算其變異數。(21 分) 根據的結果,您會建議採用那一個估計量?(4 分)
14 48 9 40 58 10 27 50 若此資料是由100 個運動據點中,以簡單隨機抽樣法抽出的10 個運動 據點所得,試估計每位員工一天使用自家運動設備的平均時數。(5 分) 根據小題,試估計該運動健身連鎖集團,員工一天使用自家運動設 備的總時數,並求算此總時數的95%信賴區間。(10 分) 因使用自家運動設備的總時數與員工人數有相關,若此資料是由100 個運動據點中,以抽樣機率與大小成比例(sampling with probabilities proportional to size)的抽樣法抽出的10 個運動據點所得,試估計每位 員工一天使用自家運動設備的平均時數。(10 分) 註: 0.025 0.05 1.96 1.645 z z   ,
4 7 8 某人又由上表的10 間商店中,以簡單隨機抽樣取出不放回的方式選擇其 中5 間,請店長提供其當日營業報表之總結摘要,以記錄其實際日營業額, 同時又額外提供1000 元禮券給這5 位店長作為答謝。其資料如下: 商店編號 5 17 21 32 42 報表摘要日營業額 (萬元) 5 9 9 11 8 請回答下列問題:(每小題10 分,共20 分) 請以適當之方式推估三民市之便利商店之平均日營業額及其95%信賴 區間。 在這次調查中總共花費了7,000 元購買禮券,請問若想再執行一次抽 樣設計相同之調查,但將購買禮券之預算增加為8,000 元,請問直接 詢問店長日營業額及查閱營業報表之樣本數應如何配置為宜?