lawpalyer logo

抽樣方法考古題|歷屆國考試題彙整

橫跨多種國家考試的抽樣方法歷屆試題(選擇題 + 申論題)

年份:

統計 100 題

3C 產業研究員想瞭解A 市老年居民(年滿65 歲以上)每年購買3C 產 品的支出情形。由於A 市幅員遼闊,為方便調查,今將A 市依地理位置 劃分為400 個區集,現自400 個區集中抽出8 個區集,調查每區集的老 年居民人數及每年購買3C 產品的支出總額。調查資料如下: 區集 1
某機構希望能了解國人出國旅遊時,對「自動查驗通關」服務之滿意程度。 但無法獲得相關民眾之資料,因此進行一項電話訪問調查,調查對象為年 滿20 歲之全體民眾。問卷內容除受訪者基本資料之外,主要問題包括詢 問受訪者在過去一年是否有出國旅遊(含公務及求學等)經驗,再詢問有 出國經驗之受訪者對「自動查驗通關」服務是否滿意。調查總樣本數為 1,068 份,其中有356 位受訪者表示有出國經驗,其中又有267 位表示對 「自動查驗通關」服務非常滿意。 請問依據本調查資料,國人過去一年有出國旅遊經驗之比例推估值及其 95%信賴區間為何?(10 分) 請問國人非常滿意「自動查驗通關」服務之比例推估值及其95%信賴區 間為何?(15 分) 如果下一年度要舉行同一項調查,而希望出國比例推估值之正負誤差能 控制在95%之信心水準下不超過3%,請問所需最小樣本數為何?(10 分)
興民里里長計畫舉辦元宵節里民聯歡活動,為評估所需餐點費用,想先評 估參與里民人數,因此想由全里500 戶中,隨機選擇50 戶,然後詢問樣 本戶內所有里民的參與意願藉以估計全里的參與人數。 請問里長在沒有任何統計軟體/計算工具,僅有紙筆的情形下,如何以簡 單隨機抽樣取出不放回的方式選擇樣本戶?(5 分) 請問這位里長使用的是那一種抽樣設計?請敘述這種抽樣設計在抽樣 調查實務上的優缺點。(10 分) 假定這50 戶樣本戶中,平均每戶參加人數為1.2 人;另外,這50 戶樣 本戶中,共有200 位里民,而全里共有3,000 位里民。根據以上資訊, 請問興民里里民會參與聯歡活動人數的不偏估計值與比例估計之估計 值各是多少?(10 分)
某員工數達1,000 位員工之企業集團為評估是否應在集團內設置性別平等 委員會,希望先了解企業內員工對企業職場性別平等議題之意見,隨機選 取了100 位員工,詢問其認為本集團之企業文化或政策是否仍有因性別而 有不公平甚至歧視之狀況。在100 位受訪員工中,有30 位表示企業內仍 有相關不平等現象,因此在董事會中提報員工認為仍有因性別所導致之不 公平待遇等現象比例為0.3。但某董事進一步檢視資料後發現,100 位受 訪員工中有70 位男性,但僅有30 位女性,可是本集團中男女性員工之比 例為各占50%,因此質疑樣本之性別代表性恐有疑慮,同時30 位表示企 業內仍有相關不平等現象的員工中,女性有25 位,而男性僅有5 位。 請以適當之檢定檢驗此一調查中,性別之樣本比例與母體比例在95%信 心水準下是否相符。(10 分) 根據前述檢驗結果,請問0.3 之比例是否應該修正?若不需修正,請問 理由為何?若需修正,請問修正後之比例及其變異數估計為何?(15 分) 該董事要求在同樣之總樣本數下重新執行一次調查,同時需要以性別分 層,並適當配置樣本數以使得比例推估之變異最小化,請問男女性員工 樣本數配置各為何?(15 分)
老年居民人數 6 14 20 3 10 8 12 12 支出總額(單位:萬元)14 39 52 12 41 33 37 40 請問此調查採用何種抽樣方法?(5 分) 請問A 市每位老年居民每年購買3C 產品的平均支出金額?(5 分) 請問A 市老年居民每年購買3C 產品的總支出金額,並求算此總支出 金額的95%信賴區間?(10 分) 若已知A 市共有4,200 位老年居民,利用此資料估計A 市老年居民每 年購買3C 產品的總支出金額。請比較,這兩種估計方法那一種 較適合此調查?(10 分) 註: 0.025 1.96 z  二、幸福社區居民共有3,000 人,為瞭解社區居民的健康狀況,以簡單隨機 抽樣法,抽出200 位居民調查其體重。調查結果顯示居民的平均體重為 55 公斤,標準差為10 公斤;同時,有40 位的居民體重超過90 公斤。 請估計幸福社區每位居民的平均體重。(5 分) 請估計幸福社區體重超過90 公斤的居民總數。(5 分) 若希望估計每位居民平均體重的信賴度為95%且誤差界限為1 公斤; 同時,估計居民體重超過90 公斤的比例p 的信賴度為95%且誤差界 限為0.03 時,須調查多少位居民?(15 分) 三、快樂公司共有員工1,000 人,其中外部員工有600 人,內部員工有400 人。為瞭解員工的薪資結構,決定以分層隨機抽樣法自員工中共抽出100 人調查,其中各層樣本數使用比例配置法。調查結果為外部員工平均月 薪6 萬元,標準差2 萬元;內部員工平均月薪4 萬元,標準差1.5 萬元。 請估計快樂公司每位員工的平均月薪,並求此平均月薪的95%信賴 區間。(10 分) 請問外部員工的月薪差異是否比內部員工的月薪差異大?(5 分) 請估計外部員工與內部員工之平均月薪差。在95%信賴水準下,此平 均月薪差是否有顯著?(10 分) 四、微笑公司的全臺銷售門市共有40 家,分屬於甲,乙,丙,丁等4 個地 區,甲地區有11 個銷售門市(編號1~11),乙地區有9 個銷售門市(編 號12~20),丙地區有8 個銷售門市(編號21~28),丁地區有12 個銷 售門市(編號29~40)。其中編號1, 3, 4, 12, 13, 14, 21, 22, 23, 24, 25, 29, 30, 31 的銷售門市設有熟食部。公司的管理者想利用系統抽樣來估計設 有熟食部的銷售門市占所有銷售門市的比例p。 採「8 中取1」系統抽樣,請列出所有可能的樣本。(7 分) 利用證明樣本比例ˆp 為p 之不偏估計式;並計算ˆp 的期望值及真實 變異數。(8 分) 若「8 中取1」系統抽樣的起始值為1,請問設有熟食部的銷售門市占 所有銷售門市的比例p 之95%信賴區間。(5 分)
請說明「抽樣誤差」與「非抽樣誤差」之意義?並比較兩者之差異。(20 分)
某布料工廠的1 項產品規格為長度400 公分之大型布匹,工廠的品管部門 為掌握布匹之品質,會定期進行產品規格檢驗,例如:從1 件大型布匹隨 機裁剪5 處布料進行化學檢驗,以確保布料產品符合標準規格。如果你身 為工廠之品管人員,要在布匹上隨機裁剪5 個檢驗點,請分別以系統抽樣 法、簡單隨機抽樣法及分層隨機抽樣法進行裁剪,請問你所設計之5 個樣 本檢驗點位置(以公分為單位)為何?(20 分)
假設有個四面體的公正骰子,骰子的四面體分別有數字{1, 2, 3, 4},某人 丟擲此1 公正骰子2 次(即為n=2 樣本),令x୧表示第i次骰子出現的點 數,i =1, 2,則樣本平均數為 1 2 x +x x= 2 ,請問 1x 與 2 x 的聯合機率分配為何? x 的抽樣分配為何?x 的平均數與變異數為何?(30 分)
某電影院行銷經理想要瞭解當前大學生每月觀看電影之次數,經調查後有 3 個觀看電影之集群資料,集群A 有3 位大學生本月觀看電影次數之資料 為{3, 6, 3};集群B 有4 位大學生本月觀看電影次數之資料為{4, 2, 6, 8}; 集群C 有5 位大學生本月觀看電影次數之資料為{4, 3, 5, 2, 6}。運用機率 比例抽樣(probability proportional to size, PPS)方式從上述集群中抽出2 個集群為樣本,假設抽出的2 個集群分別為集群A 和集群C,請分別計算 群體總和(ܺ෠pps)、群體平均數(ܺധ෠ pps)之估計數及其變異數為何?(30 分)
M N i i m   ),再由這N 個集群中用簡單隨機抽樣法抽出n 個集群,被 抽中的集群中的每一個元素均被調查。假設 iy 為第i 個集群中所有觀測 值的總和,欲估計母體的總和。母體總和τ的估計量有: 比率估計量⑴: 1 1 ˆ n i i n i i y M m       不偏估計量⑵: 1 ˆ n i i N y n     或是由這N 個集群中用pps(sampling with probabilities proportional to size)抽出n 個集群,被抽中的集群中的每一個元素均被調查。則母體總 和τ的估計量: pps 估計量⑶: 1 ˆ n i pps i i y M n m     請說明此三估計量之使用時機。(15 分) 某公司在臺灣一共有100 個廠區,因最近疫情關係供貨吃緊,總經理想要 估計所有100 個廠區員工未來一年請病假的總天數。100 個廠區可細分 為70 家小廠及30 家大廠。從過去經驗,小廠員工請假天數約在0~100 天 病假,大廠員工請假天數約在10~210 天病假,估計誤差界限設為500 天。 請找出可達到這個界限的適當樣本大小及各層配置樣本大小。(15 分) 表一為臺灣60 大城市之11 月份降雨量(單位:公厘mm)。城市1 至城 市60 排列方式是依地理位置從北到南依序排列。城市號碼愈小所在位 置也就愈偏臺灣北部,城市號碼愈大所在位置也就愈偏臺灣南部。 假設用簡單隨機抽樣法抽出 10 n  個臺灣大城市(10 個樣本的號碼如 下:2、12、16、20、24、27、32、40、47、56),試估計臺灣60 大城 市之11 月份平均降雨量( ˆ) 及其估計變異數( ˆ( )ˆ ) V  ?(10 分) 選擇一組10 個樣本的系統樣本,為統一起見,一律採用起始號碼3。 試以此組系統樣本估計臺灣60 大城市之11 月份平均降雨量( ˆ) 及其 估計變異數( ˆ( )ˆ ) V  ?假設母體為隨機排列。(10 分) 如果採重複系統抽樣,抽出兩個"12 取1"的系統樣本,為統一起見, 一律採用起始號碼1 及6。試以此兩組重複系統樣本估計臺灣60 大城 市之11 月份平均降雨量( ˆ) 及其估計變異數( ˆ( )ˆ ) V  ?(15 分) 表一臺灣60 大城市之11 月份降雨量 單位:mm 城市 1
欲了解某一工業園區N家製造業者AI人才的需求狀況,下述三種抽樣設計 可用以推估該工業園區有AI人才需求的業者家數比例及總需求人數: ⑴如果園區各業者的營業規模已知,首先將業者依其營業規模分成L層 (1, , L  ),每層家數分別為 1, , L N N  ,再由每層抽取一簡單隨機樣 本,分別為 1, , L n n  ,以調查業者的AI人才需求狀況。 ⑵如果園區各業者的營業規模未知,但已知園區業者營業規模的比例分 別為 1, , L W W  ,首先由N家業者抽取一簡單隨機樣本(n)調查業者規 模及AI人才需求狀況後,再根據調查結果依其規模分成L層進行推估。 ⑶如果沒有園區業者營業規模的資訊,首先由N家業者抽取一簡單隨機樣 本n,取得營業規模資訊,而後根據營業規模資訊將n家業者依其營業 規模分成L層( 1, , L n n    ),再由每層抽取一簡單隨機樣本,分別為 1, , L n n  ,調查業者的AI人才需求狀況。 說明前述三種抽樣設計的抽樣方法為何?(10分) 若欲估計園區AI總需求人數(Y ),分別列出對應前述三種抽樣方法的 估計量(estimator)及該估計量之變異數的估計量。(15分)
有關單位為瞭解我國農家所得狀況,於本年度進行一項農家所得調查, 調查目的除了要推估全體農耕戶之平均所得之外,也需要瞭解不同經營 類別(亦即主要種植作物,如稻米、蔬菜、水果等)之農戶所得。所採 用之抽樣設計以農林漁牧普查資料中農牧戶為抽樣母體,將農牧戶依其 經營類別分為稻作、蔬菜、水果、其他農作物及畜牧戶共五大類,在各 經營類別農家中,以簡單隨機抽樣取出不放回的方式,各選取若干樣本 戶,資料蒐集方式為家戶問卷面訪。 本年度調查結束後之檢討會議中,有人提出因為農家多分布於鄉下甚至 偏鄉地區,樣本戶與樣本戶之間多半間隔相當之距離,調查員需要花費 相當多的時間及交通費成本完成訪查。因此建議於下年度調查時,將抽 樣設計修正為先以簡單隨機抽樣取出不放回的方式,在全國約7,500 個 村里中隨機選取,再派遣調查員至樣本村里訪問所有農戶,如此應能有 效降低調查所需之時間及交通費成本。 請回答下列問題: 執行本年度調查使用的抽樣設計之主要注意事項為何?(6 分) 會議中所建議下年度採用的是何種抽樣設計?並請說明此一抽樣設 計之主要優缺點。(6 分) 會議中所建議下年度採用的抽樣設計對於本調查之需求目的是否合 宜?理由為何?(8 分)
某一縣市共4000家養雞戶分散在20個村里(cluster),欲透過調查了解該 縣市養雞戶的所得狀況,抽樣方法可採用一階段集體抽樣(single-stage cluster sampling)或二階段集體抽樣(two-stage cluster sampling)。 若抽樣方法採一階段集體抽樣,首先由20個村里以簡單隨機抽樣(SRS) 抽出3個村里,就抽得的3個村里之養雞戶全數調查,調查結果村里內養 雞戶數及平均年所得列於下表: 村里 (cluster) i 養雞戶數 ( i M ) 村里內養雞戶 平均每戶年所得(百萬元) ( iy ) 1 150 4 2 200 8
成功里里長進行一項調查,以瞭解里內家戶的家犬飼養狀況,在全里500 戶家戶中以簡單隨機抽樣的方式選擇50 戶樣本戶進行調查。在這50 戶 樣本戶中,有12 戶飼養家犬,而這12 戶家戶養犬平均每月花費2,000 元,每月養犬平均花費之樣本變異數為1,000,000 平方元。請回答下列問 題: 若以2,000 元作為養犬戶的每月平均養犬花費的推估值,請問該推估 值之變異數估計為何?(5 分) 請推估成功里每月養犬之總花費。(8 分) 請問建構成功里養犬之總花費的95%信賴區間所需標準誤之估計為 何?(12 分)
250 5.6 採用集體大小比率估計量(ratio-to-size estimator, Ry )估計該縣市養雞 戶平均每戶年所得(以百萬元為單位)及該估計量之標準誤。(10分) 若抽樣方法採二階段集體抽樣,首先由20個村里以簡單隨機抽樣抽出3 個村里,再就抽得的3個村里之養雞戶以簡單隨機抽樣分別抽出1/10養 雞戶進行調查,調查結果養雞戶之平均所得列於下表: 村里 (cluster) i 農戶數 ( i M ) 抽出養雞戶數 ( i m ) 村里內抽得之養雞戶平均 每戶年所得及標準差 (百萬元) ( , i i y s ) iy is 1 150 15
銘興大學以該校學生為對象,進行一項學校行政滿意度調查,抽樣設計 為依學制將學生分為大學部、碩士班及博士班三類,於各類學生中以簡 單隨機抽樣的方式各選擇200 位學生作為樣本並加以訪談,記錄其對學 校行政效率是否滿意。其調查結果概要如下: 學制 學制樣本滿意比例 學制學生總數 大學部 0.25 3000 碩士班 0.65 1000 博士班 0.55 500 請回答下列問題: 請推估銘興大學學生對該校行政效率滿意之比例以及該推估量之標 準誤估計值。(10 分) 銘興大學校方為提升行政效率,每學期固定實施一次調查。請問在下 次調查時,於總樣本數為600 的條件下,各學制皆為200 位學生之樣 本數配置是否恰當?請敘述理由。若認為各學制學生樣本數應重新配 置,請提出配置結果(包含規畫樣本數配置應考慮之因素、如何計算 以及計算結果)。(15 分)
1 2 200 20 7 3 3 250 25 6 2 試問:(15分) ⑴本抽樣設計第一階段的抽樣單位(primary sampling unit, PSU)及第 二階段的抽樣單位(secondary sampling unit, SSU)分別為何? ⑵採用不偏估計量(unbiased estimator, y )估計該縣市養雞戶平均每 戶年所得(以百萬元為單位)及該估計量之標準誤。 三、欲了解某區域養殖漁戶營運狀況,該區域共有800家養殖漁戶,首先由該 區域抽得一個包含500戶(第一重樣本 500 n )的簡單隨機樣本以取得養 殖型態(是否為漁電共生的層別資訊),調查得知其中100戶為漁電共生 戶,進而以簡單隨機抽樣由漁電共生及非漁電共生的養殖漁戶分別抽20% 以調查其營運成本資訊,調查結果整理如下表: 養殖型態(層別) 第一重樣本 (戶) hn  第二重樣本 (戶) hn 養殖漁戶年營運成本 平均年營運成本 iy (十萬元) 標準差 is (十萬元) 漁電共生(I) 100 20 120 100 非漁電共生(II) 400 80 50 60 合計 500(n) 100(n ) 75(s) 估計該區域養殖漁戶平均年營運成本(Y )(以十萬元為單位)及該估計 量的標準誤。(10分) 如果此調查總預算為44,500元,取得養殖型態的單位成本為9元,調查 營運成本的單位成本為400元( 9, 400 h c c   ),有關標準差、各層權 重、各層平均年營運成本及標準差之母體資訊分別以前述樣本資料(s, i i n w n   , iy , is )取代。試求:(15分) ⑴決定分層雙重抽樣的最佳抽樣設計(Optimum double sample plan), 亦即求算 h n n 、。 ⑵就⑴的抽樣設計求算平均年營運成本估計量(以十萬元為單位)的 變異數。 四、欲了解2022年國內汽車銷售概況,就2000家汽車銷售業者進行調查,汽車 銷售業者分為兩大類:國產型(I)及進口型(II),業者家數分別為 1 N =1500 及 2 N =500。抽樣方法採用分層隨機抽樣,依類別分層,從每一層分別隨 機抽出10家業者進行調查。假設2021年(x)各類業者的年平均銷售量已 知為: 1 X =220(輛); 2 X =140(輛)。 調查結果20家業者在2021年(x)及2022年(y)的銷售量統計如下: 層別 (h)變數 樣本均數 , i i y x (輛) 比率 (ˆ h R ) 樣本共變異數 xyh s 樣本標準差 hs I y 240 1.2 7200 100 x 200 80 II y 180 1.8 2200 60 x 100 40 合計 ys =110, xs =90, xy s =9000 利用下列估計量估計年平均銷售量(Y )及該估計量的變異數:(15分) ⑴ st y ,分層隨機抽樣結合簡單均數估計量(mean per unit estimator)。 ⑵ Rs y ,分層隨機抽樣結合分開比率估計量(separate ratio estimator)。 ⑶ Rc y ,分層隨機抽樣結合混合比率估計量(combined ratio estimator)。 求算估計量 st y 、 Rs y 、 Rc y 對單位均數估計量(y )之相對效率(relative efficiency),並說明那個估計量具有較佳精確度。(10分)
澄清里里長為瞭解里內2000 位里民對里內公園設施的滿意程度,進行 一項調查,在全里的20 個鄰中,隨機選擇5 個鄰,再請鄰長在其鄰內里 民中隨機選擇10 位里民做為樣本,詢問其對鎮內公園設施是否滿意,調 查資料如下: 鄰編號 鄰內里民數 鄰內樣本滿意比例 3 100 0.3 6 80 0.5 11 100 0.3 12 200 0.5 17 50 0.2 請回答下列問題: 請問此一抽樣設計為何種抽樣設計?(5 分) 請根據此一調查資料,推估澄清里里民對里內公園設施的滿意比例, 並提出根據此一估計結果建構信賴區間所需之變異數估計。(15 分)
請說明何謂抽樣權重(sampling weight),說明其與包含機率(inclusion probability)及母體數N 之關係,以及如何利用抽樣權重建構母體總和 (τ)以及平均(μ)之不偏估計量。(10 分)
9 10 降雨量 4.9 4.7 4.8 4.4 4.7 4.8 3.7 3.6 4.5 3.0 城市 11 12 13 14 15 16 17 18 19 20 降雨量 4.2 3.5 3.9 3.0 4.3 3.4 3.5 3.6 2.9 4.8 城市 21 22 23 24 25 26 27 28 29 30 降雨量 4.2 7.4 2.9 3.4 1.8 2.2 2.9 1.2 1.5 2.7 城市 31 32 33 34 35 36 37 38 39 40 降雨量 2.9 1.8 2.7 2.0 2.6 1.1 3.2 1.8 2.6 4.5 城市 41 42 43 44 45 46 47 48 49 50 降雨量 2.7 2.4 1.9 0.8 2.1 0.6 0.6 0.6 1.7 1.3 城市 51 52 53 54 55 56 57 58 59 60 降雨量 1.4 0.7 0.5 1.0 0.3 0.8 0.5 0.3 0.7 0.5 針對新移民做的一項抽樣調查,想獲得他們對於臺灣移民政策的看法。 從政府的登記資料知道新移民中有60%的女性與40%的男性。一共抽樣 1,000 人,有87%(870 位)是女性,13%(130 位)是男性。在870 位 回答的女性中有566 位贊成,在130 位回答的男性中有102 位贊成。由 此事後分層,請估計新移民贊成此移民政策的比例( ˆ ) st p 及其估計的變異 數ˆ ˆ ( ( )) p st V p 。(10 分) 請比較簡單隨機估計、比率簡單估計、差異估計、迴歸估計的相對有效 性。(15 分)
某一新創產業的營運狀況調查,目的是想了解新創產業的營業額。抽樣方 法採一段集體抽樣(one-stage cluster sampling),新創產業共600 家公司 分散在30 個園區(cluster),首先由30 個園區抽出3 個園區,這3 個園 區內的新創公司數及總營業額列於下表。 園區(cluster) 公司數 ( i M ) 園區總營業額 (百萬元) ( iy ) 1 15 90
南興社區疑似爆發某流行病之群聚感染,為規劃後續防疫措施,亟需先 行瞭解該社區染病人數。現有兩種檢測方法可用於檢測是否染病,檢測 方法A 可迅速得到結果,但其精確程度較不理想,而檢測方法B 雖可提 供相當精確之結果,但其所需檢驗程序繁複,若要爭取時效,僅能施測 30 位。今先以方法A 對該社區所有之500 位居民進行檢測,驗得其陽 性比例為0.6,再以簡單隨機抽樣取出不放回之方式,由全社區之居民中 選擇30 位以方法B 進行施測,驗得其陽性為15 人,而這30 位受測者 以方法A 施測之陽性人數為13 人,且30 人中有26 位以方法A 及方法 B 檢驗之結果相同。請回答下列問題: 若僅以方法B 施測所得之結果推估本社區染病人數,請問其估計值及 95%信賴區間為何?(5 分) 是否可以整合兩種方法推估本社區染病人數?若您認為可以,請敘述 您採用的推估方式、本社區染病人數推估值及其95%信賴區間,同時 請問在上述兩種推估方式中,您會採取那一種及您的理由。(15 分)
25 110
在某大學所進行的某滿意度調查中,樣本為以簡單隨機抽樣取出不 放回所選擇出的n = 400 位大學部學生,該校大學部學生共5000 名, 400 位學生依其年級分類及各年級滿意樣本比例整理如下表: 大一 大二 大三 大四 樣本數( ix ) 200 100 50 50 滿意比例( ip ) 0.4 0.8 0.8 0.8 則全體學生滿意比例之不偏估計為200 0.4 100 0.8 50 0.8 50 0.8 0.6 400         根據註冊組提供之資料,該校大學部學生之各年級比例如下: 大一 大二 大三 大四 母體比例( i Q ) 0.3 0.3 0.2 0.2 請檢定在α = 0.05之水準下樣本比例與母體比例是否相符(請參考下表 之卡方分配95%百分位數)。(5 分) 根據子題之結論,請問滿意度0.6 的結果是否應加以修正?請敘明 理由,若您認為需要修正,請提供修正後之母體比例。(10 分) 自由度 1 5 10 20 2 0.95  3.84 11.07 18.31 31.41
40 280 分別就下列兩種抽樣設計利用對應的不偏估計量以估計整體新創產業的 總營業額及該估計量的標準誤。 若前述一段集體抽樣係結合簡單隨機抽樣(SRS)(one-stage cluster sampling with SRS)抽得該3 個園區。(15 分) 若前述一段集體抽樣係結合抽出機率與園區大小成比例(PPS)(one- stage cluster sampling with PPS)的抽樣方式抽得該3 個園區。(15 分) 二、欲估計2021 年某鄉鎮的總農民所得(Y),由300 家農戶抽樣調查30 家 農戶,定義x 為普查年(2016 年)所得,y 為2021 年所得。母體資料x 與 y 之變異數( 2 2 , x y S S )、共變數( xy S )及y 對x 之比率(R)如下所示: 2 2 2500, 6400, 3600, 1.3 x y xy S S S R     。 (母體變異數 2 S 係以 1 N 為分母,例如, 2 2 1 ( ) 1 N i x x X S N     ,式中X 為母 體均數。) 計算迴歸估計量(ܻ෠௟௥)、比率估計量(ܻ෠ோ)及均數估計量(ܻ෠)的變異 數。(15 分) 根據之結果,比較估計量的相對效率(relative efficiency),你認為那 個估計量精確度比較高?說明理由。(10 分) 三、針對某一社區2000 個家戶進行抽樣調查,以了解該社區有老人(65 歲 以上)的家戶比例(P)及平均家戶年所得(Y )。若欲在95%的信心水 準下,估計有老人家戶的比例之估計誤差低於3%的範圍,且估計平均 家戶年所得之估計誤差低於實際平均家戶年所得(Y )4%的範圍。實際 上,如果有老人的家戶比例落在20%到40%的範圍內,而實際平均家戶 年所得Y =1,000(千元)且變異數為400,000(千元)。若採用簡單隨機 抽樣方式欲同時滿足前述兩個估計精確度的要求,應抽多大的樣本? (20 分)
金芒鄉是主要的芒果產區,鄉內農戶有專門種植芒果之專業果農,也有 混種其他作物而僅部分種植芒果之農戶,專業芒果之農戶名冊可由農林 漁牧業普查資料中獲得,但兼種芒果之農戶時有變動,無法經由普查資 料中確認,惟為求精準推估金芒鄉本年度芒果產值,亦須將兼種芒果之 農戶之芒果產值列入。在本鄉一共500 戶農戶中,有100 戶為專業種植 芒果的農戶,而此100 戶中,有5 戶為大型農戶,95 戶為中小型農戶。 本調查以下列方式選擇樣本農戶進行金芒鄉本年度之調查:5 戶大型專 業芒果農戶全數加以調查。接下來在全金芒鄉之11 個村中,以簡單隨機 抽樣取出不放回之方式選擇其中6 個村,每個樣本村中再以簡單隨機抽 樣取出不放回之方式選擇5 戶中小型專業芒果農戶,若該村中小型專業 芒果農戶數不足或等於5 戶,則該村中所有中小型專業芒果農戶全數加 以調查。另外以簡單隨機抽樣取出不放回之方式在其餘農戶中選擇其中 50 戶作為樣本戶。 本調查各類農戶所得資料綜整如下: ⑴大型專業芒果農戶:平均值為125 萬元,標準差為20 萬元。 ⑵中小型專業芒果農戶:6 個樣本村之資料如下: 村別 文新村 文景村 文佑村 金河村 同億村 同欣村 總戶數 16
在某一城市裡有N=300 家餐廳,簡單隨機抽出2/3 為樣本('n =200 家 餐廳)以取得其餐廳大小(類別)的資訊。餐廳依其大小分成兩類(層): 小型餐廳和大型餐廳。進而再由每一類(層)餐廳抽幾家(n)調查其 2021 年的營業額(y),得到資料如下: 類別(層別) ' hn hn 平均每家營業額 iy (百萬元) 標準差 is 小型餐廳 120 10 20 10 大型餐廳 80
3 12 2 13 平均值(萬元) 30 25 30 25 20 30 標準差(萬元)
80 60 合計 200 15 請說明這是何種抽樣方式?(5 分) 就前述調查資料估計該城市餐廳平均每家營業額(Y )及該估計量之標 準誤。(20 分)
10
5 8 8 ⑶其餘農戶:50 戶樣本戶中,有10 戶種植芒果,而這10 戶之平均芒果 產值為12 萬元,標準差為8 萬元。 請回答下列問題(請以萬元為單位作答): 請提出兩種不同估計方式,推估金芒鄉中小型專業芒果農戶之年度芒 果總產值,以及其相對應之變異數估計,並比較您提出之方法於本調 查之適用性。(20 分) 若以其他農戶之50 戶樣本戶中,10 戶有兼種芒果之農戶的平均芒果 產值12 萬元,做為全體兼種芒果農戶之平均芒果產值推估值,請問其 變異數估計值為何?(5 分) 請推估金芒鄉兼種芒果農戶之年度芒果總產值,並提出其變異數 估計值。(10 分) 四、今有一母體,其中有三個單元,各單元編號݅及其主要母體變量值ݕ௜ 如下表: ݅ 1 2 3 ݕ௜
8 2 平均短漏報金額(萬元) 15 10 8 4 短漏報金額標準差(萬元) 40 30 50 10 配合前述抽樣設計,回答以下問題:(20 分) 估計平均短漏報金額(Y )及該估計量之標準誤。 估計短漏報比例(P)及該估計量之標準誤。 假設前述資訊已知,原樣本配置方式改為何種配置方式將可提高估計 精確度?(5 分) 依所建議之配置方式回答以下問題:(10 分) 若針對估計均數Y ,如何配置樣本n=100 到各層? 若針對估計比例P,如何配置樣本n=100 到各層? (註:答案如有小數,請計算至第二位) 四、欲調查某國家公園內的樹感染病蟲害的情況,該國家公園內共分成10 個 區域,首先由10 個區域隨機抽出4 個區域,再就被抽出的區域隨機抽 出5%的樹進行調查,調查結果如下表: 區域 i 樹種植 數量 i M 樹抽出 數量 im 樹感染病蟲害 數量 ia 1 200 10 1 2 300 15 5 3 300 15 5 4 400 20 4 說明此抽樣設計的名稱及兩階段的抽樣單位(Primary Sampling Units 及Secondary Sampling Units)。(15 分) 試估計該國家公園內的樹感染病蟲害的比例(P),並提供95%信賴區 間。(20 分) (註:答案如有小數,請計算至第二位)
5 3 若要從該母體中選擇2 個單元作為樣本,在不考慮抽樣順序及可重複選擇 之情形下,共有6 種可能之樣本組合,考慮一抽樣設計為每組樣本組合   , s i j  ,被選擇到之選擇機率為   / 24 p s i j   ,例如樣本組合(2,3)之 選擇機率為5/24,(1,1)被選擇之機率為2/24……等。 請回答下列問題(建議以分數計算及作答): 請問在本抽樣設計下,第݅個單元被選到之包含機率(Inclusion Probability)若為 i,則 2 為何?(5 分) 請問若以樣本平均 2 i i s y y   作為母體平均 3 1 3 i i y    之估計量,則y 在 本設計下推估之偏誤(Bias)為何?(5 分) y 在本設計下之均方誤差(Mean square error;MSE)為何?(5 分) 請就本設計提出一不偏估計量,請問您提出之估計量在樣本組合分別 為(2,3)及(3,3)的情況下之估計值為何?並證明或以本母體為例驗 證該估計量為不偏。(10 分) 請試述您要如何評估您所提出之不偏估計與y 在本設計下孰優孰劣? (不須計算實際數值)(5 分)
利用簡單隨機抽樣法(simple random sampling),自母體{6, 7, 8, 9, 10}中 抽出3 個數為一組樣本,樣本中的最大值以X 表示,最小值以Y 表示。 請列出X,Y 的聯合機率分配(joint probability distribution)f(x, y)。 (10 分) 請求算機率( 10, 7) p X Y   。(5 分) 請求算期望值( | 6) E X Y  。(5 分) 令 + Z X Y  ,請計算期望值( ) E Z 。(5 分)
工廠領班想了解生產線上發生意外事件時,作業員的臨場反應及危機處 理能力;遂欲估計作業員在面臨生產線發生意外事件時的平均反應時 間。已知該工廠共有作業員750 人,其中早班作業員有450 人,晚班作 業員有300 人。因工廠領班認為早、晚班不同班別的作業員在反應時間 上可能有所差異;故決定以班別來進行分層調查,而每位作業員的調查 成本是相同的。以前的調查資料顯示早班作業員的反應時間為4 到19 秒,晚班作業員的反應時間為10 到20 秒。 試決定早、晚班各層最佳的樣本配置率。(10 分) 在信賴度為95%且誤差界限為1 秒下,現欲估計作業員在面臨生產 線發生意外事件時的平均反應時間,需要調查多少位早、晚班作業 員?(10 分) 若調查總費用的預算為2,000 元,而每位作業員的調查成本是35 元, 為使估計式的變異數最小,則需調查多少位早、晚班作業員才能達到 此目的。(5 分) 註: 0.025 0.05 1.96 1.645 z z   , ;標準差約為全距的1/4。
某人欲研析某地區街貓數目,將該地區劃分為四等份並編號i=1, 2, 3, 4 如下: 1
公司在全國250 個銷售據點販賣新產品A,為了解A 產品的市場接受度, 行銷部門依全國地理位置分為甲、乙、丙、丁四個區域,其中甲區有85 個 銷售據點,乙區有70 個銷售據點,丙區有60 個銷售據點,丁區有35 個 銷售據點。現將每個區域視為一個層別,以分層隨機抽樣(stratified random sampling)法,自甲、乙、丙、丁各區中分別抽出15,12,8,5 個銷售據 點,調查每個銷售據點A 產品一週的銷售數量。由於各區幅員及交通狀況 不同,調查費用也隨之不同,已知甲、乙、丙、丁各區,調查每個銷售據 點的成本分為6.25、4、9、9(單位:萬元)。調查結果得A 產品在每個 銷售據點一週銷售數量的平均數及標準差資料如下: 區域 甲 乙 丙 丁 平均數 80.6 165 304 482 標準差 32.5 95.2 129.6 269.1 估計A 產品一週的總銷售量並計算其95%信賴區間。(10 分) 現公司的管理高層欲估計A 產品一週的總銷售量,及要求估計的95% 誤差界限為5000,則各區須調查多少個銷售據點,才能使調查總費用 最低?同時計算需花費多少的調查費用?(14 分) 若調查總費用的預算為350 萬元,請問各區銷售據點最佳的調查數量為 何,方能達到的要求?(6 分)
甲大學共有12 個系,120 個班級,7,450 名學生。為了解學生的平均體 重,該校學務處隨機自全校中抽出15 個班級,且對班級內的所有學生測 量體重。請問此次調查是採用那種抽樣方法?參數(parameter)為何? 抽樣單位(sampling unit)為何?母體大小(population size)為何?樣本 大小(sample size)為何?(25 分)
某貿易商進口了一批5000 箱的機能飲料,每箱飲料依序編號且每一箱內含 有20 瓶飲料。現貿易商的主管想了解每瓶飲料的平均咖啡因含量,遂依每 箱飲料編號順序,以每隔500 箱抽出一箱方式,自此批飲料中抽出10 箱, 檢測每箱飲料的咖啡因含量,分別為 1 2 10 , ,..., y y y 。(每小題10 分,共20 分) 請問貿易商的主管採用何種抽樣方法?母體大小為何? 參數為何?請寫出該參數的估計量。
某次資格考試共有N 個考生報考,若考試分數大於50 分即取得資格, 現欲了解此次考生取得資格的比例,遂自考生成績總表中抽出n 個成績 計算以估計之。已知考生成績總表有2 種形式:第一種是依考生准考證 的號碼列示,第二種是依考生成績的高低依序列示。試根據上述不同的 成績總表,說明適合採用何種抽樣方法來取得樣本,估計考生取得資格 的比例,並列出估計式。(25 分)
報名參加減肥中心春季班的班員共有200 人,經減肥中心量測得平均體重 為72.5 公斤。每位班員均採用減肥中心提供之飲食餐3 個月後,減肥中 心主管想了解班員體重情況,於是從班員中隨機選了10 位班員,並且測 量其體重。得這10 位班員減肥前及減肥後體重資料如下: 班員 1 2 3 4
某運動健身連鎖集團,全國共有100 個運動據點,現調查10 個據點,得 每個據點的員工人數及員工一天使用自家運動設備的總時數如下: 運動據點 員工人數 使用總時數 1 30 78 2 12 26 3 39 72 4 52 98
而其所採之抽樣設計分兩階段進行如下: ⑴首先隨機選擇一個區域並觀察該區域街貓數目(y୧)。 ⑵若y୧> 10,則繼續觀察其相鄰之兩個區域作為樣本區域,否則若y୧≤ 10,則隨機選擇剩下未觀察之三個區域中的其中一個區域作為樣本區 域。 例如若第1 個區域在第⑴階段被選,且y୧≤10,則在其他第2, 3, 4 等三 個區域中再隨機選擇一個區域觀察,若y୧> 10,則繼續觀察第2 及3 個 區域。注意:第1 及第4 個區域不相鄰,同理第2 及第3 個區域不相鄰。 今假設該地區街貓實際分布如下: yଵ= 7 yଶ= 13 yଷ= 19 yସ= 1 請根據此抽樣設計及母體,回答下列問題:(每小題5 分,共20 分) 若不考慮樣本出現順序,樣本組合為s = (2, 3)之機率為何? 第4 個區域之抽樣包含機率(inclusion probability)? 若以觀察值之平均值,記為y ,為母體平均之估計量,請問y 之偏誤 (bias)為何? 請問y 之均方誤差(mean square error)為何? 二、某人於康寧鄉進行一項有關110 年6 月農牧業從業戶之生產成本及收入 調查,該鄉共有3 戶養豬場,10 戶養雞場,農業從業戶之戶數不詳,但 由航空測量之空照圖可判明康寧鄉之農地面積為300 公頃,而根據公務 資料,康寧鄉6 月之雞隻在養隻數為10,000 隻。 其抽樣設計如下:養豬場全選,養雞場及農業戶則分別以簡單隨機抽樣 取出不放回之方式各選擇4 戶養雞場及10 戶農業戶,調查所得資料如 下: 養豬場: 6 月平均在養豬頭數 500 750 200 6 月生產成本(萬元) 300 450 150 養雞場: 6 月平均在養雞隻數 500 1500 300 200 6 月生產成本(萬元) 35 120 15 30 農業戶: 耕地面積(公頃) 2 0.5
考慮集群抽樣,若母體總數M 已知,請問母體總和的估計量為何?若 不知母體總數M,但知道集群總數N 時,請問母體總和的估計量為 何?(5 分) 考慮兩階段集群抽樣,證明母體平均估計量 1 1 n i i i M y n M     是母體平 均的不偏估計量。其中M =M/N。提示: 1 2|1 ( ) ( ) E E E    (10 分) 考慮兩階段集群抽樣,由相等大小集群M 抽取相等大小樣本m,且當 N 很大時,證明在固定抽樣成本下,使 2 2 1 ( ) ( ) w b V n m      值最小的m 為 2 1 2 2 w b c m c    ,其中1c 是第一階段每一觀察值的成本,2c 是第二階段每 一觀察值的成本, 2 b 是集群平均間的變異數, 2 w 是集群內元素間的變 異數。(10 分)
37 74
1 0.3 2 1.2 3 1 4 6 月生產成本(萬元) 2
33 57
6 1 5 5 2 3 5 5 請回答下列問題: 請以您認為合適的估計量推估康寧鄉養雞場平均6 月每場之生產成本 以及其95%信賴區間,並說明使用該估計量之理由,並據以計算如果 下年度想針對康寧鄉的養雞場再執行一次生產成本調查以推估該年 度6 月平均每場生產成本,並希望能將95%最大抽樣誤差控制在6 萬 元以內,請問所需最小樣本數為何?(15 分) 請問康寧鄉畜牧戶從業戶6 月平均每場之生產成本以及其95%信賴區 間為何?(10 分) 請以您認為合適的估計量推估康寧鄉6 月總生產成本以及其95%信賴 區間,並說明使用該估計量之理由。(10 分) 請問康寧鄉6 月農牧業總生產成本以及其95%信賴區間為何?(5 分) 三、龍江大學企業管理學系規劃於系館增設一性別友善廁所,事前先行對全 系學生進行意願調查,調查方式是以簡單隨機抽樣取出不放回的方式於 全系240 位學生(其中有200 位女學生及40 位男學生)中,選擇60 位 學生作為調查樣本,並詢問其對增設性別友善廁所之意見。 於60 位樣本學生中,共有24 位學生表示贊成。而60 位樣本學生中有 30 位男同學,30 位女同學,男同學中有6 位表示贊成,女同學中則有 18 位表示贊成。(每小題10 分,共20 分) 請以您認為合適的估計量推估龍江大學企業管理學系學生贊成增設性 別友善廁所之比例及其95%信賴區間,並說明採用此一估計量之理由。 會計學系也想參考企業管理學系的經驗,規劃設立性別友善廁所並先 對學生意見進行調查。系主任計劃分別由女同學及男同學中各以簡單 隨機抽樣取出不放回的方式選擇若干同學,總計希望能由會計學系的 250 位學生中選擇100 位學生作為調查樣本。因為會計學系男女生比 例為4:6,因此系主任規劃男學生之樣本數為40,而女學生之樣本數 為60。請問您是否認同此一樣本數配置,請說明您的理由,同時如果 您不認同,請提出您認為較適當的樣本數配置。 四、為推估三民市內之便利商店每日營業額以作為評估是否應該投入經營 便利商店之參考,某人在三民市內總數為50 間的便利商店中,以簡單隨 機抽樣取出不放回的方式選擇了10 間便利商店,並詢問其店長當日該 店預估之營業額,同時並提供200 元之禮券以答謝店長之合作。調查所 得資料中,10 間樣本便利商店之日營業額資料如下:(樣本平均為6 萬 元,樣本變異數為2.67(萬元)2) 商店編號 1 5 6 14 17 21 32 42 43 45 日營業額 (萬元) 5 3 6 6 6
41 76
9 10 減肥前體重 58 82 64 76 64 76 54 50 88 94 減肥後體重 52 70 64 64 58 70 52 46 76 82 分別以比率估計量(ratio estimator)、廻歸估計量(regression estimator) 及差數估計量(difference estimator),估計班員減肥後的平均體重,並 計算其變異數。(21 分) 根據的結果,您會建議採用那一個估計量?(4 分)
14 48 9 40 58 10 27 50 若此資料是由100 個運動據點中,以簡單隨機抽樣法抽出的10 個運動 據點所得,試估計每位員工一天使用自家運動設備的平均時數。(5 分) 根據小題,試估計該運動健身連鎖集團,員工一天使用自家運動設 備的總時數,並求算此總時數的95%信賴區間。(10 分) 因使用自家運動設備的總時數與員工人數有相關,若此資料是由100 個運動據點中,以抽樣機率與大小成比例(sampling with probabilities proportional to size)的抽樣法抽出的10 個運動據點所得,試估計每位 員工一天使用自家運動設備的平均時數。(10 分) 註: 0.025 0.05 1.96 1.645 z z   ,
4 7 8 某人又由上表的10 間商店中,以簡單隨機抽樣取出不放回的方式選擇其 中5 間,請店長提供其當日營業報表之總結摘要,以記錄其實際日營業額, 同時又額外提供1000 元禮券給這5 位店長作為答謝。其資料如下: 商店編號 5 17 21 32 42 報表摘要日營業額 (萬元) 5 9 9 11 8 請回答下列問題:(每小題10 分,共20 分) 請以適當之方式推估三民市之便利商店之平均日營業額及其95%信賴 區間。 在這次調查中總共花費了7,000 元購買禮券,請問若想再執行一次抽 樣設計相同之調查,但將購買禮券之預算增加為8,000 元,請問直接 詢問店長日營業額及查閱營業報表之樣本數應如何配置為宜?
快樂3C 產品連鎖集團,全國共有80 家營業門市,包含30 家直營門市及 50 家加盟門市。該集團主管想了解自家集團每天的營業總額,遂自直營門 市中隨機抽5 家,加盟門市中隨機抽7 家進行營業額調查。請問: (每小題4 分,共16 分) 此次調查是採用那種抽樣方法? 此次調查的變數(variable)為何? 此次調查的抽樣單位(sampling unit)為何? 此次調查的樣本大小(sample size)為何?
A渡假村管理高層想了解會員在渡假村的消費金額及對渡假村服務的滿 意程度。已知A渡假村的會員人數為15000人,以重複系統抽樣法,自會員 名冊中抽出10組「300取1」的系統樣本進行調查,得每位會員在渡假村的 平均消費金額(以萬元計),及不滿意渡假村服務的人數資料如下表: 估計每位會員到A渡假村的平均消費金額,並求算此平均消費金額的 95%信賴區間。同時,利用此區間,判斷每位會員到A渡假村的平均消 費金額是否顯著大於3萬元?(15分) 估計不滿意A渡假村服務的會員總數及其95%誤差界限。(10分)
人口學家想要了解居住在甲城市的幼兒(5 歲以下)人數。首先,他將甲 城市劃分為200 個區集,並隨機抽出5 個區集,再從這5 個區集中各抽出 3 戶,調查每戶的5 歲以下幼兒人數,調查結果如下: 區集 戶數 每戶的5 歲以下幼兒人數 1 13 (3, 0, 0) 2 14 (0, 0, 3)
衛生單位自甲城市12000位居民中,以簡單隨機抽樣法,抽出600位居民檢 查其身高與體重,以了解甲城市居民的健康狀況。檢查結果顯示居民的平 均體重為65公斤,標準差為9公斤;同時,根據身體質量指數BMI(Body Mass Index),判定其中210位的居民體重過重,174位的居民體重過輕。 計算甲城市每位居民平均體重的95%誤差界限。(5分) 求算甲城市居民體重過重比例與體重過輕比例之差的95%信賴區間,且 依此區間判斷居民體重過重的比例是否高於體重過輕的比例。(10分) 現衛生單位主管希望估計每位居民平均體重的信賴度為95%且誤差 界限為1公斤;同時,估計居民體重過重的比例p的信賴度為95%且誤 差界限為0.03,請問目前調查600位足夠嗎?若不夠,需再增加多少 位?(10分) 組別 1 2
18 (1, 0, 2)
12 (1, 1, 0)
9 (2, 1, 1) 估計甲城市的幼兒總數,並求算此幼兒總數的95%誤差界限。(10 分) 估計每戶的平均幼兒數,並求算此平均幼兒數的95%誤差界限。(8 分) 估計每個區集的平均幼兒數,並求算此平均幼兒數的95%誤差界限。 (7 分) 三、甲公司有1000 位員工,其中400 位為門市員工,600 位為工廠員工。現 欲評估員工對公司的福利政策是否滿意,分別從門市及工廠各選取100 位 員工進行調查。資料蒐集後,依性別(男、女)及意見(滿意、不滿意、 沒意見)加以區分,得各項人數資料如下: 門市員工 意見 性別 滿意 不滿意 沒意見 男 10 7 13 女 50 15 5 工廠員工 意見 性別 滿意 不滿意 沒意見 男 29 31 15 女 15 8 2 請估計員工滿意福利政策的比例,並求算此滿意比例的95%信賴區間。 由於公司宣稱員工滿意福利政策的比例大於0.5,依據上述信賴區間, 您是否同意公司的說法?(10 分) 若每位員工的調查費用是相同的,在希望估計員工滿意比例的信賴度為 95%且誤差界限0.05 下,請問目前的調查計畫須修正嗎?若需修正該 如何修正?(8 分) 針對工廠員工,在95%信賴水準下,評估「滿意福利政策的比例」是否 不同於「不滿意福利政策的比例」。(8 分) 針對門市員工,計算「男性員工滿意的比例」與「女性員工滿意的比例」 的差異,且求算此差異的95%誤差界限。(8 分) 四、衛生當局想了解甲城市居民感染A 型流行病的狀況。現以系統抽樣法抽 得1979 年至2019 年間甲城市居民感染A 型流行病的人數(單位:萬人) 及年份資料如下: 年 1979 1984 1989 1994 1999 2004 2009 2014 2019 感染人數 10.1 11.0 9.7 5.4 4.4 0.6 1.9 1.8 2.7 試估計1979 年至2019 年間,甲城市居民每年感染A 型流行病的平均 人數,並求算此平均感染人數的95%信賴區間。若衛生當局利用1979 年至2019 年間的平均感染人數來預測2020 年甲城市居民感染A 型流 行病的人數,是否合適?請說明理由。(15 分) 何種類型的資料,適合採用連續差異(successive differences)方法估計 平均人數估計量的變異數?利用連續差異方法,計算甲城市居民感染A 型流行病平均人數估計量的估計變異數。並請依據估計的準確度,說明 及這兩種變異數估計方法,何種方法較適合?(10 分)
9 10 平均消費金額 1.85 3.50 2.75 3.50 3.38 2.38 3.12 3.62 3.25 4.25 不滿意人數 10 8 9 12 11 7 6 11 5 6 三、已知工廠有600位男性操作員及1400位女性操作員。為了解操作員的年齡 結構,決定以性別為分層變數,利用分層隨機抽樣法自男、女操作員中共 抽出200位調查,且各層樣本數使用比例配置法。調查結果為男操作員平 均年齡40.5歲,標準差12.1歲;女操作員平均年齡32.2歲,標準差10.2歲。 估計該工廠操作員的平均年齡,並求算此平均年齡的95%信賴區間。 (10分) 男性操作員的年齡差異是否比女性操作員的年齡差異大?(5分) 估計男性操作員與女性操作員之平均年齡差,並求算此平均年齡差的 95%信賴區間;且判別男、女操作員的平均年齡差是否有顯著大於6歲? (10分) 四、某大型連鎖超商共有100家分店。管理當局想了解員工對目前採行輪休制 度的支持度,從100家分店中以簡單隨機抽樣法抽出15家分店,且對抽出 之15家分店的所有員工進行調查,得資料如下表: 分店 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 員工人數 55 62 60 95 65 70 80 105 45 88 76 40 85 64 60 支持人數 25 30 50 65 42 50 48 50 30 55 60 25 63 46 54 估計該連鎖超商員工支持目前輪休制度的總人數。(5分) 估計該連鎖超商員工支持目前輪休制度的比例,並求算此比例的95%信 賴區間。依調查結果,該連鎖超商人資長宣稱,員工支持目前輪休制度 的比例超過65%,請判斷人資長的宣稱是否正確。(15分) 該連鎖超商的員工福利委員會認為目前的輪休制度對員工不公平,遂 提出了修正版本。現欲估計員工支持此修正版的輪休制度的比例,應 該抽取多少家分店進行調查,才能達到95%誤差界限為0.05的要求? (5分)
欲以估計式(estimator)θˆ來估計有興趣的參數(parameter)θ ,請說明 選取樣本的相關程序。(10 分)
臺灣地區有525 家IC 設計公司,其中有5 家公司規模特大。為了估計 臺灣地區IC 設計產業的總員工人數Y,除了將5 家特大IC 設計公司調 查其員工人數得 , ,…, 以外,另以簡單隨機抽樣法(不歸還)從 剩餘的520 家IC 設計公司中抽出20 家公司為樣本,調查其員工人數得 , ..., 。現欲採用下列兩種估計式以估計臺灣地區IC 設計公司之 總員工人數Y: 1 y y y y y
將5 個大小質量皆相同的球,分別編號為1, 2, 3, 4, 5,且將其放入袋中。 現以簡單隨機抽樣法一次抽取2 個球。 設 i X 為第i 個球之編號,
若利用集群抽樣(cluster sampling)法,進行抽樣並估計母體的平均數µ。 (每小題10 分,共20 分) 請說明第一步驟分集群(cluster)的原則及注意事項為何? 若母體共分為N 個集群,請說明如何運用集群抽樣法選取樣本,並估 計母體的平均數µ。
5 6 25 ∑ = = 25 1 1 25 525 ˆ i iy Y , ∑ ∑ = = + = 25 6 5 1 2 20 520 ˆ i i i i y y Y 試證 及 是否皆為Y 之不偏估計式。(6 分) 1ˆY 2ˆY 請分別寫出 及 之均方誤差(Mean Square Error;MSE)的定義。 (4 分) 1ˆY 2ˆY 又已知5 家特大IC 設計公司員工總人數為5,062,而其他520 家IC 設計公司員工總人數為60,320;其他520 家IC 設計公司之員工人數 的平方和為11,842,980。試利用上列資料求估計式 及 的均方誤差 之值,並請說明估計Y 時,那一個估計式較好?(4 分) 1ˆY 2ˆY 二、自來水公司想調查臺中市某區住戶在108 年1~3 月的用水情況,該區共 有N=20,000 戶,今以簡單隨機抽樣法調查了n=800 戶,得到下列統計 資料: 5. 22 = y 噸, 噸,有320 戶用水總量超過了規定的用量標準。 36 = s 請估計該區住戶在108 年1~3 月的總用水量Y 及其該估計之95%的信 賴區間。(6 分) 請估計該區在108 年1~3 月的總用水量超過了規定的用量標準的住戶 數T。(6 分) 又自來水公司想在6 月份再做一次該區住戶用水總量的抽樣調查,若 要求在95%水準下估計的相對誤差不超過10%,則應該抽多少樣本 (戶)才能達到上述之要求?(6 分)
,1 = i , 2 2 1 X X X + = 。 求X 之抽樣分配。(10 分) 驗證X 是否為母體平均數µ 的不偏估計式。(5 分) 說明X 的變異數與母體變異數 2 σ 之間的關係。(10 分) 二、為了解學生平時打工情形,A 大學特地進行下列調查計畫。已知A 大學 共有100 個班級,現自100 個班級中隨機抽出5 個班級,再由這5 個班 級中隨機抽出部分學生,調查每位學生每星期打工時數( ijy ),得到如 下資料: 班級學生人數 i M 抽樣學生數 i m i m j ij i m y y i ∑= = 1 1 ) ( 1 2 2 − − = ∑= i m j i ij i m y y s i 50 5 29 15 78 8 15 9 62 6 20 22 71 7 35 20 39 4 45 18 請問這是何種抽樣方法?(5 分) 請估計每位學生每星期的平均打工時數,並求算其95%誤差界限。 (10 分) 若已知A 大學學生總人數為5880 人,請估計每位學生每星期的平均 打工時數,並求算其95%信賴區間。(10 分)
假設母體的元素總個數為N,現欲估計母體的平均數µ。(每小題10 分, 共30 分) 請說明如何以簡單隨機抽樣(simple random sampling)法,自母體中 抽出一組樣本大小為n 的樣本,並求母體平均數µ的估計式y 。 請說明如何以系統抽樣(systematic sampling)法,自母體中抽出一組 樣本大小為n 的樣本,並求母體平均數µ的估計式 sy y 。 說明上述兩種抽樣法,每組樣本被抽出的機率;且比較估計式y 與 sy y 的變異數的大小。
若一母體共分為三層,其中各層母體大小分別為 =300, =600 與 =100。根據過去的調查結果知道這三層的母體標準差分別為 1 N 2 N 3 N 1 σ =150, 2 σ =75 與 3 σ =100。 若調查總預算(C)只有20,000 元,又固定成本( )為2,000 元,每一 層調查單位成本均相同為50 元,即 元,我們想以分層隨機 抽樣法估計式 0c 50 3 2 1 = = = c c c st y 估計母體平均數μ,試依紐曼配置(Neyman Allocation) 法,求滿足要求之總樣本大小n 及各層所需之樣本大小(i = 1,2,3)分別 為若干?(10 分) in 若我們想以分層隨機抽樣法估計式 st y 估計母體平均數μ的95%的誤差 界限不超過B=20,試依紐曼配置法,求滿足要求之總樣本大小n 及 各層所需之樣本大小(i = 1,2,3)分別為若干?(10 分) in
甲社團的團長欲了解該團團員每月花費多少的交通費用,已知甲社團共 有團員205 位,利用團員通訊錄的資料,採10 取1 的系統抽樣法,調 查得21 位團員每月的交通費用(yi, i=1, …, 21)如下: (每小題10 分,共20 分) 2030, 1720, 1850, 2210, 2150, 2370, 2000, 1930, 1570, 1910, 2380, 2540, 1720, 1900, 2200, 2100, 1860, 1800, 2050, 2420, 2090 估計甲社團團員每月的平均交通費用,且求算此平均交通費用的95% 信賴區間。 採用連續的差數(successive differences),di= i i y - y 1 + (i=1, …, 21),估 計甲社團團員每月的平均交通費用的變異數。同時比較、這兩種 估計變異數方法的準確度,說明何種估計方法較合適。
社會學者欲研究甲城市年齡65 歲以上的老年人口狀況。現依地理位置 將甲城市劃分為80 個區域,自此80 個區域中,以簡單隨機抽樣法,抽 出6 個區域,調查每個區域的居民人數及年齡65 歲以上的老年人口數。 得調查資料如下:(每小題10 分,共30 分) 區域 1 2 3 4
某公司之人力資源部門想了解該公司銷售部門員工每年請病假的情 形。已知銷售部門員工人數眾多共分為三群,其中50%為業務人員、 40%為業務主任及10%為業務經理。現自各群中隨機抽出部分員工, 調查其每年請病假天數,及病假天數超過1 星期的人數,得如下資料: (每小題10 分,共40 分) 員工 調查人數 平均數 標準差 病假天數超過 1 星期的人數 業務人員 1350 6.13 0.16 135 業務主任 1085 5.05 0.21 76 業務經理 175 6.18 0.38 14 請估計銷售部門員工每年平均病假天數,並計算其95%的誤差界限。 在95%的信賴水準下,說明業務經理每年平均病假天數是否顯著大於 其他兩群員工? 請估計銷售部門員工每年病假天數超過1 星期的比例,並計算其95% 的誤差界限。 在95%的信賴水準下,說明業務人員每年病假天數超過1 星期的比例 是否顯著大於其他兩群員工?
某市轄區有N = 250 個里,共有M = 16,800 戶。今電力公司營業處想估 計該市每戶裝置冷氣機之平均台數 Y μ ,以簡單集體抽樣法自該市隨機抽 出10 個里進行調查,得如下調查資料: 里 (集體) 戶數 ( ) i M 該里住戶裝 置冷氣機之 總台數(yi) 里 (集體) 戶數 ( ) i M 該里住戶裝 置冷氣機之 總台數(yi) 1 150 480 6 120 216 2 72 252 7 50 240 3 80 440 8 100 230 4 90 162 9 71 213
125 200 10 42 252 註:上述調查資料經計算得∑ , , , , ,在簡單集體抽樣法下,電力公司營 業處利用 900 M 10 1 i i = = 514 , 91 M 10 1 i 2 i = ∑ = 685 ,2 y 10 1 i i = ∑ = 777 , 819 y 10 1 i 2 i = ∑ = 551 , 251 y M 10 1 i i i = ∑ = ∑ ∑ = = = 10 1 i i 1 i M y 10 i C1 y , ∑ = = 10 1 i i C2 y n 1 M N y , ∑ = = 10 1 i i C3 y n 1 y 等3 個估計式 (其中 i i i M y y = )來估計該市每戶裝置冷氣機之平均台數 Y μ 。則: 試以 C1 y 、 C2 y 、 C3 y 來估計該市每戶裝置冷氣機之平均台數 Y μ ,則 Y μ 估 計值分別為何?(9 分) 若以估計式 C1 y 估計 Y μ , 則該估計在95%的信賴度下,其最大可能估 計誤差界限B 為何?(9 分) 請根據上述調查資料,試分別求 C1 y 、 C2 y 、 C3 y 等3 個估計式的估計變 異數 3,2,1 i ), y ( Vˆ ci = 之值為何 ? 並請說明哪一個估計式在估計 Y μ 時有 較好的估計效率?(6 分) 五、某市政府之行政區按區域別分為南區與北區,該市人事長想了解該市職 工去年上半年(1~6 月份)與今年上半年(1~6 月份)因生病請假時數 之變動比率,分別自南、北兩區各以簡單隨機抽樣抽出100 名職工進行 調查,得相關統計資料如下: 區域別 職工總數 ( )(人) i N 樣本數 ( )(人) in 去年上半 年樣本平 均數( i X ) 今年上半 年樣本平 均數( iY ) 去年上半 年樣本標 準差( ) i X S 今年上半 年樣本標 準差( ) i Y S 去年與今年上 半年樣本相關 係數 ( i XY ρˆ ) 1(南區) 1,000 100 18.0 18.9 10.0 10.36 0.9841 2(北區) 1,500 100 7.5 4.8 5.45 3.50 0.5576 其中: 設 :去年上半年第i位職工因生病請假的時數; i X iY :今年上半年第i位職工因生病請假的時數; i X :去年上半年因生病請假的樣本平均時數; iY :今年上半年因生病請假的樣本平均時數; Xi S :去年上半年因生病請假時數的樣本標準差; Yi S :今年上半年因生病請假時數的樣本標準差; i XY ρˆ :去年與今年上半年因生病請假的時數的樣本相關係數。 又已知去年上半年(1~6 月份)南區職工因生病請假的總時數 300 , 16 1 = X τ 小時,北區職工因生病請假的總時數 800 , 13 2 = X τ 小時。根據上述資料: 試估計該市南區職工去年上半年(1~6 月份)至今年上半年(1~6 月 份)因生病請假的時數之變動比率R 為何?又在95%的信賴度下,其 最大可能估計誤差界限B 為何?(6 分) 對於之估計問題,若要求在95%的信賴度下,其最大可能估計誤差 界限B 不超過0.02,試問應抽出多少樣本才足夠?(6 分) 試以比率估計(ratio estimation)估計該市南區職工今年上半年(1~6 月份)因生病請假的平均時數 1 Y μ 及該市北區職工今年上半年(1~6 月 份)因生病請假的平均時數 2 Y μ 。(6 分) 若視上述調查資料為分兩層(南區及北區),利用分層隨機抽樣法調 查所得,請你幫忙該市人事長用層別比率估計式(separate ratio estimator)估計該市2,500 位職工今年上半年(1~6 月份)因生病請假 的平均時數 Y μ 。又其在95%的信賴度下,其最大可能估計誤差界限B 為何?(6 分)
居民人數 85 37 49 50 34 45 65 歲以上的老年人口數 15 8 12 11 8 12 估計甲城市年齡65 歲以上的老年人口比例,且計算此比例的95%誤 差界限。 估計甲城市年齡65 歲以上的老年人口總數,且求算此總數的95%信 賴區間。 現透過戶政資料,得知甲城市居民總數為4250 人,試利用此資料估 計甲城市年齡65 歲以上的老年人口總數,並比較、這兩種估計 方法那一種較適合。
某一種分層抽樣設計將母體分成三層,並且取得以下關於母體與樣本的 相關資訊: z 第一層有100 個抽樣單元、樣本數是50、樣本平均是10、樣本變異 數是800; z 第二層有100 個抽樣單元、樣本數是50、樣本平均是20、樣本變異 數是700; z 第三層有100 個抽樣單元、樣本數是50、樣本平均是30、樣本變異 數是600; 請回答:(t0.025(147) = 1.976233) 估計母體平均數。(5 分) 請提供信賴區間所需t 分配的自由度。(10 分) 承上小題,提供母體平均數的95%信賴區間(答案請四捨五入到第二 位小數)。(10 分)
(147) 5 分
假設F 是一個僅僅包含四個元素的小規模有限母體(finite population),而四個元素的研究變數(study variable)值分別為y1=1、y2=3、y3=3 以及y4=9。我們採用不置回的簡單隨機抽樣(simple random sampling without replacement)從母體 之中抽出樣本大小(sample size)為n=2 的樣本組合,並以 Y1, Y2 來表示此樣本組合中的兩個樣本數據(註:採用大寫英文字母Y,表示樣本 數據皆為隨機變數)。試求Y1 與Y2 的聯合機率分佈(joint probability distribution) 以及Y1 與Y2 的共變異數(covariance)。(15 分) { 4 3
承上題。假設研究者想試算簡單隨機抽樣的結果。(t0.025(49) = 2.009575) 請單獨根據第一層的資訊估計母體平均數及提供母體平均數的95% 信賴區間(答案請四捨五入到第二位小數)。(10 分) 請單獨根據第二層的資訊估計母體平均數及提供母體平均數的95% 信賴區間(答案請四捨五入到第二位小數)。(10 分) 請單獨根據第三層的資訊估計母體平均數及提供母體平均數的95% 信賴區間(答案請四捨五入到第二位小數)。(10 分)
(49) 10 分
1 , , , u u u u = F 假設前一小題之中抽出樣本大小為n=3 的樣本組合,並以Y1 ,Y2,Y3 來表示此樣本組 合中的三個樣本數據。試求Y1 與Y3 的共變異數。(5 分) 二、假設某一個有限母體可被完整地切割為L個互不相交的層別(strata),其中第h層 之層大小(stratum size)為Nh,第h層之第j個元素的研究變數值為yhj,h=1,…,L, j=1,2,…,Nh。母體大小(population size)、母體平均數(population mean)以及母體 變異數(population variance)的數學式分別為 母體大小: 1 2 L N N N N = + + + L ; 母體平均數: 1 1 1 h N L hj h j y N μ = = = ∑∑ ; 母體變異數: 2 2 1 1 1 ( ) h N L hj h j y N σ μ = = = − ∑∑ 。 其次,母體中第h 層之層平均數(stratum mean)以及層變異數(stratum variance) 的數學式分別為 第h 層之層平均數: 1 1 h N h h j h y N μ = = j ∑ ; 第h 層之層變異數: 2 2 1 1 ( ) h N h hj j h y N σ h μ = = − ∑ 。 試證明下列等式: 2 2 1 1 ( ) L L h h h h h h W W σ σ 2 μ μ = = = + − ∑ ∑ , 其中 h h N W N = 為第h 層的層比重(stratum weight), 。(10 分) 1, , h L = L 使用分層隨機抽樣(stratified random sampling)之後,抽樣者應如何推估(未知其 值的)母體平均數?需要什麼假設條件?請詳細說明。(4 分) 在使用分層隨機抽樣之前,抽樣者必須事先決定將要採用何種較為適當的配置, 例如比例配置(proportional allocation)、尼門配置(Neyman allocation)。請詳細說 明在使用事後分層(post-stratification)的方法之前,抽樣者是否也必須事先決定 採用何種配置?(5 分) 請詳細說明在什麼情況之下,抽樣者需要借助於雙重抽樣(double sampling)之方 法,來進行分層隨機抽樣並推估母體的平均數(或是推估母體的其他參數)。 (5 分) 107年公務人員高等考試三級考試試題 全一張 (背面) 類 科: 統計 科 目: 抽樣方法
假設總樣本數是150。再假設研究者把母體分成三層並且取得以下相關 資訊: z 第一層有100 個抽樣單元、母體變異數16; z 第二層有200 個抽樣單元、母體變異數25; z 第三層有300 個抽樣單元、母體變異數36; 請回答:假設抽樣成本是一致的,請問根據最佳分配原則, 第一層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分) 第二層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分) 第三層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分)
某水果商訂購了一卡車的椰子,並打算採用比值估計(ratio estimation)之方法來推 估整輛卡車裝載所有的椰子如果全數被剖開之後的椰子汁總重量。該水果商採用不置 回的簡單隨機抽樣之方法從整輛卡車的椰子之中抽出了10 顆椰子。試說明該水果商 應該如何利用被抽出的10 顆椰子來取得樣本數據以及如何進行比值估計,並寫出點 估計量的數學式。(15 分)
某大學某系所 60 位學生針對107 年公投議題進行假投票,他們的座號 從「01」開始一直編到「60」。抽樣方法課的授課師長為了示範系統抽 樣,私底下先詢問了全班每一位同學對「議題甲」的個人意見。發現座 號「04, 05, 07, 10, 15, 17, 19, 25, 27, 28, 29, 30, 31, 32, 37, 39, 45, 46, 50, 53, 58, 60」的這幾位同學表示支持議題甲。現在引用「每5 個取 1 個」 的系統抽樣估計支持者的比例。 請回答:如果系統抽樣的起始座號是03, 支持議題甲的樣本比例等於多少(答案請用分數表達)?(15 分) 估計上述樣本比例的變異數(答案請四捨五入到第四位小數)。(10 分) 假設估計誤差被定義為上述變異數放大4 倍後的正方根,請問第一小 題樣本比例的估計誤差等於多少(答案請四捨五入到第四位小數)? (5 分)
迴歸分析(regression analysis)課程中的最小平方估計量(least squares estimator),在 抽樣方法的理論中有何可用之處?請詳細說明並寫出相關的估計量數學式。 (10 分)
某一間大學的學術部門打算採用二階段集群抽樣(two-stage cluster sampling)之方 法來推估校內全體專任教師在前一個學年度的學術論文平均產量(亦即,推估任 何一位專任教師在前一個學年度的學術論文平均發表篇數),並且將校內的每一個 科系視為一個集群。試就比值估計(ratio estimation)以及不偏估計(unbiased estimation)兩種情況分別說明如何進行二階段集群抽樣以及如何推估,並寫出點 估計量的數學式。(13 分) 假設前一小題之中的學術部門打算改變為採用集群抽樣(cluster sampling)之方法來 推估校內全體專任教師在前一個學年度的學術論文平均產量,並且依舊將校內的每 一個科系視為一個集群。試就比值估計(ratio estimation)以及不偏估計(unbiased estimation)兩種情況分別說明如何進行集群抽樣以及如何推估,並寫出點估計量的 數學式。(13 分) [註] 集群抽樣又稱之為單階段集群抽樣(single-stage cluster sampling)
在什麼情況之下,使用系統抽樣(systematic sampling)之方法來推估母體的平均數, 其推估之效果會優於使用簡單隨機抽樣的推估效果?請詳細說明。(5 分)
請敘述問卷設計之原則。(15 分)
某人蒐集10 人每週運動次數資料,製成長條圖如下:(每小題5 分,共25 分)  試求各運動次數的比例。  試求此10 人之平均每週運動次數。  若將此10 人視為母體,試求母體變異數。  若將此10 人視為樣本,試求樣本變異數。  注意到題 與題 的計算方式不同,此差異讓樣本變異數為母體變異數的不偏估 計量。試說明何謂不偏估計量(Unbiased Estimator)。
市政府為了解市民對於在市內開設新的公立托兒所的看法,以簡單隨機抽樣法抽出 500位市民進行調查。根據調查結果得知:有260位反對在市內設立新的公立托兒所, 有230位贊成在市內設立新的公立托兒所,其餘沒意見。根據調查結果,市政府宣稱 超過半數的市民反對在市內開設新的公立托兒所。 試估計市民反對在市內設立新的公立托兒所的比例;且在95%的信賴水準下,估計 此次調查的誤差界限及說明是否同意市政府的宣稱。(15分) 在95%的信賴水準下,說明反對在市內設立新的公立托兒所的比例是否顯著高於贊 成在市內設立新的公立托兒所的比例?(10分)
何謂簡單隨機抽樣法?(5 分) 設一有限母體中有N 個元素,若自母體中以抽出不放回的抽樣方式,抽出n 個簡 單隨機樣本, n y y y , ... , , 2 1 ,請證明樣本平均數 n y y n i i ∑= = 1 的變異數 n N n N y Var 2 1 ) ( σ ⋅ − − = ( 2 σ 為母體變異數)。(10 分)
假定母體中有N個個體。我們現在要從中抽出n 個個體做為樣本。  試解釋如何以簡單隨機抽樣(Simple Random Sampling)進行抽樣。(6 分)  試解釋如何以分層隨機抽樣(Stratified Random Sampling)進行抽樣。(7 分)  採取分層隨機抽樣而非簡單隨機抽樣的可能理由為何?(7 分) 1 5
大方文創商品公司共有50 家分店,去年第1 季的營業額為3,950 萬元,為了解今年 第1 季的營運狀況,自50 家分店中抽出6 家分店調查,得各分店去年第1 季的營業 額( )及今年第1 季的營業額( )如下:(單位:萬元) i i 分店 1 2
臺灣自來水公司為了研究家戶用水行為,欲從家庭用水的水表資料檔中以抽樣方 式抽出1,000 戶來做家戶用水行為研究。在自來水公司的家庭水表資料檔中,各戶 都有一個專門的水表號碼,也有每個月的用水度數。為了減低用水量多寡的用水 行為差異,欲用用水度數分層,請敘述如何執行分層隨機抽樣。(5 分) 分層隨機抽樣之每一層樣本大小的配置(Allocation),應注意那三項事情?(5 分) 什麼時候需要採用雙重抽樣方法(Double Sampling)?(5 分)
0 1 0 1 2 3
若採用重複系統抽樣法(Repeated Systematic Sampling),在母體大小為N 中抽出 ns 個“k'取1”的系統樣本,可得ns 個樣本大小為n( 'k N n = )的系統樣本。若第i 個系統樣本為 k n i k i i y y y ′ − + ′ + ) 1 ( , ... , , ,令 n y y n j ij i ∑= = 1 ,(i = 1, 2, … , ns)為第i 個系 統樣本的平均數,請寫出母體平均數 ߤ̂ 的估計公式?及母體平均數估計式的估計 變異數Var ෢(ߤ̂)?(10 分) 若採用群集隨機抽樣法(Cluster Sampling),在母體大小為M 中先分成 N 個群集(cluster)(每一個群集之個數為m1, m2, … , mN, ∑= = N i i m M 1 ),再以群集 為抽樣單位,以簡單隨機抽樣法抽出n 個群集為一群集樣本,稱為群集隨機樣本。 若yi 表示第i 個群集中變數值的總和,請寫出母體平均數 ߤ̂ 的估計公式?及母體平 均數估計式的估計變異數Var ෢(ߤ̂)?(10 分) 在何種條件下,題及所述兩種抽樣法之母體平均數的估計值公式會相同? (5 分) 106年特種考試地方政府公務人員考試試題 全一張 (背面) 等 別: 三等考試 類 科: 統計 科 目: 抽樣方法
在兩階段抽樣法中,第一階段先將母體分成N 個抽樣單位,以簡單隨機抽樣法抽出n 個抽樣單位,稱為第一抽樣單位。其次,將第一階段中的每一個抽樣單位分割成 Mi (i = 1, 2 , … , N)個抽樣單位,並從n 個第一抽樣單位以簡單隨機抽樣法各抽出 mi (i = 1, 2, … , n)個抽樣單位( , , ... , , 2 1 i im i i y y y i = 1, 2, … , n),稱為第二抽樣單位, ∑= = N i i M M 1 , N M M = , ∑= = i m j ij i i y m y 1 1 。 在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分) 在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分) 若M 未知,請寫出母體平均數ߤ̂的估計公式及Var ෢(ߤ̂)的估計公式。(10 分) 若在第一階段中不以簡單隨機抽樣法抽出n 個抽樣單位,改以第i(i = 1, 2, … , N) 個被抽中的機率為M Mi(Two-Stage Cluster Sampling with Probabilities Proportional to Size, pps),請寫出母體平均數ߤ̂的估計公式及Var ෢(ߤ̂)的估計公式。(10 分)
0 1 2 3 4 人數 每週運動次數 人 數 106年公務、關務人員升官等考試、106年交通 事業鐵路、公路、港務人員升資考試試題 代號:21460 全一張 (背面) 等 級 :薦任 類科(別) :統計 科 目 :抽樣方法 三、科學家對生長於某區域內的一種特殊蕨類的生長高度有興趣。該地區有下列10 株個 體,分別位於北、中、南三區,株高如下: 編號 1 2 3 4 5 6
ix 41 83 101 80 85 70 iy 63 121 97 110 83 101 試估計大方文創商品公司今年的營業成長率。利用比率估計式(ratio estimator)估 計公司今年第1 季的營業額,並求算其標準誤。(10 分) 試利用迴歸估計式(regression estimator)估計公司今年第1 季的營業額,並求算 其標準誤。(10 分) 試說明並評估那種估計式較佳。(5 分) 106年公務人員高等考試三級考試試題 全一張 (背面) 類 科:統計 科 目:抽樣方法 三、甲工廠共有15 部機器專門生產A產品,每部機器每天生產A產品的數量分別如下: 120、90、270、300、450、150、180、100、310、260、220、190、160、250、140。 品管部經理想要了解工廠每天生產出多少不良的A產品,欲自15 部機器中抽出3 部 機器,再進行全面檢查。由於每部機器生產不良品的數量與每部機器的產能有高度 的相關。因此,品管人員依照各機器的產能,採用依大小成比例的機率抽樣法 (sampling with probabilities proportional to size, PPS)抽樣。 請在使用亂數表隨機取得的數字為2981、0607 及2215 的情況下,詳細說明如何 運用PPS 抽樣法抽出3 部機器為集群樣本。(10 分) 若抽出的機器分別為第6、7 及11 部,全面檢查後得知,其中不良品的個數分別 如下:6、9 及18。請估計工廠每天產出不良A產品的總數,並求其變異數。(8 分) 如所述,請估計工廠每天產出不良A 產品的比例,並求其95%的誤差界限。(7 分) 四、某休閒度假村有3處住宿區,分別是靠海岸的海景小屋、沿山坡的豪華小木屋及溫馨 舒適大樓的精緻客房。其中海景小屋80間,豪華小木屋60間,以及精緻客房260間。 現度假村經理想了解住宿客人對度假村提供的服務是否滿意,擬進行一項調查計 畫。由於3處住宿區的位置及房價均有所差異,決定分區進行調查,調查費用因住宿 區房間的距離不同而不同,豪華小木屋分布範圍最大,所以調查費用最高。已知每 間海景小屋的調查費用為64元,每間豪華小木屋的調查費用為100元,而每間精緻客 房的調查費用為36元。根據去年調查的結果得知,豪華小木屋區有60%的客人表示滿 意,精緻客房區有80%的客人表示滿意,海景小屋今年才開始提供住宿服務,所以沒 有資料可參考。 若希望估計住宿客人滿意比例的信賴度為95%且誤差界限為0.05,則須調查多少間 海景小屋、豪華小木屋及精緻客房?此時調查總費用為何?(15分) 若調查總費用的預算為5,000元,則調查多少間海景小屋、豪華小木屋及精緻客房 才能使住宿客人滿意比例之估計式的變異數最小。(10分)
9 10 株高 9 10 11 5 6 6 7 12 12 15 區域 北 北 北 中 中 中 中 南 南 南  現在假設我們由北、中、南各以簡單隨機抽樣抽取1 株。假定我們抽得編號3、7、 10 的3 株,試依據這3 株的高度推估該種蕨類的平均株高。(5 分)  承題 ,假設我們已知北、中、南三區的母體變異數分別為 、 與2。試求題 中 統計量的變異數。(10 分)  承題 與題 ,試依據此分層隨機抽樣的結果,計算平均株高的95%信賴區間。 (10 分)  試就此案例分析採取分層隨機抽樣之優點為何?以及造就此優點之理由。(10 分) 四、某國可分為城市與鄉村兩個區域。下列為該國城市與鄉村地區每戶智慧型手機數相 關資料: 城市 鄉村 總戶數 10,000 40,000 抽樣戶數 n1 n2 樣本平均數 5 4 樣本標準差 3 2 假設各產品的母體皆呈常態分布:  現在假設吾人想知道全國每戶智慧型手機數的平均數。假設我們總共需抽取100 戶。試依據比例配置法(Proportional Allocation)決定n1 與n2。(5 分)  承題 ,假設我們知道城市與鄉村的母體標準差分別為1.5 與0.875。試改以尼曼 配置法(Neyman Allocation)決定n1 與n2。(10 分)  試說明在何種情況下,比例配置法與尼曼配置法之結果相同。(5 分)
解釋下列名詞:(每小題5 分,共10 分) 抽樣誤差(Sampling Error) 非抽樣誤差(Nonsampling Error)
某企業人力資源部門欲了解該企業去年員工病假天數超過一星期的狀況,現擬自企 業各部門進行調查。已知該企業共有6 個部門,各部門員工人數依序分別為650、190、 780、460、800、1,120。因各部門員工人數差異大,所以研究人員擬採機率與部門員 工人數成比例的方式抽樣,自6 個部門中抽出3 個部門,再針對抽中的部門,隨機 抽出10%的員工病假資料,以判定有多少員工去年病假天數超過一星期。試問: 這是何種抽樣方法?(5 分) 假設運用亂數表得如下亂數:2368,1382,0268。試說明如何根據上述抽樣方法 及亂數決定抽出的3 個部門。(10 分) 若抽出的部門為第1、5、6 部門,再自這些部門各隨機抽出10%的員工病假資料, 得知去年員工病假天數超過一星期的人數分別為13、9、21。試估計該企業去年員 工病假天數超過一星期的比例及其標準誤。(10 分)
某公司員工週薪依其工作性質不同(分為外部工作及內部工作)而有所差異。已知 外部工作週薪為$10,000 至$18,000 間,員工為200 名;內部工作週薪為$3,000 至$9,000 間,員工為300 名。研究人員想估計該公司每位員工的平均週薪,由於不同性質工 作的週薪有差異,決定分層進行調查。因外部工作員工的工作分布範圍大,所以調 查成本較高,已知每位外部工作員工的調查成本為$100,而每位內部工作員工的調 查成本為$64。(每小題10 分,共30 分) 若研究人員決定調查100 位員工,試問需要調查多少位外部工作員工,多少位內 部工作員工才是最適的配置(optimum allocation)? 若希望估計每位員工的平均週薪的信賴度為95%且誤差界限為$500,試問需要調查 多少位外部工作員工,多少位內部工作員工? 若調查總費用的預算為$4,000,試問需要調查多少位外部工作員工,多少位內部工 作員工才能使估計式的變異數最小? 105年公務人員特種考試關務人員考試、 105年公務人員特種考試身心障礙人員考試及 105年國軍上校以上軍官轉任公務人員考試試題 全一張 (背面) 考試別: 關務人員考試 等 別: 三等考試 類 科: 關稅統計 科 目: 抽樣方法