lawpalyer logo

統計 108 年抽樣方法考古題

民國 108 年(2019)統計「抽樣方法」考試題目,共 14 題 | 資料來源:考選部

0 題選擇題 + 14 題申論題

將5 個大小質量皆相同的球,分別編號為1, 2, 3, 4, 5,且將其放入袋中。 現以簡單隨機抽樣法一次抽取2 個球。 設 i X 為第i 個球之編號,
欲以估計式(estimator)θˆ來估計有興趣的參數(parameter)θ ,請說明 選取樣本的相關程序。(10 分)
臺灣地區有525 家IC 設計公司,其中有5 家公司規模特大。為了估計 臺灣地區IC 設計產業的總員工人數Y,除了將5 家特大IC 設計公司調 查其員工人數得 , ,…, 以外,另以簡單隨機抽樣法(不歸還)從 剩餘的520 家IC 設計公司中抽出20 家公司為樣本,調查其員工人數得 , ..., 。現欲採用下列兩種估計式以估計臺灣地區IC 設計公司之 總員工人數Y: 1 y y y y y
,1 = i , 2 2 1 X X X + = 。 求X 之抽樣分配。(10 分) 驗證X 是否為母體平均數µ 的不偏估計式。(5 分) 說明X 的變異數與母體變異數 2 σ 之間的關係。(10 分) 二、為了解學生平時打工情形,A 大學特地進行下列調查計畫。已知A 大學 共有100 個班級,現自100 個班級中隨機抽出5 個班級,再由這5 個班 級中隨機抽出部分學生,調查每位學生每星期打工時數( ijy ),得到如 下資料: 班級學生人數 i M 抽樣學生數 i m i m j ij i m y y i ∑= = 1 1 ) ( 1 2 2 − − = ∑= i m j i ij i m y y s i 50 5 29 15 78 8 15 9 62 6 20 22 71 7 35 20 39 4 45 18 請問這是何種抽樣方法?(5 分) 請估計每位學生每星期的平均打工時數,並求算其95%誤差界限。 (10 分) 若已知A 大學學生總人數為5880 人,請估計每位學生每星期的平均 打工時數,並求算其95%信賴區間。(10 分)
若利用集群抽樣(cluster sampling)法,進行抽樣並估計母體的平均數µ。 (每小題10 分,共20 分) 請說明第一步驟分集群(cluster)的原則及注意事項為何? 若母體共分為N 個集群,請說明如何運用集群抽樣法選取樣本,並估 計母體的平均數µ。
5 6 25 ∑ = = 25 1 1 25 525 ˆ i iy Y , ∑ ∑ = = + = 25 6 5 1 2 20 520 ˆ i i i i y y Y 試證 及 是否皆為Y 之不偏估計式。(6 分) 1ˆY 2ˆY 請分別寫出 及 之均方誤差(Mean Square Error;MSE)的定義。 (4 分) 1ˆY 2ˆY 又已知5 家特大IC 設計公司員工總人數為5,062,而其他520 家IC 設計公司員工總人數為60,320;其他520 家IC 設計公司之員工人數 的平方和為11,842,980。試利用上列資料求估計式 及 的均方誤差 之值,並請說明估計Y 時,那一個估計式較好?(4 分) 1ˆY 2ˆY 二、自來水公司想調查臺中市某區住戶在108 年1~3 月的用水情況,該區共 有N=20,000 戶,今以簡單隨機抽樣法調查了n=800 戶,得到下列統計 資料: 5. 22 = y 噸, 噸,有320 戶用水總量超過了規定的用量標準。 36 = s 請估計該區住戶在108 年1~3 月的總用水量Y 及其該估計之95%的信 賴區間。(6 分) 請估計該區在108 年1~3 月的總用水量超過了規定的用量標準的住戶 數T。(6 分) 又自來水公司想在6 月份再做一次該區住戶用水總量的抽樣調查,若 要求在95%水準下估計的相對誤差不超過10%,則應該抽多少樣本 (戶)才能達到上述之要求?(6 分)
甲社團的團長欲了解該團團員每月花費多少的交通費用,已知甲社團共 有團員205 位,利用團員通訊錄的資料,採10 取1 的系統抽樣法,調 查得21 位團員每月的交通費用(yi, i=1, …, 21)如下: (每小題10 分,共20 分) 2030, 1720, 1850, 2210, 2150, 2370, 2000, 1930, 1570, 1910, 2380, 2540, 1720, 1900, 2200, 2100, 1860, 1800, 2050, 2420, 2090 估計甲社團團員每月的平均交通費用,且求算此平均交通費用的95% 信賴區間。 採用連續的差數(successive differences),di= i i y - y 1 + (i=1, …, 21),估 計甲社團團員每月的平均交通費用的變異數。同時比較、這兩種 估計變異數方法的準確度,說明何種估計方法較合適。
假設母體的元素總個數為N,現欲估計母體的平均數µ。(每小題10 分, 共30 分) 請說明如何以簡單隨機抽樣(simple random sampling)法,自母體中 抽出一組樣本大小為n 的樣本,並求母體平均數µ的估計式y 。 請說明如何以系統抽樣(systematic sampling)法,自母體中抽出一組 樣本大小為n 的樣本,並求母體平均數µ的估計式 sy y 。 說明上述兩種抽樣法,每組樣本被抽出的機率;且比較估計式y 與 sy y 的變異數的大小。
若一母體共分為三層,其中各層母體大小分別為 =300, =600 與 =100。根據過去的調查結果知道這三層的母體標準差分別為 1 N 2 N 3 N 1 σ =150, 2 σ =75 與 3 σ =100。 若調查總預算(C)只有20,000 元,又固定成本( )為2,000 元,每一 層調查單位成本均相同為50 元,即 元,我們想以分層隨機 抽樣法估計式 0c 50 3 2 1 = = = c c c st y 估計母體平均數μ,試依紐曼配置(Neyman Allocation) 法,求滿足要求之總樣本大小n 及各層所需之樣本大小(i = 1,2,3)分別 為若干?(10 分) in 若我們想以分層隨機抽樣法估計式 st y 估計母體平均數μ的95%的誤差 界限不超過B=20,試依紐曼配置法,求滿足要求之總樣本大小n 及 各層所需之樣本大小(i = 1,2,3)分別為若干?(10 分) in
社會學者欲研究甲城市年齡65 歲以上的老年人口狀況。現依地理位置 將甲城市劃分為80 個區域,自此80 個區域中,以簡單隨機抽樣法,抽 出6 個區域,調查每個區域的居民人數及年齡65 歲以上的老年人口數。 得調查資料如下:(每小題10 分,共30 分) 區域 1 2 3 4
某公司之人力資源部門想了解該公司銷售部門員工每年請病假的情 形。已知銷售部門員工人數眾多共分為三群,其中50%為業務人員、 40%為業務主任及10%為業務經理。現自各群中隨機抽出部分員工, 調查其每年請病假天數,及病假天數超過1 星期的人數,得如下資料: (每小題10 分,共40 分) 員工 調查人數 平均數 標準差 病假天數超過 1 星期的人數 業務人員 1350 6.13 0.16 135 業務主任 1085 5.05 0.21 76 業務經理 175 6.18 0.38 14 請估計銷售部門員工每年平均病假天數,並計算其95%的誤差界限。 在95%的信賴水準下,說明業務經理每年平均病假天數是否顯著大於 其他兩群員工? 請估計銷售部門員工每年病假天數超過1 星期的比例,並計算其95% 的誤差界限。 在95%的信賴水準下,說明業務人員每年病假天數超過1 星期的比例 是否顯著大於其他兩群員工?
某市轄區有N = 250 個里,共有M = 16,800 戶。今電力公司營業處想估 計該市每戶裝置冷氣機之平均台數 Y μ ,以簡單集體抽樣法自該市隨機抽 出10 個里進行調查,得如下調查資料: 里 (集體) 戶數 ( ) i M 該里住戶裝 置冷氣機之 總台數(yi) 里 (集體) 戶數 ( ) i M 該里住戶裝 置冷氣機之 總台數(yi) 1 150 480 6 120 216 2 72 252 7 50 240 3 80 440 8 100 230 4 90 162 9 71 213
125 200 10 42 252 註:上述調查資料經計算得∑ , , , , ,在簡單集體抽樣法下,電力公司營 業處利用 900 M 10 1 i i = = 514 , 91 M 10 1 i 2 i = ∑ = 685 ,2 y 10 1 i i = ∑ = 777 , 819 y 10 1 i 2 i = ∑ = 551 , 251 y M 10 1 i i i = ∑ = ∑ ∑ = = = 10 1 i i 1 i M y 10 i C1 y , ∑ = = 10 1 i i C2 y n 1 M N y , ∑ = = 10 1 i i C3 y n 1 y 等3 個估計式 (其中 i i i M y y = )來估計該市每戶裝置冷氣機之平均台數 Y μ 。則: 試以 C1 y 、 C2 y 、 C3 y 來估計該市每戶裝置冷氣機之平均台數 Y μ ,則 Y μ 估 計值分別為何?(9 分) 若以估計式 C1 y 估計 Y μ , 則該估計在95%的信賴度下,其最大可能估 計誤差界限B 為何?(9 分) 請根據上述調查資料,試分別求 C1 y 、 C2 y 、 C3 y 等3 個估計式的估計變 異數 3,2,1 i ), y ( Vˆ ci = 之值為何 ? 並請說明哪一個估計式在估計 Y μ 時有 較好的估計效率?(6 分) 五、某市政府之行政區按區域別分為南區與北區,該市人事長想了解該市職 工去年上半年(1~6 月份)與今年上半年(1~6 月份)因生病請假時數 之變動比率,分別自南、北兩區各以簡單隨機抽樣抽出100 名職工進行 調查,得相關統計資料如下: 區域別 職工總數 ( )(人) i N 樣本數 ( )(人) in 去年上半 年樣本平 均數( i X ) 今年上半 年樣本平 均數( iY ) 去年上半 年樣本標 準差( ) i X S 今年上半 年樣本標 準差( ) i Y S 去年與今年上 半年樣本相關 係數 ( i XY ρˆ ) 1(南區) 1,000 100 18.0 18.9 10.0 10.36 0.9841 2(北區) 1,500 100 7.5 4.8 5.45 3.50 0.5576 其中: 設 :去年上半年第i位職工因生病請假的時數; i X iY :今年上半年第i位職工因生病請假的時數; i X :去年上半年因生病請假的樣本平均時數; iY :今年上半年因生病請假的樣本平均時數; Xi S :去年上半年因生病請假時數的樣本標準差; Yi S :今年上半年因生病請假時數的樣本標準差; i XY ρˆ :去年與今年上半年因生病請假的時數的樣本相關係數。 又已知去年上半年(1~6 月份)南區職工因生病請假的總時數 300 , 16 1 = X τ 小時,北區職工因生病請假的總時數 800 , 13 2 = X τ 小時。根據上述資料: 試估計該市南區職工去年上半年(1~6 月份)至今年上半年(1~6 月 份)因生病請假的時數之變動比率R 為何?又在95%的信賴度下,其 最大可能估計誤差界限B 為何?(6 分) 對於之估計問題,若要求在95%的信賴度下,其最大可能估計誤差 界限B 不超過0.02,試問應抽出多少樣本才足夠?(6 分) 試以比率估計(ratio estimation)估計該市南區職工今年上半年(1~6 月份)因生病請假的平均時數 1 Y μ 及該市北區職工今年上半年(1~6 月 份)因生病請假的平均時數 2 Y μ 。(6 分) 若視上述調查資料為分兩層(南區及北區),利用分層隨機抽樣法調 查所得,請你幫忙該市人事長用層別比率估計式(separate ratio estimator)估計該市2,500 位職工今年上半年(1~6 月份)因生病請假 的平均時數 Y μ 。又其在95%的信賴度下,其最大可能估計誤差界限B 為何?(6 分)
居民人數 85 37 49 50 34 45 65 歲以上的老年人口數 15 8 12 11 8 12 估計甲城市年齡65 歲以上的老年人口比例,且計算此比例的95%誤 差界限。 估計甲城市年齡65 歲以上的老年人口總數,且求算此總數的95%信 賴區間。 現透過戶政資料,得知甲城市居民總數為4250 人,試利用此資料估 計甲城市年齡65 歲以上的老年人口總數,並比較、這兩種估計 方法那一種較適合。