M
N
i
i m
),再由這N 個集群中用簡單隨機抽樣法抽出n 個集群,被
抽中的集群中的每一個元素均被調查。假設 iy 為第i 個集群中所有觀測
值的總和,欲估計母體的總和。母體總和τ的估計量有:
比率估計量⑴:
1
1
ˆ
n
i
i
n
i
i
y
M
m
不偏估計量⑵:
1
ˆ
n
i
i
N
y
n
或是由這N 個集群中用pps(sampling with probabilities proportional to
size)抽出n 個集群,被抽中的集群中的每一個元素均被調查。則母體總
和τ的估計量:
pps 估計量⑶:
1
ˆ
n
i
pps
i
i
y
M
n
m
請說明此三估計量之使用時機。(15 分)
某公司在臺灣一共有100 個廠區,因最近疫情關係供貨吃緊,總經理想要
估計所有100 個廠區員工未來一年請病假的總天數。100 個廠區可細分
為70 家小廠及30 家大廠。從過去經驗,小廠員工請假天數約在0~100 天
病假,大廠員工請假天數約在10~210 天病假,估計誤差界限設為500 天。
請找出可達到這個界限的適當樣本大小及各層配置樣本大小。(15 分)
表一為臺灣60 大城市之11 月份降雨量(單位:公厘mm)。城市1 至城
市60 排列方式是依地理位置從北到南依序排列。城市號碼愈小所在位
置也就愈偏臺灣北部,城市號碼愈大所在位置也就愈偏臺灣南部。
假設用簡單隨機抽樣法抽出
10
n
個臺灣大城市(10 個樣本的號碼如
下:2、12、16、20、24、27、32、40、47、56),試估計臺灣60 大城
市之11 月份平均降雨量( ˆ)
及其估計變異數( ˆ( )ˆ )
V
?(10 分)
選擇一組10 個樣本的系統樣本,為統一起見,一律採用起始號碼3。
試以此組系統樣本估計臺灣60 大城市之11 月份平均降雨量( ˆ)
及其
估計變異數( ˆ( )ˆ )
V
?假設母體為隨機排列。(10 分)
如果採重複系統抽樣,抽出兩個"12 取1"的系統樣本,為統一起見,
一律採用起始號碼1 及6。試以此兩組重複系統樣本估計臺灣60 大城
市之11 月份平均降雨量( ˆ)
及其估計變異數( ˆ( )ˆ )
V
?(15 分)
表一臺灣60 大城市之11 月份降雨量
單位:mm
城市
1
欲了解某一工業園區N家製造業者AI人才的需求狀況,下述三種抽樣設計
可用以推估該工業園區有AI人才需求的業者家數比例及總需求人數:
⑴如果園區各業者的營業規模已知,首先將業者依其營業規模分成L層
(1,
, L
),每層家數分別為
1,
,
L
N
N
,再由每層抽取一簡單隨機樣
本,分別為
1,
,
L
n
n
,以調查業者的AI人才需求狀況。
⑵如果園區各業者的營業規模未知,但已知園區業者營業規模的比例分
別為
1,
,
L
W
W
,首先由N家業者抽取一簡單隨機樣本(n)調查業者規
模及AI人才需求狀況後,再根據調查結果依其規模分成L層進行推估。
⑶如果沒有園區業者營業規模的資訊,首先由N家業者抽取一簡單隨機樣
本n,取得營業規模資訊,而後根據營業規模資訊將n家業者依其營業
規模分成L層(
1,
,
L
n
n
),再由每層抽取一簡單隨機樣本,分別為
1,
,
L
n
n
,調查業者的AI人才需求狀況。
說明前述三種抽樣設計的抽樣方法為何?(10分)
若欲估計園區AI總需求人數(Y ),分別列出對應前述三種抽樣方法的
估計量(estimator)及該估計量之變異數的估計量。(15分)
250
5.6
採用集體大小比率估計量(ratio-to-size estimator,
Ry )估計該縣市養雞
戶平均每戶年所得(以百萬元為單位)及該估計量之標準誤。(10分)
若抽樣方法採二階段集體抽樣,首先由20個村里以簡單隨機抽樣抽出3
個村里,再就抽得的3個村里之養雞戶以簡單隨機抽樣分別抽出1/10養
雞戶進行調查,調查結果養雞戶之平均所得列於下表:
村里
(cluster)
i
農戶數
(
i
M )
抽出養雞戶數
(
i
m )
村里內抽得之養雞戶平均
每戶年所得及標準差
(百萬元)
(
,
i
i
y
s )
iy
is
1
150
15
1
2
200
20
7
3
3
250
25
6
2
試問:(15分)
⑴本抽樣設計第一階段的抽樣單位(primary sampling unit, PSU)及第
二階段的抽樣單位(secondary sampling unit, SSU)分別為何?
⑵採用不偏估計量(unbiased estimator, y )估計該縣市養雞戶平均每
戶年所得(以百萬元為單位)及該估計量之標準誤。
三、欲了解某區域養殖漁戶營運狀況,該區域共有800家養殖漁戶,首先由該
區域抽得一個包含500戶(第一重樣本
500
n
)的簡單隨機樣本以取得養
殖型態(是否為漁電共生的層別資訊),調查得知其中100戶為漁電共生
戶,進而以簡單隨機抽樣由漁電共生及非漁電共生的養殖漁戶分別抽20%
以調查其營運成本資訊,調查結果整理如下表:
養殖型態(層別)
第一重樣本
(戶)
hn
第二重樣本
(戶)
hn
養殖漁戶年營運成本
平均年營運成本
iy (十萬元)
標準差
is (十萬元)
漁電共生(I)
100
20
120
100
非漁電共生(II)
400
80
50
60
合計
500(n)
100(n )
75(s)
估計該區域養殖漁戶平均年營運成本(Y )(以十萬元為單位)及該估計
量的標準誤。(10分)
如果此調查總預算為44,500元,取得養殖型態的單位成本為9元,調查
營運成本的單位成本為400元(
9,
400
h
c
c
),有關標準差、各層權
重、各層平均年營運成本及標準差之母體資訊分別以前述樣本資料(s,
i
i
n
w
n
,
iy ,
is )取代。試求:(15分)
⑴決定分層雙重抽樣的最佳抽樣設計(Optimum double sample plan),
亦即求算
h
n
n
、。
⑵就⑴的抽樣設計求算平均年營運成本估計量(以十萬元為單位)的
變異數。
四、欲了解2022年國內汽車銷售概況,就2000家汽車銷售業者進行調查,汽車
銷售業者分為兩大類:國產型(I)及進口型(II),業者家數分別為
1
N =1500
及
2
N =500。抽樣方法採用分層隨機抽樣,依類別分層,從每一層分別隨
機抽出10家業者進行調查。假設2021年(x)各類業者的年平均銷售量已
知為:
1
X =220(輛);
2
X =140(輛)。
調查結果20家業者在2021年(x)及2022年(y)的銷售量統計如下:
層別
(h)變數
樣本均數
,
i
i
y x
(輛)
比率
(ˆ
h
R )
樣本共變異數
xyh
s
樣本標準差
hs
I
y
240
1.2
7200
100
x
200
80
II
y
180
1.8
2200
60
x
100
40
合計
ys =110,
xs =90,
xy
s =9000
利用下列估計量估計年平均銷售量(Y )及該估計量的變異數:(15分)
⑴
st
y ,分層隨機抽樣結合簡單均數估計量(mean per unit estimator)。
⑵
Rs
y ,分層隨機抽樣結合分開比率估計量(separate ratio estimator)。
⑶
Rc
y ,分層隨機抽樣結合混合比率估計量(combined ratio estimator)。
求算估計量
st
y 、
Rs
y 、
Rc
y 對單位均數估計量(y )之相對效率(relative
efficiency),並說明那個估計量具有較佳精確度。(10分)