M
N
i
i m
),再由這N 個集群中用簡單隨機抽樣法抽出n 個集群,被
抽中的集群中的每一個元素均被調查。假設 iy 為第i 個集群中所有觀測
值的總和,欲估計母體的總和。母體總和τ的估計量有:
比率估計量⑴:
1
1
ˆ
n
i
i
n
i
i
y
M
m
不偏估計量⑵:
1
ˆ
n
i
i
N
y
n
或是由這N 個集群中用pps(sampling with probabilities proportional to
size)抽出n 個集群,被抽中的集群中的每一個元素均被調查。則母體總
和τ的估計量:
pps 估計量⑶:
1
ˆ
n
i
pps
i
i
y
M
n
m
請說明此三估計量之使用時機。(15 分)
某公司在臺灣一共有100 個廠區,因最近疫情關係供貨吃緊,總經理想要
估計所有100 個廠區員工未來一年請病假的總天數。100 個廠區可細分
為70 家小廠及30 家大廠。從過去經驗,小廠員工請假天數約在0~100 天
病假,大廠員工請假天數約在10~210 天病假,估計誤差界限設為500 天。
請找出可達到這個界限的適當樣本大小及各層配置樣本大小。(15 分)
表一為臺灣60 大城市之11 月份降雨量(單位:公厘mm)。城市1 至城
市60 排列方式是依地理位置從北到南依序排列。城市號碼愈小所在位
置也就愈偏臺灣北部,城市號碼愈大所在位置也就愈偏臺灣南部。
假設用簡單隨機抽樣法抽出
10
n
個臺灣大城市(10 個樣本的號碼如
下:2、12、16、20、24、27、32、40、47、56),試估計臺灣60 大城
市之11 月份平均降雨量( ˆ)
及其估計變異數( ˆ( )ˆ )
V
?(10 分)
選擇一組10 個樣本的系統樣本,為統一起見,一律採用起始號碼3。
試以此組系統樣本估計臺灣60 大城市之11 月份平均降雨量( ˆ)
及其
估計變異數( ˆ( )ˆ )
V
?假設母體為隨機排列。(10 分)
如果採重複系統抽樣,抽出兩個"12 取1"的系統樣本,為統一起見,
一律採用起始號碼1 及6。試以此兩組重複系統樣本估計臺灣60 大城
市之11 月份平均降雨量( ˆ)
及其估計變異數( ˆ( )ˆ )
V
?(15 分)
表一臺灣60 大城市之11 月份降雨量
單位:mm
城市
1
欲了解某一工業園區N家製造業者AI人才的需求狀況,下述三種抽樣設計
可用以推估該工業園區有AI人才需求的業者家數比例及總需求人數:
⑴如果園區各業者的營業規模已知,首先將業者依其營業規模分成L層
(1,
, L
),每層家數分別為
1,
,
L
N
N
,再由每層抽取一簡單隨機樣
本,分別為
1,
,
L
n
n
,以調查業者的AI人才需求狀況。
⑵如果園區各業者的營業規模未知,但已知園區業者營業規模的比例分
別為
1,
,
L
W
W
,首先由N家業者抽取一簡單隨機樣本(n)調查業者規
模及AI人才需求狀況後,再根據調查結果依其規模分成L層進行推估。
⑶如果沒有園區業者營業規模的資訊,首先由N家業者抽取一簡單隨機樣
本n,取得營業規模資訊,而後根據營業規模資訊將n家業者依其營業
規模分成L層(
1,
,
L
n
n
),再由每層抽取一簡單隨機樣本,分別為
1,
,
L
n
n
,調查業者的AI人才需求狀況。
說明前述三種抽樣設計的抽樣方法為何?(10分)
若欲估計園區AI總需求人數(Y ),分別列出對應前述三種抽樣方法的
估計量(estimator)及該估計量之變異數的估計量。(15分)
250
5.6
採用集體大小比率估計量(ratio-to-size estimator,
Ry )估計該縣市養雞
戶平均每戶年所得(以百萬元為單位)及該估計量之標準誤。(10分)
若抽樣方法採二階段集體抽樣,首先由20個村里以簡單隨機抽樣抽出3
個村里,再就抽得的3個村里之養雞戶以簡單隨機抽樣分別抽出1/10養
雞戶進行調查,調查結果養雞戶之平均所得列於下表:
村里
(cluster)
i
農戶數
(
i
M )
抽出養雞戶數
(
i
m )
村里內抽得之養雞戶平均
每戶年所得及標準差
(百萬元)
(
,
i
i
y
s )
iy
is
1
150
15
1
2
200
20
7
3
3
250
25
6
2
試問:(15分)
⑴本抽樣設計第一階段的抽樣單位(primary sampling unit, PSU)及第
二階段的抽樣單位(secondary sampling unit, SSU)分別為何?
⑵採用不偏估計量(unbiased estimator, y )估計該縣市養雞戶平均每
戶年所得(以百萬元為單位)及該估計量之標準誤。
三、欲了解某區域養殖漁戶營運狀況,該區域共有800家養殖漁戶,首先由該
區域抽得一個包含500戶(第一重樣本
500
n
)的簡單隨機樣本以取得養
殖型態(是否為漁電共生的層別資訊),調查得知其中100戶為漁電共生
戶,進而以簡單隨機抽樣由漁電共生及非漁電共生的養殖漁戶分別抽20%
以調查其營運成本資訊,調查結果整理如下表:
養殖型態(層別)
第一重樣本
(戶)
hn
第二重樣本
(戶)
hn
養殖漁戶年營運成本
平均年營運成本
iy (十萬元)
標準差
is (十萬元)
漁電共生(I)
100
20
120
100
非漁電共生(II)
400
80
50
60
合計
500(n)
100(n )
75(s)
估計該區域養殖漁戶平均年營運成本(Y )(以十萬元為單位)及該估計
量的標準誤。(10分)
如果此調查總預算為44,500元,取得養殖型態的單位成本為9元,調查
營運成本的單位成本為400元(
9,
400
h
c
c
),有關標準差、各層權
重、各層平均年營運成本及標準差之母體資訊分別以前述樣本資料(s,
i
i
n
w
n
,
iy ,
is )取代。試求:(15分)
⑴決定分層雙重抽樣的最佳抽樣設計(Optimum double sample plan),
亦即求算
h
n
n
、。
⑵就⑴的抽樣設計求算平均年營運成本估計量(以十萬元為單位)的
變異數。
四、欲了解2022年國內汽車銷售概況,就2000家汽車銷售業者進行調查,汽車
銷售業者分為兩大類:國產型(I)及進口型(II),業者家數分別為
1
N =1500
及
2
N =500。抽樣方法採用分層隨機抽樣,依類別分層,從每一層分別隨
機抽出10家業者進行調查。假設2021年(x)各類業者的年平均銷售量已
知為:
1
X =220(輛);
2
X =140(輛)。
調查結果20家業者在2021年(x)及2022年(y)的銷售量統計如下:
層別
(h)變數
樣本均數
,
i
i
y x
(輛)
比率
(ˆ
h
R )
樣本共變異數
xyh
s
樣本標準差
hs
I
y
240
1.2
7200
100
x
200
80
II
y
180
1.8
2200
60
x
100
40
合計
ys =110,
xs =90,
xy
s =9000
利用下列估計量估計年平均銷售量(Y )及該估計量的變異數:(15分)
⑴
st
y ,分層隨機抽樣結合簡單均數估計量(mean per unit estimator)。
⑵
Rs
y ,分層隨機抽樣結合分開比率估計量(separate ratio estimator)。
⑶
Rc
y ,分層隨機抽樣結合混合比率估計量(combined ratio estimator)。
求算估計量
st
y 、
Rs
y 、
Rc
y 對單位均數估計量(y )之相對效率(relative
efficiency),並說明那個估計量具有較佳精確度。(10分)
40
280
分別就下列兩種抽樣設計利用對應的不偏估計量以估計整體新創產業的
總營業額及該估計量的標準誤。
若前述一段集體抽樣係結合簡單隨機抽樣(SRS)(one-stage cluster
sampling with SRS)抽得該3 個園區。(15 分)
若前述一段集體抽樣係結合抽出機率與園區大小成比例(PPS)(one-
stage cluster sampling with PPS)的抽樣方式抽得該3 個園區。(15 分)
二、欲估計2021 年某鄉鎮的總農民所得(Y),由300 家農戶抽樣調查30 家
農戶,定義x 為普查年(2016 年)所得,y 為2021 年所得。母體資料x 與
y 之變異數(
2
2
,
x
y
S
S )、共變數(
xy
S )及y 對x 之比率(R)如下所示:
2
2
2500,
6400,
3600,
1.3
x
y
xy
S
S
S
R
。
(母體變異數
2
S 係以
1
N 為分母,例如,
2
2
1
(
)
1
N
i
x
x
X
S
N
,式中X 為母
體均數。)
計算迴歸估計量(ܻ)、比率估計量(ܻோ)及均數估計量(ܻ)的變異
數。(15 分)
根據之結果,比較估計量的相對效率(relative efficiency),你認為那
個估計量精確度比較高?說明理由。(10 分)
三、針對某一社區2000 個家戶進行抽樣調查,以了解該社區有老人(65 歲
以上)的家戶比例(P)及平均家戶年所得(Y )。若欲在95%的信心水
準下,估計有老人家戶的比例之估計誤差低於3%的範圍,且估計平均
家戶年所得之估計誤差低於實際平均家戶年所得(Y )4%的範圍。實際
上,如果有老人的家戶比例落在20%到40%的範圍內,而實際平均家戶
年所得Y =1,000(千元)且變異數為400,000(千元)。若採用簡單隨機
抽樣方式欲同時滿足前述兩個估計精確度的要求,應抽多大的樣本?
(20 分)
5
3
若要從該母體中選擇2 個單元作為樣本,在不考慮抽樣順序及可重複選擇
之情形下,共有6 種可能之樣本組合,考慮一抽樣設計為每組樣本組合
,
s
i j
,被選擇到之選擇機率為
/ 24
p s
i
j
,例如樣本組合(2,3)之
選擇機率為5/24,(1,1)被選擇之機率為2/24……等。
請回答下列問題(建議以分數計算及作答):
請問在本抽樣設計下,第݅個單元被選到之包含機率(Inclusion
Probability)若為
i,則
2
為何?(5 分)
請問若以樣本平均
2
i
i s y
y
作為母體平均
3
1
3
i
i
y
之估計量,則y 在
本設計下推估之偏誤(Bias)為何?(5 分)
y 在本設計下之均方誤差(Mean square error;MSE)為何?(5 分)
請就本設計提出一不偏估計量,請問您提出之估計量在樣本組合分別
為(2,3)及(3,3)的情況下之估計值為何?並證明或以本母體為例驗
證該估計量為不偏。(10 分)
請試述您要如何評估您所提出之不偏估計與y 在本設計下孰優孰劣?
(不須計算實際數值)(5 分)
利用簡單隨機抽樣法(simple random sampling),自母體{6, 7, 8, 9, 10}中
抽出3 個數為一組樣本,樣本中的最大值以X 表示,最小值以Y 表示。
請列出X,Y 的聯合機率分配(joint probability distribution)f(x, y)。
(10 分)
請求算機率(
10,
7)
p X
Y
。(5 分)
請求算期望值(
|
6)
E X Y
。(5 分)
令
+
Z
X Y
,請計算期望值( )
E Z 。(5 分)
考慮集群抽樣,若母體總數M 已知,請問母體總和的估計量為何?若
不知母體總數M,但知道集群總數N 時,請問母體總和的估計量為
何?(5 分)
考慮兩階段集群抽樣,證明母體平均估計量
1
1
n
i
i
i
M y
n
M
是母體平
均的不偏估計量。其中M =M/N。提示:
1
2|1
( )
( )
E
E E
(10 分)
考慮兩階段集群抽樣,由相等大小集群M 抽取相等大小樣本m,且當
N 很大時,證明在固定抽樣成本下,使
2
2
1
( )
(
)
w
b
V
n
m
值最小的m
為
2
1
2
2
w
b
c
m
c
,其中1c 是第一階段每一觀察值的成本,2c 是第二階段每
一觀察值的成本,
2
b
是集群平均間的變異數,
2
w
是集群內元素間的變
異數。(10 分)
5
6
25
∑
=
=
25
1
1
25
525
ˆ
i
iy
Y
,
∑
∑
=
=
+
=
25
6
5
1
2
20
520
ˆ
i
i
i
i
y
y
Y
試證
及
是否皆為Y 之不偏估計式。(6 分)
1ˆY
2ˆY
請分別寫出
及
之均方誤差(Mean Square Error;MSE)的定義。
(4 分)
1ˆY
2ˆY
又已知5 家特大IC 設計公司員工總人數為5,062,而其他520 家IC
設計公司員工總人數為60,320;其他520 家IC 設計公司之員工人數
的平方和為11,842,980。試利用上列資料求估計式
及
的均方誤差
之值,並請說明估計Y 時,那一個估計式較好?(4 分)
1ˆY
2ˆY
二、自來水公司想調查臺中市某區住戶在108 年1~3 月的用水情況,該區共
有N=20,000 戶,今以簡單隨機抽樣法調查了n=800 戶,得到下列統計
資料:
5.
22
=
y
噸,
噸,有320 戶用水總量超過了規定的用量標準。
36
=
s
請估計該區住戶在108 年1~3 月的總用水量Y 及其該估計之95%的信
賴區間。(6 分)
請估計該區在108 年1~3 月的總用水量超過了規定的用量標準的住戶
數T。(6 分)
又自來水公司想在6 月份再做一次該區住戶用水總量的抽樣調查,若
要求在95%水準下估計的相對誤差不超過10%,則應該抽多少樣本
(戶)才能達到上述之要求?(6 分)
,1
=
i
,
2
2
1
X
X
X
+
=
。
求X 之抽樣分配。(10 分)
驗證X 是否為母體平均數µ 的不偏估計式。(5 分)
說明X 的變異數與母體變異數
2
σ 之間的關係。(10 分)
二、為了解學生平時打工情形,A 大學特地進行下列調查計畫。已知A 大學
共有100 個班級,現自100 個班級中隨機抽出5 個班級,再由這5 個班
級中隨機抽出部分學生,調查每位學生每星期打工時數(
ijy ),得到如
下資料:
班級學生人數
i
M
抽樣學生數
i
m
i
m
j
ij
i
m
y
y
i
∑=
=
1
1
)
(
1
2
2
−
−
= ∑=
i
m
j
i
ij
i
m
y
y
s
i
50
5
29
15
78
8
15
9
62
6
20
22
71
7
35
20
39
4
45
18
請問這是何種抽樣方法?(5 分)
請估計每位學生每星期的平均打工時數,並求算其95%誤差界限。
(10 分)
若已知A 大學學生總人數為5880 人,請估計每位學生每星期的平均
打工時數,並求算其95%信賴區間。(10 分)
假設母體的元素總個數為N,現欲估計母體的平均數µ。(每小題10 分,
共30 分)
請說明如何以簡單隨機抽樣(simple random sampling)法,自母體中
抽出一組樣本大小為n 的樣本,並求母體平均數µ的估計式y 。
請說明如何以系統抽樣(systematic sampling)法,自母體中抽出一組
樣本大小為n 的樣本,並求母體平均數µ的估計式
sy
y 。
說明上述兩種抽樣法,每組樣本被抽出的機率;且比較估計式y 與
sy
y
的變異數的大小。
若一母體共分為三層,其中各層母體大小分別為
=300,
=600 與
=100。根據過去的調查結果知道這三層的母體標準差分別為
1
N
2
N
3
N
1
σ =150,
2
σ =75 與
3
σ =100。
若調查總預算(C)只有20,000 元,又固定成本(
)為2,000 元,每一
層調查單位成本均相同為50 元,即
元,我們想以分層隨機
抽樣法估計式
0c
50
3
2
1
=
=
=
c
c
c
st
y 估計母體平均數μ,試依紐曼配置(Neyman Allocation)
法,求滿足要求之總樣本大小n 及各層所需之樣本大小(i = 1,2,3)分別
為若干?(10 分)
in
若我們想以分層隨機抽樣法估計式
st
y 估計母體平均數μ的95%的誤差
界限不超過B=20,試依紐曼配置法,求滿足要求之總樣本大小n 及
各層所需之樣本大小(i = 1,2,3)分別為若干?(10 分)
in
125
200
10
42
252
註:上述調查資料經計算得∑
,
,
,
,
,在簡單集體抽樣法下,電力公司營
業處利用
900
M
10
1
i
i =
=
514
,
91
M
10
1
i
2
i =
∑
=
685
,2
y
10
1
i
i =
∑
=
777
,
819
y
10
1
i
2
i =
∑
=
551
,
251
y
M
10
1
i
i
i
=
∑
=
∑
∑
=
=
= 10
1
i
i
1
i
M
y
10
i
C1
y
,
∑
=
=
10
1
i
i
C2
y
n
1
M
N
y
,
∑
=
=
10
1
i
i
C3
y
n
1
y
等3 個估計式
(其中
i
i
i
M
y
y =
)來估計該市每戶裝置冷氣機之平均台數
Y
μ 。則:
試以
C1
y 、
C2
y 、
C3
y 來估計該市每戶裝置冷氣機之平均台數
Y
μ ,則
Y
μ 估
計值分別為何?(9 分)
若以估計式
C1
y 估計
Y
μ , 則該估計在95%的信賴度下,其最大可能估
計誤差界限B 為何?(9 分)
請根據上述調查資料,試分別求
C1
y 、
C2
y 、
C3
y 等3 個估計式的估計變
異數
3,2,1
i
),
y
(
Vˆ
ci
=
之值為何 ? 並請說明哪一個估計式在估計
Y
μ 時有
較好的估計效率?(6 分)
五、某市政府之行政區按區域別分為南區與北區,該市人事長想了解該市職
工去年上半年(1~6 月份)與今年上半年(1~6 月份)因生病請假時數
之變動比率,分別自南、北兩區各以簡單隨機抽樣抽出100 名職工進行
調查,得相關統計資料如下:
區域別
職工總數
(
)(人)
i
N
樣本數
(
)(人)
in
去年上半
年樣本平
均數(
i
X )
今年上半
年樣本平
均數(
iY )
去年上半
年樣本標
準差(
)
i
X
S
今年上半
年樣本標
準差(
)
i
Y
S
去年與今年上
半年樣本相關
係數 (
i
XY
ρˆ
)
1(南區)
1,000
100
18.0
18.9
10.0
10.36
0.9841
2(北區)
1,500
100
7.5
4.8
5.45
3.50
0.5576
其中:
設
:去年上半年第i位職工因生病請假的時數;
i
X
iY :今年上半年第i位職工因生病請假的時數;
i
X :去年上半年因生病請假的樣本平均時數;
iY :今年上半年因生病請假的樣本平均時數;
Xi
S :去年上半年因生病請假時數的樣本標準差;
Yi
S :今年上半年因生病請假時數的樣本標準差;
i
XY
ρˆ
:去年與今年上半年因生病請假的時數的樣本相關係數。
又已知去年上半年(1~6 月份)南區職工因生病請假的總時數
300
,
16
1 =
X
τ
小時,北區職工因生病請假的總時數
800
,
13
2 =
X
τ
小時。根據上述資料:
試估計該市南區職工去年上半年(1~6 月份)至今年上半年(1~6 月
份)因生病請假的時數之變動比率R 為何?又在95%的信賴度下,其
最大可能估計誤差界限B 為何?(6 分)
對於之估計問題,若要求在95%的信賴度下,其最大可能估計誤差
界限B 不超過0.02,試問應抽出多少樣本才足夠?(6 分)
試以比率估計(ratio estimation)估計該市南區職工今年上半年(1~6
月份)因生病請假的平均時數
1
Y
μ 及該市北區職工今年上半年(1~6 月
份)因生病請假的平均時數
2
Y
μ
。(6 分)
若視上述調查資料為分兩層(南區及北區),利用分層隨機抽樣法調
查所得,請你幫忙該市人事長用層別比率估計式(separate ratio
estimator)估計該市2,500 位職工今年上半年(1~6 月份)因生病請假
的平均時數
Y
μ 。又其在95%的信賴度下,其最大可能估計誤差界限B
為何?(6 分)
1
,
,
,
u
u
u
u
=
F
假設前一小題之中抽出樣本大小為n=3 的樣本組合,並以Y1 ,Y2,Y3 來表示此樣本組
合中的三個樣本數據。試求Y1 與Y3 的共變異數。(5 分)
二、假設某一個有限母體可被完整地切割為L個互不相交的層別(strata),其中第h層
之層大小(stratum size)為Nh,第h層之第j個元素的研究變數值為yhj,h=1,…,L,
j=1,2,…,Nh。母體大小(population size)、母體平均數(population mean)以及母體
變異數(population variance)的數學式分別為
母體大小:
1
2
L
N
N
N
N
=
+
+
+
L
;
母體平均數:
1
1
1
h
N
L
hj
h
j
y
N
μ
=
=
=
∑∑
;
母體變異數:
2
2
1
1
1
(
)
h
N
L
hj
h
j
y
N
σ
μ
=
=
=
−
∑∑
。
其次,母體中第h 層之層平均數(stratum mean)以及層變異數(stratum variance)
的數學式分別為
第h 層之層平均數:
1
1
h
N
h
h
j
h
y
N
μ
=
=
j
∑
;
第h 層之層變異數:
2
2
1
1
(
)
h
N
h
hj
j
h
y
N
σ
h
μ
=
=
−
∑
。
試證明下列等式:
2
2
1
1
(
)
L
L
h
h
h
h
h
h
W
W
σ
σ
2
μ
μ
=
=
=
+
−
∑
∑
,
其中
h
h
N
W
N
=
為第h 層的層比重(stratum weight),
。(10 分)
1,
,
h
L
=
L
使用分層隨機抽樣(stratified random sampling)之後,抽樣者應如何推估(未知其
值的)母體平均數?需要什麼假設條件?請詳細說明。(4 分)
在使用分層隨機抽樣之前,抽樣者必須事先決定將要採用何種較為適當的配置,
例如比例配置(proportional allocation)、尼門配置(Neyman allocation)。請詳細說
明在使用事後分層(post-stratification)的方法之前,抽樣者是否也必須事先決定
採用何種配置?(5 分)
請詳細說明在什麼情況之下,抽樣者需要借助於雙重抽樣(double sampling)之方
法,來進行分層隨機抽樣並推估母體的平均數(或是推估母體的其他參數)。
(5 分)
107年公務人員高等考試三級考試試題
全一張
(背面)
類
科: 統計
科
目: 抽樣方法
假設總樣本數是150。再假設研究者把母體分成三層並且取得以下相關
資訊:
z 第一層有100 個抽樣單元、母體變異數16;
z 第二層有200 個抽樣單元、母體變異數25;
z 第三層有300 個抽樣單元、母體變異數36;
請回答:假設抽樣成本是一致的,請問根據最佳分配原則,
第一層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分)
第二層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分)
第三層分配到樣本數是多少(答案請四捨五入到個位數)?(5 分)
何謂簡單隨機抽樣法?(5 分)
設一有限母體中有N 個元素,若自母體中以抽出不放回的抽樣方式,抽出n 個簡
單隨機樣本,
n
y
y
y
,
...
,
,
2
1
,請證明樣本平均數
n
y
y
n
i
i
∑=
=
1
的變異數
n
N
n
N
y
Var
2
1
)
(
σ
⋅
−
−
=
(
2
σ 為母體變異數)。(10 分)
假定母體中有N個個體。我們現在要從中抽出n 個個體做為樣本。
試解釋如何以簡單隨機抽樣(Simple Random Sampling)進行抽樣。(6 分)
試解釋如何以分層隨機抽樣(Stratified Random Sampling)進行抽樣。(7 分)
採取分層隨機抽樣而非簡單隨機抽樣的可能理由為何?(7 分)
1
5
大方文創商品公司共有50 家分店,去年第1 季的營業額為3,950 萬元,為了解今年
第1 季的營運狀況,自50 家分店中抽出6 家分店調查,得各分店去年第1 季的營業
額(
)及今年第1 季的營業額(
)如下:(單位:萬元)
i
i
分店
1
2
若採用重複系統抽樣法(Repeated Systematic Sampling),在母體大小為N 中抽出
ns 個“k'取1”的系統樣本,可得ns 個樣本大小為n(
'k
N
n =
)的系統樣本。若第i
個系統樣本為
k
n
i
k
i
i
y
y
y
′
−
+
′
+
)
1
(
,
...
,
,
,令
n
y
y
n
j
ij
i
∑=
=
1
,(i = 1, 2, … , ns)為第i 個系
統樣本的平均數,請寫出母體平均數 ߤ̂ 的估計公式?及母體平均數估計式的估計
變異數Var
(ߤ̂)?(10 分)
若採用群集隨機抽樣法(Cluster Sampling),在母體大小為M 中先分成
N 個群集(cluster)(每一個群集之個數為m1, m2, … , mN,
∑=
=
N
i
i
m
M
1
),再以群集
為抽樣單位,以簡單隨機抽樣法抽出n 個群集為一群集樣本,稱為群集隨機樣本。
若yi 表示第i 個群集中變數值的總和,請寫出母體平均數 ߤ̂ 的估計公式?及母體平
均數估計式的估計變異數Var
(ߤ̂)?(10 分)
在何種條件下,題及所述兩種抽樣法之母體平均數的估計值公式會相同?
(5 分)
106年特種考試地方政府公務人員考試試題
全一張
(背面)
等
別: 三等考試
類
科: 統計
科
目: 抽樣方法
在兩階段抽樣法中,第一階段先將母體分成N 個抽樣單位,以簡單隨機抽樣法抽出n
個抽樣單位,稱為第一抽樣單位。其次,將第一階段中的每一個抽樣單位分割成
Mi (i = 1, 2 , … , N)個抽樣單位,並從n 個第一抽樣單位以簡單隨機抽樣法各抽出
mi (i = 1, 2, … , n)個抽樣單位(
,
,
...
,
,
2
1
i
im
i
i
y
y
y
i = 1, 2, … , n),稱為第二抽樣單位,
∑=
=
N
i
i
M
M
1
,
N
M
M =
,
∑=
=
i
m
j
ij
i
i
y
m
y
1
1
。
在什麼情況下,兩階段抽樣法即為分層隨機抽樣法?(5 分)
在什麼情況下,兩階段抽樣法即為群集隨機抽樣法?(5 分)
若M 未知,請寫出母體平均數ߤ̂的估計公式及Var
(ߤ̂)的估計公式。(10 分)
若在第一階段中不以簡單隨機抽樣法抽出n 個抽樣單位,改以第i(i = 1, 2, … , N)
個被抽中的機率為M
Mi(Two-Stage Cluster Sampling with Probabilities Proportional to
Size, pps),請寫出母體平均數ߤ̂的估計公式及Var
(ߤ̂)的估計公式。(10 分)