假設從全國250 所大學中,以SRS 抽樣抽出50 所大學。學生人數(表示為Yi)和
老師人數(表示為Xi)如下所示:
樣本數 (n)
∑
=
50
1
Y
i
i
∑
=
50
1
X
i
i
2
50
1
Y
∑
=
i
i
i
i
iY
X
50
1∑
=
2
50
1
X
∑
=
i
i
50
樣本結果,S
{y1,y4,y6}
{y2,y3,y6}
{y1,y3,y5}
樣本結果出現的機率,P(S)
1/4
1/2
1/4
令
y
µ 表示母體平均數,y表示樣本平均數,且已知∑
=
=
6
1
i
i
852
y
,∑
=
=
6
1
i
2
i
128138
y
。
試根據此抽樣設計的結果求下列各值:(20 分)
y的期望值
)
y
(
E
=?
y的變異數
)
y
(
V
=?
y的偏誤
)
y
(
Bias
=?
y的均方差
)
y
(
MSE
=?
三、何謂分層隨機抽樣?分層的目的為何?使用分層隨機抽樣法時,各層樣本大小之配
置(allocation)主要有那些方法?請用適當的符號列出這些配置方法的公式。(30 分)
某一工會擬對2000 名會員進行雇工人數調查,以去年每一會員平均雇用之勞工人數作
為分層之標準,由會員中以分層隨機抽樣法抽出100 名會員,其樣本資料如下:(40 分)
層(h)
Nh
nh
h
y
Sh
1
1150
50
15
8
2
400
10
24
7
3
250
20
36
8
10
2.
30
×
3
10
02
.2
×
6
10
1.
30 ×
6
10
7.1
×
6
10
11
.0
×
利用上述資料說明如何估計
T
S
N
N
R =
,其中NS 和NT 分別為250 所大學學生和老師
總人數。(10 分)
說明
所提出的估計值是否為R 的不偏估計。(10 分)
利用上述資料建構R 的95%區間估計。(10 分)
三、 假設母體分為兩層。令N1 和N2 分別表示第一層和第二層已知之母體總數,令σ1
2
和σ2
2 分別表示第一層和第二層之母體變方(σ1
2 和σ2
2 未知)。考慮以分層抽樣方式
自母體兩層中分別以SRS 抽出n1 和n2 個樣本並以
∑
=
=
2
1
h
h
h
st
y
w
y
估計母體平均值,其
中
1y 和
2
y 分別表示第一層和第二層樣本平均值,
)
2
,1
( =
=
h
N
N
w
h
h
,
2
1
N
N
N
+
=
。
我們希望在給定的預算c 下選擇n1 和n2 使得
st
y 的變方
)
(
st
y
Var
最小。
假設
∑
=
+
=
2
1
0
h
h
hn
c
c
c
,其中c0 和ch (h=1, 2) 為已知之正數。
當c1=c2 時,說明如何選擇n1 和n2?(10 分)
由於σ1
2 和σ2
2 未知,因此
所選擇的n1 和n2 在實際應用上有何困難?(5 分)
另一簡單之樣本數配置方法稱之為比例配置。何謂比例配置並說明在何種情形下
適用。(10 分)
某統計專家擬調查某甘蔗試驗農場改良種「台灣一號甘蔗」的含糖量,但因不知甘
蔗總株數N,致不宜採用簡單隨機抽樣,故決定改用〝七中取一〞的系統抽樣法,
下表所列資料是所抽甘蔗樣本的含糖量百分比(%)。(25 分)
甘蔗樣本
1
2
3
…
210
211
212
含糖量yi(%)
82
76
83
…
84
80
79
且經計算得下列資料:∑
=
=
212
1
i
i
17066
y
,∑
=
=
212
1
i
2
i
1486800
y
。
試估計該農場改良種甘蔗的平均含糖量µ之值,及其估計的95%誤差界限。
註:設Z~N(0,1),令
=
Φ
)
z
(
dt
e
2
1
2
t2
−
π
,已知
95
.0
)
645
.1(
=
Φ
,
975
.0
)
96
.1(
=
Φ
。
∫
z
∞
−