臺灣地區有525 家IC 設計公司,其中有5 家公司規模特大。為了估計
臺灣地區IC 設計產業的總員工人數Y,除了將5 家特大IC 設計公司調
查其員工人數得
,
,…,
以外,另以簡單隨機抽樣法(不歸還)從
剩餘的520 家IC 設計公司中抽出20 家公司為樣本,調查其員工人數得
, ...,
。現欲採用下列兩種估計式以估計臺灣地區IC 設計公司之
總員工人數Y:
1
y
y
y
y
y
,1
=
i
,
2
2
1
X
X
X
+
=
。
求X 之抽樣分配。(10 分)
驗證X 是否為母體平均數µ 的不偏估計式。(5 分)
說明X 的變異數與母體變異數
2
σ 之間的關係。(10 分)
二、為了解學生平時打工情形,A 大學特地進行下列調查計畫。已知A 大學
共有100 個班級,現自100 個班級中隨機抽出5 個班級,再由這5 個班
級中隨機抽出部分學生,調查每位學生每星期打工時數(
ijy ),得到如
下資料:
班級學生人數
i
M
抽樣學生數
i
m
i
m
j
ij
i
m
y
y
i
∑=
=
1
1
)
(
1
2
2
−
−
= ∑=
i
m
j
i
ij
i
m
y
y
s
i
50
5
29
15
78
8
15
9
62
6
20
22
71
7
35
20
39
4
45
18
請問這是何種抽樣方法?(5 分)
請估計每位學生每星期的平均打工時數,並求算其95%誤差界限。
(10 分)
若已知A 大學學生總人數為5880 人,請估計每位學生每星期的平均
打工時數,並求算其95%信賴區間。(10 分)
假設母體的元素總個數為N,現欲估計母體的平均數µ。(每小題10 分,
共30 分)
請說明如何以簡單隨機抽樣(simple random sampling)法,自母體中
抽出一組樣本大小為n 的樣本,並求母體平均數µ的估計式y 。
請說明如何以系統抽樣(systematic sampling)法,自母體中抽出一組
樣本大小為n 的樣本,並求母體平均數µ的估計式
sy
y 。
說明上述兩種抽樣法,每組樣本被抽出的機率;且比較估計式y 與
sy
y
的變異數的大小。
若一母體共分為三層,其中各層母體大小分別為
=300,
=600 與
=100。根據過去的調查結果知道這三層的母體標準差分別為
1
N
2
N
3
N
1
σ =150,
2
σ =75 與
3
σ =100。
若調查總預算(C)只有20,000 元,又固定成本(
)為2,000 元,每一
層調查單位成本均相同為50 元,即
元,我們想以分層隨機
抽樣法估計式
0c
50
3
2
1
=
=
=
c
c
c
st
y 估計母體平均數μ,試依紐曼配置(Neyman Allocation)
法,求滿足要求之總樣本大小n 及各層所需之樣本大小(i = 1,2,3)分別
為若干?(10 分)
in
若我們想以分層隨機抽樣法估計式
st
y 估計母體平均數μ的95%的誤差
界限不超過B=20,試依紐曼配置法,求滿足要求之總樣本大小n 及
各層所需之樣本大小(i = 1,2,3)分別為若干?(10 分)
in
125
200
10
42
252
註:上述調查資料經計算得∑
,
,
,
,
,在簡單集體抽樣法下,電力公司營
業處利用
900
M
10
1
i
i =
=
514
,
91
M
10
1
i
2
i =
∑
=
685
,2
y
10
1
i
i =
∑
=
777
,
819
y
10
1
i
2
i =
∑
=
551
,
251
y
M
10
1
i
i
i
=
∑
=
∑
∑
=
=
= 10
1
i
i
1
i
M
y
10
i
C1
y
,
∑
=
=
10
1
i
i
C2
y
n
1
M
N
y
,
∑
=
=
10
1
i
i
C3
y
n
1
y
等3 個估計式
(其中
i
i
i
M
y
y =
)來估計該市每戶裝置冷氣機之平均台數
Y
μ 。則:
試以
C1
y 、
C2
y 、
C3
y 來估計該市每戶裝置冷氣機之平均台數
Y
μ ,則
Y
μ 估
計值分別為何?(9 分)
若以估計式
C1
y 估計
Y
μ , 則該估計在95%的信賴度下,其最大可能估
計誤差界限B 為何?(9 分)
請根據上述調查資料,試分別求
C1
y 、
C2
y 、
C3
y 等3 個估計式的估計變
異數
3,2,1
i
),
y
(
Vˆ
ci
=
之值為何 ? 並請說明哪一個估計式在估計
Y
μ 時有
較好的估計效率?(6 分)
五、某市政府之行政區按區域別分為南區與北區,該市人事長想了解該市職
工去年上半年(1~6 月份)與今年上半年(1~6 月份)因生病請假時數
之變動比率,分別自南、北兩區各以簡單隨機抽樣抽出100 名職工進行
調查,得相關統計資料如下:
區域別
職工總數
(
)(人)
i
N
樣本數
(
)(人)
in
去年上半
年樣本平
均數(
i
X )
今年上半
年樣本平
均數(
iY )
去年上半
年樣本標
準差(
)
i
X
S
今年上半
年樣本標
準差(
)
i
Y
S
去年與今年上
半年樣本相關
係數 (
i
XY
ρˆ
)
1(南區)
1,000
100
18.0
18.9
10.0
10.36
0.9841
2(北區)
1,500
100
7.5
4.8
5.45
3.50
0.5576
其中:
設
:去年上半年第i位職工因生病請假的時數;
i
X
iY :今年上半年第i位職工因生病請假的時數;
i
X :去年上半年因生病請假的樣本平均時數;
iY :今年上半年因生病請假的樣本平均時數;
Xi
S :去年上半年因生病請假時數的樣本標準差;
Yi
S :今年上半年因生病請假時數的樣本標準差;
i
XY
ρˆ
:去年與今年上半年因生病請假的時數的樣本相關係數。
又已知去年上半年(1~6 月份)南區職工因生病請假的總時數
300
,
16
1 =
X
τ
小時,北區職工因生病請假的總時數
800
,
13
2 =
X
τ
小時。根據上述資料:
試估計該市南區職工去年上半年(1~6 月份)至今年上半年(1~6 月
份)因生病請假的時數之變動比率R 為何?又在95%的信賴度下,其
最大可能估計誤差界限B 為何?(6 分)
對於之估計問題,若要求在95%的信賴度下,其最大可能估計誤差
界限B 不超過0.02,試問應抽出多少樣本才足夠?(6 分)
試以比率估計(ratio estimation)估計該市南區職工今年上半年(1~6
月份)因生病請假的平均時數
1
Y
μ 及該市北區職工今年上半年(1~6 月
份)因生病請假的平均時數
2
Y
μ
。(6 分)
若視上述調查資料為分兩層(南區及北區),利用分層隨機抽樣法調
查所得,請你幫忙該市人事長用層別比率估計式(separate ratio
estimator)估計該市2,500 位職工今年上半年(1~6 月份)因生病請假
的平均時數
Y
μ 。又其在95%的信賴度下,其最大可能估計誤差界限B
為何?(6 分)