在一地區抽樣調查400 人,其中有40 人使用A 品牌手機。
試求此地區使用A 品牌手機人數比例p 的95%信賴區間(註:
0.025
1.96
Z
)。(10 分)
若誤差
04
ˆ
0.
e
p
p
,則在95%的信賴水準下,樣本大小n 至少應
為多少?(15 分)
某市政府若想估算現有樹木植栽之綠化的社區總面積(以平方公尺計),
由於綠化面積隨社區規模大小而有很大差異,決定以社區規模先進行分
層。若該市共有280 個社區,依規模分為四類(分別為A, B, C, D),採
用比例配置(proportional allocation)法進行分層隨機抽樣得以下結果:
社區規模分類(層)
A
B
C
D
ܰ
96
82
62
40
݊
16
13
10
6
ݕത
183.6
383.0
590.5
772.4
ݏ
ଶ
1071.9
9054.8
16794.2
72376.3
某位統計學家想估計A 鎮居民每月生活花費。設該鎮有
120
N
鄰,此統
計學家隨機抽出
4
n
鄰,再由其中抽出數戶,得資料如下:(單位:千元)
每鄰戶數
i
M
樣本戶數
i
m
iy
80
8
16
47
5
30
62
6
21
39
4
45
試求:
該鎮居民每月平均生活花費Y 的比例機率兩階段估計值。(7 分)
該鎮居民每月平均生活花費Y 的95%近似信賴區間。(18 分)
i
i
i
i
N
y
s
、n、與
分別為第i 層的母體數、樣本數、樣本平均數及樣本變異
數,i=A, B, C, D。
估計該市綠化社區的總面積。(5 分)
針對小題的估計結果,計算其95%近似誤差界限。(10 分)
如果使用奈曼配置(Neyman allocation),在5000 平方公尺的估計誤差
的範圍內,求一個近似的樣本量來達到小題的誤差界限。(15 分)
二、某市政府民政局制訂抽樣計劃,藉以估算所屬某項業務的每週申辦數
量。該民政局決定先對該市的20 個行政區隨機抽出五個區,然後再自抽
中的各區內的里進行隨機抽樣。此兩階段聚類樣本(two-stage cluster
sample)得到以下統計結果:
區
里數
抽樣里數
ݕത
ݏ
ଶ
1
45
9
102
20
2
36
4
90
16
統計學家對某組數據,以最小平方法所配適的迴歸線為:
0
1 1
ˆ
ˆ
ˆi
i
y
x
其中最小平方估計式
1
1 1
1
1
1
1
2
1
1
1
ˆ
(
)(
)
(
)
n
i
i
x y
i
n
x x
i
i
x
x
y
y
S
S
x
x
。但實際上,反應值
iy 還會受到第二個變數
2i
x 影響,因此真實的迴歸線如下:
0
1 1
2
2
( )
i
i
i
E y
x
x
在此情形下,請問以最小平方估計式
1ˆ來估計
1
的偏誤量(bias)為多
少?請詳細列出偏誤量的數學式及其推導過程。(25 分)
22
簡單線性迴歸模型如下:
i
0
1
i
i
Y
X
ε , i
1,
,n
其中iε 為iid 且服從
2
N(0,σ )。今某高中老師收集12 位學生的英文成績
(X)及數學成績(Y)如下:
X
65
63
68
65
66
65
68
67
72
67
70
63
Y
63
65
71
64
68
63
65
66
70
68
69
67
請以此資料配適簡單線性迴歸模型。(10 分)
以所配適的模型,預測當學生英文成績為69 時,數學成績為何?(5 分)
請以α
0.05
,進行雙尾檢定
0
1
H :
0
,
1
1
H :
0
。請寫出詳細檢定
過程與結果(註:10,0.025
t
2.2281
;11,0.025
t
2.2010
;12,0.025
t
2.1788
)。
(10 分)
69
22
4
18
4
94
26
28
2
120
32
2
i
i
y
s
與
分別為第i 區該項業務的平均每週申辦數及樣本變異數
估算該業務平均的每週申辦數量。(5 分)
計算95%近似誤差界限。(15 分)
三、某市政府工務單位欲瞭解其約聘僱人員的工作滿意度分數Y(分數愈高
滿意度愈高)之影響因素,考慮以下解釋變數:
1
X :工作年資(年)
2
X :薪資(千元)
及學歷(分「高中及以下」、「大專」、「研究所及以上」等三類),並定義
變數如下:
3
4
1
1
0
0
X
X
,
若蒐集30 位約聘僱人員的資料,將Y 對
1
2
3
4
X
X
X
X
和
、、
進行迴歸分析,
得到以下迴歸模型的估計:
估計值
標準誤
截距項
13.24
7.29
1
X
8.69
2.56
2
X
1.35
0.38
3
X
4.92
2.10
4
X
5.89
4.10
SST=989.7,s=4.8
SST 為總變異平方和(total sum of squares),s 為迴歸誤差之標準差的估
計值。回答以下問題:
說明所建立的迴歸模型及其所需誤差的假設。(6 分)
分別說明
3
X 與
4
X 之估計的迴歸係數的意義。(6 分)
以顯著水準為0.05,分別檢定
3
X 與
4
X 的迴歸係數之顯著性。(10 分)
寫出此配適模型的變異數分析(analysis of variance)表,並詳細說明
計算過程。(10 分)
以顯著水準為0.05,檢定此迴歸模型之所有解釋變數的係數是否皆等
於0。(6 分)
計算調整的判定係數(adjusted coefficient of determination)。(6 分)
說明均方誤(mean squared error,MSE)的定義與意義,並計算此配
適模型的MSE 值。(6 分)
大專學歷
其他
研究所及以上學歷
其他
附表一:
α
tα
附表二: