某研究探討喝含糖飲品與血糖的相關性,研究者將對象按喝含糖飲品區
分為若干組,然後比較各組樣本血糖平均值之差異,研究者得到下表之
結果,請問本研究的總樣本數為何?血糖的總變異量(也就是A)為何?
統計檢定量F 的數值(也就是C)為何?並請說明表中所顯示之統計檢
定時需要何種假設?(20分)
Source of variation
Sums of squares
df
Mean squares
F
Among groups
800
3
266.7
C
Within groups (error)
1200
36
33.3
Total
A
某大型臨床試驗邀集3 家醫學中心同時進行個案的收案與治療介入的評估,試驗結
束分析資料後發現:3 家醫學中心的研究結果都顯示Treatment A 的治癒率比
Treatment B 高,但當3 家醫學中心的資料合併後,卻顯示Treatment B 的治癒率反
而比較高。有可能產生這樣的結果嗎?請說明理由。(20 分)
某研究為探討某一種史塔汀類(statin)藥物其降低膽固醇的作用,所收集到的資料
整理如下:
1y 、
2
y
s
s
分別表示為沒服用該藥物、有服用該藥物之樣本平均值,
、
分別表示為沒服用該藥物、有服用該藥物之樣本標準差,此兩組樣本之樣本數相同,
以n 表示之,兩組樣本之膽固醇數值群體分布雖可能有不同之群體平均值,但此假
設兩組樣本有相同之群體標準差,以
1
2
σ 表示之。考慮到此藥物其降低膽固醇的作用
會因人而異,所以收集n 位受試者測量其之前沒使用此藥物之膽固醇數值,以及之
後使用此藥物長達半年之膽固醇數值的成對資料。此檢定之顯著水準為0.05。
請回答下列問題:
依題意定義此研究之目標參數,寫出以此參數表示的虛無假說與對立假說。如上
所述,當
1y 、
2
y 、
、
、n、
1s
2
s
σ 之數值均為已知訊息時,這些數值是否已提供
足夠訊息來計算p-value?為什麼?當答案為否時,說明需要那些額外資訊才能計
算p-value。而當已經有足夠資訊來計算p-value 時,說明樣本數n 與p-value 之關
係,以及說明檢定力函數(power function of a test)的意義。(20 分)
當原始資料之紀錄為{
n
n
n
i
x
y
i
i
2
,...,
1
,
,...,
1
),
,
(
+
=
},其中,當
n
i
,...,
1
=
時,設定
及對應之
代表第i 位受試者沒用藥時的膽固醇數值,而當
0
=
ix
iy
n
n
i
2
,...,
1
+
=
時,
設定
及
代表第i-n 位受試者用藥時的膽固醇數值,寫出以
為反應變數及
為解釋變數之簡單線性迴歸模式,說明
的迴歸係數的意義,此簡單線性迴歸
模式是否適合用來描述此成對資料以回答此研究問題「某種史塔汀類藥物是否有
降低膽固醇的作用」?請說明統計理由。(10 分)
1
=
ix
iy
iy
ix
ix
在下列ANOVA table 中,請列出a、b、c、d、e、f 的數字。(30 分)
Source
df
SS
MS
1
18,953.04
c
1
7,010.03
d
⎪⎩
⎪⎨
⎧
)
X
,
X
/
(X
)
/X
(X
)
(X
Regression
3
1
2
1
3
1
1
10.93
e
Residual
a
b
f
Total
24
28,222.23