流行病學與生物統計學研究考古題

資料由法律人 LawPlayer整理提供·橫跨多種國考 / 法律人 LawPlayer 編輯整理

流行病學與生物統計學研究考古題｜歷屆國考試題彙整

橫跨多種國家考試的流行病學與生物統計學研究歷屆試題（選擇題 + 申論題）

年份：

衛生行政 50 題

一個病例對照研究發現：曾使用口服避孕藥且近期有搭機史的女性罹患靜脈血管栓塞（病例組）風險顯著增加，根據下表研究數據，作者作以下2 點主張：曾使用口服避孕藥與近期有搭機史兩項因素對於靜脈血管栓塞風險具有交互作用；以及：由於該研究所納入曾使用口服避孕藥且近期有搭機史的對照組人數很少，因此需要謹慎解讀這一發現。請分別針對以上這兩點，回答您是否同意作者的主張，並請分別說明您的理由。（25 分）近期搭機史曾使用口服避孕藥病例組人數對照組人數勝算比 95%信賴區間否否 54 94 1.0 參考組否是 95 48 3.5 2.1～5.8 是否 4 5 1.4 0.3～6.8* 是是 20

17.4 3.9～157.0* *精確估計二、加拿大有一個以醫院為基礎的病例對照研究（hospital-based case-control study）調查了冬季早晨剷雪（該研究所關注的危險因子）與發生急性心肌梗塞之間的相關性。病例組個案（cases）是在合作醫院的急診室上午時間收案的急性心肌梗塞急診病人，而病例組的鄰居（當天並沒有發生急性心肌梗塞）則被邀請擔任對照個案（controls）。研究者蒐集病例組與對照組個案當天早晨是否有出門進行剷雪，同時也蒐集了社會人口學、生活型態行為、及共病等與心肌梗塞相關的因素進行控制。請評論與這個流行病學研究主要的偏差來源，以及這些主要偏差會高估或低估冬季早晨剷雪與發生急性心肌梗塞之間的相關性。（25 分）

在利用複迴歸模式進行相關性分析中，有時候會有所謂共線性（collinearity）的問題，請解釋共線性的意思；以及複迴歸模式如果出現共線性現象，將會如何影響迴歸分析的結果。（25 分）

假設吸菸（以X1 表示）與喝酒（以X2 表示）對收縮壓（以Y 表示）具有顯著的交互作用。對於吸菸者來說，有喝酒習慣者比沒有喝酒習慣者平均收縮壓高出20 mmHg；但對於沒有吸菸習慣者，有喝酒習慣者比沒有喝酒習慣者平均收縮壓則只有高出10 mmHg。請利用上述訊息將X1、 X2 與Y 三者的關係利用一個一般線性迴歸方程式表示出來，方程式的截距項與迴歸係數如果能以數值方式呈現，則需用數值呈現，若無法用數值呈現，可以使用符號呈現。（25 分）

何謂巢式病例對照研究法（nested case-control study）？此研究設計與一般的病例對照研究設計相比，有何優點？（25 分）

某病例對照研究調查飲酒習慣與口腔癌之關聯性，調查結果如下表。試問： 計算飲酒習慣引起口腔癌的粗危險對比值（crude odds ratio）。（5 分） 在此研究中，性別變數是否為干擾因子（confounder），理由為何？（10 分） 在此研究中，性別是否為修飾因子（effect modifier），理由為何？（10 分）男性女性飲酒習慣病例對照病例對照是 300 150 50 50 否 50 50 75 150

某醫院將年齡相近的30 名男性肥胖患者隨機分成3 組，每組各10 人，每組施以不同的減重方式，1 個月後，測量其體重之改變情形，各組體重減輕的結果如下表（單位：公斤）。試問，3 種不同的減重方式對體重減輕的效果是否有統計上的差異？（α = 0.05）（25 分） F0.95,2,27 = 3.35、F0.975,2,27 = 4.24、F0.95,3,27 = 2.96、F0.975,3,27 = 3.65、 F0.95,2,30 = 3.32、F0.975,2,30 = 4.18、F0.95,3,30 = 2.92、F0.975,3,30 = 3.59 組別平均值標準差僅控制飲食 1.8 0.8 僅增加運動量 2.7 1.5 控制飲食和增加運動量並行 4.9 1.6

某醫師要求7 名飯前空腹血糖稍高的民眾進行為期半年的血糖控制計畫，在進行控制計畫前及進行控制計畫後，分別測量這些民眾的飯前空腹血糖值（單位：mg/dL），結果如下表。試問，該醫師的血糖控制計畫是否能降低飯前空腹血糖？（α = 0.05）（25 分） 0.95,6 1.94 t  、0.975,6 2.45 t  、0.95,7 1.89 t  、0.975,7 2.36 t  編號 1 2 3 4

進行控制計畫前 106 112 103 118 134 126 120 進行控制計畫後 97 93 85 100 101 97 99

某研究團隊擬進行一個病例對照研究以探討紅肉攝取與大腸癌間的關係，試述該團隊應如何設計此研究？並說明此病例對照研究設計可能產生的偏差為何？（25 分）

請以新冠肺炎（COVID-19）為例，試述何謂群體免疫、基本再生數、有效再生數？並說明這些因素如何影響新冠肺炎的流行狀況？（25 分）

某研究人員欲評估吸菸與腎細胞癌的相關性，採用病例對照研究設計，收集125 名腎細胞癌病患及252 名對照組，結果如下表。請以適當統計檢定方法檢定吸菸與腎細胞癌是否有統計顯著相關？並計算兩組吸菸率差異的百分之九十五信賴區間。設第一型誤差為0.05。（25 分）有無吸菸腎細胞癌組對照組無 41 137 有 84 115 （Z0.975 = 1.960；Z0.95 = 1.645；21,0.95 = 3.84：21,0.975 = 5.02）

某研究欲評估肥胖與尿酸值間的相關性，該研究收集258 名個案，測量其身高、體重及尿酸值，並計算身體質量指數，再依身體質量指數分成小於27 與大於等於27 兩組，以比較兩組間的尿酸平均值的差異，得到下列結果。請以適當統計檢定方法檢定這兩組之尿酸值平均值是否有統計顯著差異？設第一型誤差為0.05。（25 分）組別人數尿酸值平均值尿酸值標準差身體質量指數小於27 99 6.7 1.7 身體質量指數大於等於27 159 7.5 2.0 （t256, 0.90 = 1.651；t256, 0.95 = 1.969；t256, 0.975 = 2.255；t256, 0.99 = 2.595）

某多中心研究（multi-center study）探討孕婦在孕期使用抗憂鬱藥物與妊娠糖尿病之相關性。該研究蒐集2017-2019三年間共20,905名罹患妊娠糖尿病婦女為病例組；針對每1名病例組個案，研究者選擇10名無妊娠糖尿病診斷的孕婦為對照組，並以年齡與妊娠時間（受孕日至妊娠糖尿病診斷日的時間）2個變項進行匹配。研究結果如下表：病例組對照組妊娠期間使用抗憂鬱藥物是 1,152（5.5%） 8,589（4.1%）否 19,753（94.5%）200,461（95.9%）合計 20,905 209,050 請說明研究者為何選擇「妊娠時間」作為匹配變項？（10分） 妊娠期間使用抗憂鬱藥物與妊娠糖尿病之粗勝算比（Odds ratio）為 1.36，95%信賴區間為（1.28 to X），請計算X 的數值為何？（10分）

某橫斷性研究（cross-sectional study）隨機針對200位沒有吃早餐習慣的樣本調查，另外隨機選擇有吃早餐習慣的200位為對照組，探討不吃早餐與體重過重（身體質量指數高於正常值）之間的相關性。根據該研究數據（如下表所示），請計算沒有吃早餐習慣與體重過重間之相對危險性，並闡釋該相對危險性的意義。此外，請說明「性別」是否扮演干擾因子（confounder）或效果修飾因子（effect-modifier）的角色。（20分）男性女性合計固定吃早餐習慣體重過重體重過重體重過重是否是否是否是 68 48 17 67 85 115 否 54 30 36 80 90 110

某乳癌研究共收集150名個案之乳房攝影資料，由A、B 兩位放射科醫師進行判讀，結果如下表所示。為了評估兩位放射科醫師判讀是否具有一致性，請問您會使用何種統計方法進行檢定？並請在= 0.05的顯著水準下進行您所選定的檢定方法（設= 0.05），並根據檢定結果說明在本題中兩位放射科醫師之判讀結果是否具有一致性？（= 0.05，自由度= 1時， 2之臨界值為3.84；= 0.025，自由度= 1時，2之臨界值為5.02）（20分） B醫師 A醫師陽性陰性合計陽性 30 30 60 陰性 60 30 90 合計 90 60 150

某研究探討喝含糖飲品與血糖的相關性，研究者將對象按喝含糖飲品區分為若干組，然後比較各組樣本血糖平均值之差異，研究者得到下表之結果，請問本研究的總樣本數為何？血糖的總變異量（也就是A）為何？統計檢定量F 的數值（也就是C）為何？並請說明表中所顯示之統計檢定時需要何種假設？（20分） Source of variation Sums of squares df Mean squares F Among groups 800 3 266.7 C Within groups (error) 1200 36 33.3 Total A

下表數據為一世代研究探討暴露X 與疾病Y 相關性之研究結果。研究結束後研究者被告知他所使用診斷疾病Y 的工具其敏感度（sensitivity）與精確度僅約0.8（無論暴露狀況），意即該研究者現在所得到數據（如下表所示）極可能是受到測量誤差所致。請計算校正敏感度與特異度後之相對危險性，意即，沒有診斷誤差情況下之相對危險性。此外，若用此診斷工具在一個疾病Y 盛行率為20%的族群中進行疾病診斷，請計算一名暴露X 者會被診斷出疾病Y 的機率為何？（20分）疾病Y 非疾病Y 合計暴露X 55 45 100 非暴露X 40 60 100 合計 95 105 200

試述何謂年齡－年代－世代分析（age-period-cohort analysis）？何謂年齡效應（age effect）？何謂年代效應（period effect）？何謂出生世代效應（birth-cohort effect）？（25 分）

試述敏感度（sensitivity）之定義為何？特異度（specificity）之定義為何？如何製作ROC 曲線（receiver operating characteristic curve）？ROC 曲線下之面積（area under curve, AUC）有何用途？（25 分）

請分別舉例論述下列各統計檢定方法的適用情境：配對t 檢定（paired t test）、ANOVA（analysis of variance）、McNemar 檢定、卡方檢定（chi-square test）、費雪確切檢定（Fisher exact test）。（25 分）

進行迴歸分析（regression analysis ）時，常會利用交叉相乘項（cross-product term）。何謂交叉相乘項？交叉相乘項所對應的迴歸係數（regression coefficient），其值若統計顯著性的不等於0，代表什麼意義？其值若統計顯著性的大於0，代表什麼意義？其值若統計顯著性的小於0，又代表什麼意義？（25 分）

請說明疾病篩檢（screening）的目的為何？（5 分） 請說明length bias 與lead time bias 分別對疾病篩檢的成效有何影響？（10 分）

請定義何謂選樣偏差（selection bias）？（5 分） 請依流行病學之病例對照研究（case-control study）、世代研究（cohort study）及臨床試驗（clinical trial）之研究設計，說明在何種狀況下會產生選樣偏差？（10 分）

某追蹤研究探討C 型肝炎病毒感染（hepatitis C virus infection, HCV infection）與抽菸（cigarette smoking）對肝癌（hepatocellular carcinoma, HCC）的危險性，其研究結果如下表： Non smoker Smoker HCV infection Controls HCC cases Controls HCC cases No 1800 150 450 60 Yes 90 15 80 30 假設此研究對象所來自的族群之C 型肝炎病毒感染盛行率為15%，請問族群可歸因危險性（population attributable risk, AR% population）為何？（5 分） 假設研究者有興趣的危險因子為C 型肝炎病毒感染，請分別進行資料分析，以數據解釋抽菸對C 型肝炎病毒感染與肝癌的相關性中，抽菸所扮演的角色為干擾因子（confounder）還是修飾因子（effect modifier）？若為修飾因子，請利用相加（additive）與相乘（multiplicative）模式分別計算與說明抽菸與C 型肝炎病毒感染對肝癌之交互作用（interaction）為何？（15 分）

某研究探討50 歲以上居民膽固醇（cholesterol）含量（Y）與收縮壓（systolic blood pressure）（X）是否有相關性？經檢定後結果如下表： Variable Parameter(β) Standard error of parameter, SE(β) t value Intercept 154.96 11.19 13.85 Systolic blood pressure （） 0.088 （） ΣX=49226，ΣY=74755，X =125.58，Y =190.70，ΣXY=9427600， Sx =18.99，Sy =33.33，N=392，ΣX2 = 6322616 請問膽固醇含量（Y）與收縮壓（X）的相關性之方程式為何？並請完成上表。（10 分） 請利用迴歸係數（regression coefficient）之區間估計（confidence interval）檢定膽固醇含量（Y）與收縮壓（X）是否有顯著相關？（10 分） 105年公務人員高等考試一級暨二級考試試題代號：21150 全一張（背面）等別：高考二級類科：衛生行政（一般組）科目：流行病學與生物統計學研究

研究者想了解以身體質量指數（body mass index, BMI）分成過輕、正常與過重三組人的血液胰島素（Insulin）含量是否有顯著差異進行檢定。BMI 過輕有42 人，胰島素含量平均值為4.975，標準差為2.858。BMI 正常有89 人，胰島素含量平均值為 9.157，標準差為5.99。BMI 過重有141 人，胰島素含量平均值為16.35，標準差為 12.235，經檢定後之變異數分析表如下表：項目平方和自由度均方和 F 值組間（）（） 2723.98 （）組內（）（）（）總和 29897.65 271 F1, 269,α=1%=6.63，F2, 269,α=1%=4.60，F3, 269,α=1%=3.78 請寫出統計檢定的虛無假說與對立假說及完成上表，並請利用統計檢定結果說明身體質量指數不同，血液胰島素含量是否有顯著差異。（10 分）

multiple liner regression、unconditional multiple logistic regression、conditional multiple logistic regression 和Cox's proportional hazards regression model 為常用的四種多變項迴歸分析模式。 請以「在何種研究設計或資料型態」、「估計何種流行病學指標為目的的狀況下使用」，分別說明利用此四種迴歸模式分析之適用時機，並請說明此四種迴歸模式之迴歸係數所代表的意義。（15 分） 請問如果使用這四種迴歸模式，該如何進行分析兩個自變項間對依變項的交互作用？（5 分）

危險因子暴露狀況的分組錯誤，是一種資訊偏差的來源，請說明在病例對照研究時，發生暴露分組錯誤的可能理由？（25 分）

請比較回溯性研究（Retrospective study）和追蹤性研究（Prospective study）之優缺點。（25 分）

某研究者以病例對照研究法（case-control study）獲得下列吸菸與肺癌之關係。試計算吸菸與不吸菸者罹患肺癌之相對危險性並以統計檢定方法檢定吸菸與肺癌是否有統計相關？（ 0.05 α = ）（ 84 .3 2 1, 95 .0 = X ）（25 分）吸菸習慣肺癌患者對照組合計吸菸者 499 462 961 不吸菸者 19 56 75 合計 518 518 1036

隨機抽取某長期照護機構100 名住院患者，將其住進機構的時間分為1 年、2 年、3 年、和3 年以上四組，並測量患者血鉀濃度，以探討各組血鉀濃度的平均值是否有差異。測量結果如下。請問住進機構的時間長短是否與血鉀濃度有關？ 70 .2 ) 95 .0, 96 ,3 ( = F （25 分）進入時間 1 年 2 年 3 年 3 年以上個案數 11 30 26 33 平均值（X ） 4.064 4.103 4.177 4.942 標準差（S） 0.72 0.924 0.871 1.182

進行介入性研究時，研究者通常都會讓樣本數平均分派至實驗組與對照組中，請您說明研究者要使實驗組與對照組之樣本數相同的做法，其目的為何？（20 分）

某研究調查100 個住家樣本為了防治病媒所進行之噴藥面積發現：平均噴藥面積為 249 平方英呎，標準差為39.82 英呎。根據這些資料，研究者計算了該地區所有住家平均噴藥面積之95%信賴區間（μ）為241.1-256.9 平方英呎。研究者的結論報告表示：該地區有95%的住家其噴藥面積介於241.1-256.9 平方英呎之間。請問您同意此結論嗎?如果不同意，請說明理由。（20 分）

某病例對照研究探討老人多重用藥與髖部骨折發生風險間之相關性，其中Table 2 的數據如下表所示。此表數據顯示：無論男生與女生樣本，用藥種類愈多者，其發生髖部骨折的勝算比（OR）就愈高。請問此數據可以用來說明「多重用藥」與「性別」之間具有交互作用（interaction）嗎？請說明理由。（20 分）

健康成年人標準紅血球含量為15 g/100ml，標準差σ＝2 g/100ml，某研究分析49 名從事鉛蓄電池製造工人的血液檢體發現其紅血球的平均值為13.5 g/100ml，請在 α＝0.05 的顯著水準下，檢定此數據是否表示「鉛蓄電池」製造工人的平均紅血球濃度低於健康成年人標準紅血球濃度？（p(z>1.96)＝0.025；p(z>1.645)＝0.05）（20 分）

某大型臨床試驗邀集3 家醫學中心同時進行個案的收案與治療介入的評估，試驗結束分析資料後發現：3 家醫學中心的研究結果都顯示Treatment A 的治癒率比 Treatment B 高，但當3 家醫學中心的資料合併後，卻顯示Treatment B 的治癒率反而比較高。有可能產生這樣的結果嗎？請說明理由。（20 分）

請定義何謂柏克森偏差（Berkson’s Bias）？並舉例說明，以此例論述此誤差對結果的影響。（20 分）

最近有一研究探討有和沒有糖尿病的心肌梗塞病人接受保栓通（clopidogrel）治療和全死因的相關，此研究從2002-2009 年住院檔中找出58,851 位發生心肌梗塞存活且沒有接受心導管手術的病人，假如此國家中有糖尿病的心肌梗塞病人接受保栓通治療的盛行率為50%，而沒有糖尿病的心肌梗塞病人接受保栓通治療的盛行率為 30%，下列表格為依照糖尿病狀態呈現接受或沒接受保栓通治療之心肌梗塞患者，其死亡人數、人年、粗發生率和調整風險比（Adjusted Hazard Ratio, HR）。 Diabetes (N=7247) No Diabetes (N=51604) Clopidogrel (N=4078) No Clopidogrel (N=3169) Clopidogrel (N=31302) No Clopidogrel (N=20302) All-cause mortality Events/total, No. (%) 472/4078 (12) 753/3169 (24) 1816/31302 (6) 3661/20302 (18) Person-years 3518 2566 28183 17156 Crude incidence rates 13.4 (12.8-14.0) 29.3 (28.3-30.4) 6.4 (6.3-6.6) 21.3 (21.0-21.7) Adjusted HR (95%CI) 0.89 (0.79-1.00) 1.00 0.75 (0.70-0.80) 1.00 P for Interaction 0.001 CI: confidence interval; HR: hazard ratio 根據表格粗發生率（crude incidence rates），以糖尿病狀態分層，計算接受保栓通治療的全死因相差危險性（risk difference）、需要被治療的病人數目（number needed to treat）和族群可歸因危險性（population attributable risk），並解釋結果。（10 分） 根據表格粗發生率，以糖尿病狀態分層，計算接受保栓通治療的全死因相對危險性（relative risk），並解釋結果。（10 分） 研究者進一步調整了傳統的危險因子後，得到上面表格中的調整風險比，試討論糖尿病所扮演的角色為干擾因子？還是交互作用（effect modifier）？（5 分） 根據表格結果，身為一位流行病學家，如何報導和解釋此研究結果？（5 分） 101年公務人員高等考試一級暨二級考試試題類科：衛生行政（一般組）（請接第三頁）全三頁第二頁

(12)

(24)

(6)

(18) 10 分

某研究為探討某一種史塔汀類（statin）藥物其降低膽固醇的作用，所收集到的資料整理如下： 1y 、 2 y s s 分別表示為沒服用該藥物、有服用該藥物之樣本平均值，、分別表示為沒服用該藥物、有服用該藥物之樣本標準差，此兩組樣本之樣本數相同，以n 表示之，兩組樣本之膽固醇數值群體分布雖可能有不同之群體平均值，但此假設兩組樣本有相同之群體標準差，以 1 2 σ 表示之。考慮到此藥物其降低膽固醇的作用會因人而異，所以收集n 位受試者測量其之前沒使用此藥物之膽固醇數值，以及之後使用此藥物長達半年之膽固醇數值的成對資料。此檢定之顯著水準為0.05。請回答下列問題： 依題意定義此研究之目標參數，寫出以此參數表示的虛無假說與對立假說。如上所述，當 1y 、 2 y 、、、n、 1s 2 s σ 之數值均為已知訊息時，這些數值是否已提供足夠訊息來計算p-value？為什麼？當答案為否時，說明需要那些額外資訊才能計算p-value。而當已經有足夠資訊來計算p-value 時，說明樣本數n 與p-value 之關係，以及說明檢定力函數（power function of a test）的意義。（20 分） 當原始資料之紀錄為{ n n n i x y i i 2 ,..., 1 , ,..., 1 ), , ( + = }，其中，當 n i ,..., 1 = 時，設定及對應之代表第i 位受試者沒用藥時的膽固醇數值，而當 0 = ix iy n n i 2 ,..., 1 + = 時，設定及代表第i-n 位受試者用藥時的膽固醇數值，寫出以為反應變數及為解釋變數之簡單線性迴歸模式，說明的迴歸係數的意義，此簡單線性迴歸模式是否適合用來描述此成對資料以回答此研究問題「某種史塔汀類藥物是否有降低膽固醇的作用」？請說明統計理由。（10 分） 1 = ix iy iy ix ix

探討停經後婦女罹患乳癌是否與其生第一胎之年齡有關，從某社區停經婦女罹患乳癌（Y=1）中隨機選取50 位，其中有15 位其生第一胎之年齡在30 歲以前，同時從同一社區停經且沒有乳癌之婦女（Y=0）隨機選取50 位，其中有35 位其生第一胎之年齡在30 歲以前。在此，以X=0 表示生第一胎之年齡在30 歲以前，X=1 則表示生第一胎之年齡在30 歲以後。請回答以下問題： 將上述資料整理成一個2×2 列聯表，寫出依題意與符號所對應之勝算比（Odds Ratio, 簡稱OR）的意義，說明為何OR 可以用來測量停經後婦女罹患乳癌與否與其生第一胎之年齡之相關性。計算此OR 的近似95%信賴區間。當檢定停經後婦女罹患乳癌是否與其生第一胎之年齡有關之顯著水準設為0.05 時，說明如何以此信賴區間來判斷檢定結果。（15 分） 若想要進一步推算出在30 歲以後生第一胎之停經婦女組有乳癌的機率比在30 歲以前生第一胎之停經婦女組有乳癌的機率的比值（稱為相對風險比值，Relative Risk，簡稱RR），除上述資料外，還需要提供何種資訊才可以估算出RR 的數值？說明統計原因。（5 分） 101年公務人員高等考試一級暨二級考試試題類科：衛生行政（一般組）（請接第三頁）全三頁第三頁附表 Z 分布 975 .0 ) 96 .1 Pr( = ≤ Z ； 95 .0 ) 64 .1 Pr( = ≤ Z ； 90 .0 ) 28 .1 Pr( = ≤ Z t 分布 95 .0 ) 895 .1 Pr( 7 = ≤ t df 7 8 9 15 22 23 24 30 40 95 .0t 1.895 1.860 1.833 1.753 1.717 1.714 1.711 1.697 1.684 975 .0t 2.365 2.306 2.262 2.131 2.074 2.069 2.064 2.042 2.021 2 χ 分布 95 .0 ) 84 .3 Pr( 2 1 = ≤ χ F 分布 95 .0 ) 59 .5 Pr( 7,1 = ≤ F df 1 2 3 10 20 2 1,df df 1,7 2,7 1,16 2,16 2 95 .0 χ 3.84 5.99 7.81 18.31 31.41 95 .0 F 5.59 4.74 4.49 3.63 2 975 .0 χ 5.02 7.38 9.35 20.48 34.17 975 .0 F 8.07 6.54 6.12 4.69

在急性傳染病中，通常用什麼指標來形容嚴重程度？試申論之。（25 分）

何謂nested case-control study？試申論之。（25 分）

在下列ANOVA table 中，請列出a、b、c、d、e、f 的數字。（30 分） Source df SS MS 1 18,953.04 c 1 7,010.03 d ⎪⎩ ⎪⎨ ⎧ ) X , X / (X ) /X (X ) (X Regression 3 1 2 1 3 1 1 10.93 e Residual a b f Total 24 28,222.23

在假說考驗中，何謂Type I error？何謂power？試申論之。（20 分）

干擾（confounding）經常是造成相關性研究其結果產生偏差的主要原因之一，流行病學研究人員經常會在研究設計階段利用一些方法設法避免「干擾」的產生，請簡要說明這些方法，並分別說明各方法在使用上的限制。（20 分）

有兩種測量血糖的工具A 與B，其中A 工具比較便宜而且方便使用，但B 工具則是普遍被認為具有不錯效度的工具。為了評估A 工具的效度，某研究針對200 人的血液樣本同時以A 工具與B 工具進行血糖的測量，並進行數據之相關分析，結果發現Pearson’s correlation coefficient 為0.95，此數據可否說明A 工具也有不錯的效度？請敘述你的理由。（15 分）

某衛生單位想估計社區內65 歲以上老人的失能盛行率，衛生單位內有人認為應該採取簡單隨機抽樣的方式選取樣本，但另外有人則是應該先將社區內老人族群按年齡與性別分層，再於各分層中採取簡單隨機抽樣。你認為相較於簡單隨機抽樣，採取分層隨機抽樣有那些優點？（15 分）

某研究探討不吃早餐與出現上午疲憊症（midmorning fatigue）間之相關性，該研究分別從經常不吃早餐與規律吃早餐的族群中各隨機選出200 人，並獲得以下的調查數據：出現上午疲憊症是否合計經常不吃早餐 90 110 200 規律吃早餐 85 115 200 根據此數據，請計算經常不吃早餐者出現上午疲憊症的勝算比（odds ratio）。（5 分）當研究者進一步將研究數據按性別加以分層分析後，得到以下數據：男性女性出現上午疲憊症出現上午疲憊症是否是否經常不吃早餐 54 30 36 80 規律吃早餐 68 48 17 67 綜合上述資料，你認為不吃早餐與出現上午疲憊症之間的相關性為何？請敘述你的理由。（15 分） 96 年公務人員、關務人員升官等考試試題代號：類科：衛生行政、醫務管理全一張（背面） 13130 13230

某研究者將其研究結果投稿到某醫學期刊，審查委員在其審查意見中指出：「該研究使用配對t 檢定並不正確，因為族群中血壓的分布可能不呈現常態分布」。你同意該審查委員的意見嗎？請說明你的理由。（15 分）六、假設性別（以X1 表示）與某生理變項（以Y 表示）具有顯著的交互作用，男性樣本當年齡（以X2 表示）每增加10 歲時，該變項的平均值則是會增加0.3 個單位，而女性樣本年齡每增加5 歲時，該變項的平均值則是會增加0.3 個單位。請將上述訊息利用一個線性迴歸模式表示出來。（15 分）

本頁資料來源：考選部歷屆試題·整理提供：法律人 LawPlayer· lawplayer.com