lawpalyer logo

生物統計學考古題|歷屆國考試題彙整

橫跨多種國家考試的生物統計學歷屆試題(選擇題 + 申論題)

年份:

衛生行政 85 題

某學者調查英國某地區100 位罹患霍亂的居民,以及336 位未罹患霍亂 的居民的飲用水狀況,結果如下表,試問: 罹患霍亂者 未罹患霍亂者 飲用地下水 80 57 飲用自來水 20 279 罹患霍亂者與未罹患霍亂者飲用地下水的比例是否有差異?( 0.05  ) (10 分) 罹患霍亂者與未罹患霍亂者飲用地下水比例差異的95%信賴區間為 何?(10 分) 由所求得之信賴區間,是否可以判斷飲用水種類與罹患霍亂有關? 請說明理由。(5 分)
以隨機分派方式,給予60 位高血壓病人服用A、B 兩種降血壓藥其中一 種,所得結果如下表: 樣本數 服用前後血壓改變 之平均數 服用前後血壓改變 之標準差 服用A 藥物 30 6.07 11.60 服用B 藥物 30 10.63 10.05 試問A、B 兩種藥物對降血壓之效果是否有差異?(假設兩組母群體 血壓改變值之變異數相等)( 0.05  )(10 分) 服用A、B 兩種藥物後,血壓改變值平均數差異之95%信賴區間為何? (10 分) 依據所算得95%信賴區間,是否可以判斷A、B 兩種降血壓藥物之 降血壓效果具有統計差異?並請說明理由。(5 分) 16730 16830
根據某一族群的橫斷性研究(cross-sectional study),獲得以下吸菸與肺 癌之資料,試推論吸菸與肺癌是否有關聯性? 0.05  ( )(25 分) 有肺癌 無肺癌 合計 吸菸 20 80 100 無吸菸 10 390 400 合計 30 470 500
在罹患糖尿病的血液透析患者中隨機挑選15 名患者進行飲食改善介入 試驗,在飲食改善前後,白蛋白濃度差異(試驗前試驗後)之平均值為 -0.26,標準差為0.57,試問: 飲食改善介入前後,白蛋白濃度差異之平均值是否有統計上顯著差 異?(15 分) 飲食改善介入前後,白蛋白濃度差異之平均值的95%信賴區間為何? (10 分)
某研究人員欲評估有無吸菸與第一秒用力呼氣量(FEV1)的相關性,以 肺功能量計測量340名個案的第一秒用力呼氣量,並依其有無吸菸分成兩 組,以比較吸菸組與非吸菸組間的第一秒用力呼氣量平均值的差異,得到 下列結果: 組別 人數 第一秒用力呼氣量 平均值(公升) 第一秒用力呼氣量 標準差(公升) 非吸菸組 116 2.92 0.71 吸菸組 224 3.30 0.68 請計算吸菸組之第一秒用力呼氣量平均值的百分之九十五信賴區間。 (5分) 請檢定兩組第一秒用力呼氣量之母群體平均值的差異是否有統計顯著 性?並列出虛無假說及對立假說,設顯著水準=0.05。(20分)
最近臨床感興趣的議題是使用新開發藥物減少24 小時內發生心肌梗塞 患者的梗塞面積。假設我們知道在未經治療的患者中,平均梗塞面積為 25(ck-g-EQ/m2),標準差為10(ck-g-EQ/m2)。在8 名接受此新開發藥物治 療的患者中,平均梗塞面積為16(ck-g-EQ/m2)。 請問此新開發藥物對減少梗塞面積有顯著減少嗎?請以單尾檢定進 行分析,並報告p 值。(10 分) 如果接受此新開發藥物治療的族群患者真實的平均梗塞面積為 20(ck-g-EQ/m2),且=10(ck-g-EQ/m2),請以單尾檢定計算此檢定的 檢力(power)。(15 分) (備註:P(Z0.23)=0.409 ,P(Z1.645)=0.05 ,P(Z1.96)=0.025 , P(Z2.55)=0.005)
某臨床試驗招募第一型糖尿病人進行衛教介入的研究,評估利用手機訊 息衛教(mHealth)是否可以顯著降低第一型糖尿病人低血糖感知障礙 (Impaired Awareness of Hypoglycemia, IAH)?IAH 是一個類別變項, 區分為「是」與「否」。研究者將採用假說檢定(hypothesis testing)進行 後續的分析比較,而在研究準備的階段,該臨床試驗研究人員需要計算 介入組與對照組分別所需要的樣本人數,請說明計算該研究樣本數時需 要考慮那一些參數?(25 分)
某流行病學家欲研究有無肥胖與脂肪肝嚴重程度的關係,自某醫院收集 430名個案,得到下列結果: 肥胖情形 無脂肪肝組 (n=158) 輕度脂肪肝組 (n=180) 中度脂肪肝組 (n=92) 無 142 145 47 有 16 35 45 請以統計檢定方法檢定有無肥胖與脂肪肝嚴重程度間是否有統計顯著 相關?並列出虛無假說及對立假說,設顯著水準=0.05。(15分) 請計算中度脂肪肝組與無脂肪肝組兩組間肥胖比率的差異的百分之九 十五信賴區間。(10分) 35080、36480
假設有藥商宣稱其新產品的藥物在治療高血壓的有效率為80%,今實際 試驗500 位高血壓患者,結果有375 位高血壓患者在服用後血壓控制為 正常,若欲檢測實際的試驗結果是否與藥商所宣稱的效果相符合,請進 行檢定。(20 分) (備註:ݔ଴.଴ଶହ,ଵ ଶ = 5.02,ݔ଴.଴ଶହ,ଶ ଶ = 7.38,ݔ଴.଴ଶହ,ଷ ଶ = 9.35,ݔ଴.଴ହ,ଵ ଶ = 3.84, ݔ଴.଴ହ,ଶ ଶ = 5.99,ݔ଴.଴ହ,ଷ ଶ = 7.81)
某研究探討Donepezil 藥物對於預防失智症惡化的效果,其結果數據如 下表。如果以A 與B 分別代表「使用Donepezil」與「失智症惡化」兩 個事件;Pr(A)與Pr(B)分別代表「使用Donepezil」與「失智症惡 化」事件的機率。請利用機率運算的加法(Addition rule of probability) 與乘法(Multiplication rule of probability)原則,分別說明「使用Donepezil」 與「失智症惡化」是否為互斥(mutually exclusive)事件?以及是否為獨 立(independent)事件?(25 分) 使用Donepezil 失智症惡化 是 否 是 10 32 否 240 218
2010 年一個針對100 名12-18 歲青少年所做的社區調查發現:青少年吸 菸盛行率為6%。2020 年針對同一社區進行相同目的之調查,但這次的 調查將樣本數由100 人增加至200 人,發現青少年吸菸盛行率約為8%。 在α=0.05 水準下,請檢定該社區2020 年的青少年吸菸盛行率是否有顯 著上升?〔註:Pr.(z > 1.96)= 0.025;Pr.(z > 1.645)= 0.05;檢定過程請詳 列檢定之假設、計算統計量、p-value 數值範圍、以及統計決策與結論〕 (25 分) 16730
有一臨床試驗評估補充鈣(calcium)與骨化三醇(calcitriol)治停經後骨 質疏鬆症的相對療效。骨化三醇是一種能夠增加胃腸道對鈣吸收的藥 物。由於治療的不良反應,包括口渴、皮膚問題和神經系統症狀,許多 患者提早退出了這項研究。相關數據如下。 治療方式 退出試驗 總計 是 否 骨化三醇 27 287 314 補充鈣 20 288 308 總計 47 575 622 計算每種治療組中退出研究的受試者樣本比例。(5 分) 在0.05 的顯著性水準下,檢驗虛無假設,即治療組與退出研究之間沒 有關聯。得出什麼結論?(10 分) 請計算並解釋OR 和其95%信賴區間。(10 分) (備註:ݔ଴.଴ଶହ,ଵ ଶ = 5.02,ݔ଴.଴ଶହ,ଶ ଶ = 7.38,ݔ଴.଴ଶହ,ଷ ଶ = 9.35,ݔ଴.଴ହ,ଵ ଶ = 3.84, ݔ଴.଴ହ,ଶ ଶ = 5.99,ݔ଴.଴ହ,ଷ ଶ = 7.81)
某社區醫學研究團隊欲探討吸菸情形與高密度脂蛋白膽固醇的相關性, 該研究團隊收集575名個案,抽血檢測其高密度脂蛋白膽固醇,並依其吸 菸情形分成:現在吸菸組、過去吸菸組、從未吸菸組三組,以比較三組間 的高密度脂蛋白膽固醇平均值的差異,得到下列結果: 組別 人數 高密度脂蛋白膽固醇平均值 (毫克/分升) 標準差 現在吸菸組 277 44.5 11.1 過去吸菸組 150 46.2 13.6 從未吸菸組 148 50.8 12.9 請檢定三組間的高密度脂蛋白膽固醇平均值的差異是否有統計上顯著不同? 並請列出虛無假說及對立假說(設顯著水準=0.05, 2,100,0.975 3.83 F = , 21000 0.975 3.70 F , , = )。(25分)
假設患有某碳水化合物吸收不良症候群的嬰兒被餵食新配方奶粉後,其 增加體重的分布大致呈常態分布,平均磅數為 10.5  和標準差磅數為 13.1  。 有多少百分比嬰兒增加體重介在5.1 到15.2 磅之間?(10 分) 如果從該母群體中重複抽取樣本數25 的樣本,則平均增重在5.1 到 15.2 磅之間的樣本比例是多少?(10 分) 要使95%的樣本增加體重均值位於母群體增加體重均值的2 磅以內, 樣本必須要多大?(即介於10.5-2 和10.5+2 磅之間)(10 分) (備註:P(Z≥0.41)=0.341,P(Z≥0.36)=0.359,P(Z≥1.64)=0.051, P(Z≥1.79)=0.037,P(Z≥1.96)=0.025,P(Z≥2.06)=0.020)
下表是位於非洲撒哈拉沙漠以南17 個國家生育率(y)與避孕率(x)的 描述性統計數據。 生育率(/1,000)(y) 避孕率(%)(x) 算數平均數 6.50 13.50 根據17 個國家的原始避孕率與生育率數據所計算出來的迴歸方程式為: 0 7.445 y x     。顯著性檢定的結果如下表所示: Sum of Squares df Mean Square F Sig. Regression 548.875 1 548.875 4.228 0.058 Residual 1947.360 15 129.824 Total 2496.235 16 請計算迴歸方程式的截距項 0 ,以及避孕率與生育率之皮爾森相關係數 (Pearson’s correlation coefficient)。(25 分)
某研究人員想要評估尿酸(mg/dL)與血清肌酸酐(mg/dL)間的關係, 於某健康管理中心收集415名個案的資料,建立以尿酸預測血清肌酸酐的 迴歸模式,得到下列結果: 變異數分析表 變異來源 平方和 自由度 均方 F值 P值 迴歸模型 1.85 1 1.85 87.19 < 0.001 殘差 8.76 413 0.02 總和 10.61 414 請寫出此線性迴歸方程式、解釋此迴歸模式、說明此迴歸模式是否達統計 顯著性?並解釋其理由。設顯著水準=0.05。另請計算此線性迴歸模式的 決定係數,並解釋此決定係數的意義。(25分) 模式 迴歸係數 標準誤 標準化迴歸係數 t值 P值 尿酸 0.604 0.005 0.418 9.337 < 0.001 常數 0.048 0.036 - 16.728 < 0.001 35080、36480 附表 35080、36480
9 10 11 12 介入前體重(kg)88 67 54 71 75 68 95 84 64 76 61 78 介入後體重(kg)76 63 55 67 66 65 78 79 64 70 63 75 32980 34080 三、近年來,運動被視為對於高血脂預防具有相當成效的方式。某研究人員 想要知道運動頻率是否對總膽固醇濃度(mg/dl)的下降產生效果,以線 性迴歸模型加以分析200 名樣本,並且為了避免年齡、性別的干擾,因 此也將此二變項放在模式中加以控制。線性迴歸分析表格如下,請回答 下列問題: 模式 B估計值 標準誤 t 顯著性 常數 22.4 2.6 8.5 .000 年齡(歲) 2.3 1.2 1.6 .260 性別(男vs.女) 10.8 2.7 6.8 .001 運動頻率(次/週) -3.5 1.6 -3.9 .015 R2 .12 請寫出完整之迴歸方程式並說明模型解釋力。(10 分) 請問那些變項對總膽固醇濃度有顯著影響?如何解釋?(15 分) 請對此一結果做綜合性之解釋。(5 分) 四、觀察某地區空氣品質之指標PM10 持續100 天,按照濃度(µg/m³)大小 排列如下表,請回答下列問題: 51 62 64 69 70 71 72 74 74 74 74 74 75 75 77 77 78 78 79 79 79 79 79 80 80 82 82 83 83 83 83 84 84 84 84 85 85 85 85 86 86 86 86 86 86 87 88 88 89 89 90 90 90 90 91 91 91 91 92 92 93 93 93 93 94 94 95 96 96 96 96 97 98 98 98 98 98 99 99 99 99 99 100 101 102 102 104 105 107 108 108 111 112 112 113 116 118 120 122 131 平均數、中位數、眾數、Q1、Q3 各為多少?(5 分) 根據這些數值,此地區空氣品質之分布為何種型態(常態、左偏、右 偏)?(5 分) 請以10 µg/m³為區間,列出頻率分配表(需含區間端點、次數、百分 比、累積次數、累積百分比)。(10 分) 32980 34080 t 分布表 32980 34080 卡方分布表
根據2017-2020 年國人膳食營養狀況,933 位75 歲及以上長者每天 熱量攝取平均值±標準誤為1579.71±39.61 大卡。某社區75 歲及以上 長者49 位,每天熱量攝取的平均數為1560 大卡。問得到此樣本的每 天熱量攝取的平均數≤1560 大卡的機率是多少?(20 分)
一研究團隊擬在一家醫院進行低出生體重相關的研究,假定在該醫院生產 的嬰兒約有500 位,出生體重平均值為3000 公克,標準差為450 公克, 假定嬰兒出生體重接近常態分布。現從全部嬰兒中隨機抽樣16 位嬰兒, 請計算樣本的出生體重平均值 ≤ 2800 公克的機率為何?(10 分)
根據2017-2020 年國民營養健康調查,31-44 歲男性(n=36)及女性 (n=36)的血漿維生素B6 的平均值±標準差分別為:20.1±10.86 nM 及 18.6±10.02 nM。設顯著水平(α)為0.05,問31-44 歲男性及女性的 血漿維生素B6 是否有統計顯著差異?(30 分)
越來越多文獻顯示除了身體質量指數,腰圍也和死亡率與罹患心血管疾 病等慢性病有關聯。一研究團隊進行臨床試驗探討地中海飲食對腰圍 (公分)的影響,蒐集55 歲以上、有多個心血管疾病危險因子的男性病 人,分為兩組,分別接受兩種飲食指導:地中海型飲食、一般減脂飲食。 樣本數 臨床試驗開始前 (第0年)的腰圍 臨床試驗第5年和第0年 的腰圍變化 平均值 標準差 平均值 95%信賴區間 (雙尾) 地中海型飲食 16 95.2 9.5 0.37 (-0.12, 0.87) 一般減脂飲食 16 95.5 9.0 1.20 (0.68, 1.72) 假定腰圍與腰圍變化皆為常態分布,兩組的腰圍和腰圍變化之變異數相 等。請回答下列問題:(統計檢定請寫出虛無假設和對立假設、檢定統計 量和計算過程,並下結論。設顯著水準α = 0.05。) 由全國調查得知,同年齡的男性之腰圍平均為92.0 公分。相較於同年 齡的全國男性群體,地中海型飲食組的男性病人在臨床實驗開始前的 平均腰圍是否較高?(10 分) 分別計算地中海型飲食組、一般減脂飲食組之腰圍變化的標準差和標 準誤(standard error)。(10 分) 檢定地中海型飲食組和一般減脂飲食組的腰圍變化是否不同?(15 分) 34480、36280
某研究對2006 至2016 年青少年健康行為調查(GSHS)之數據進行 二級資料的統計分析。研究結果顯示,高職青少女(10-12 年級)3600 位中,自述有性行為者432 位,問發生性行為率及其95%信賴區間 (CI)?(20 分) 33080 34280
某研究者探討含糖飲食攝取量(公斤/年)和兒童齲齒狀況的關係,蒐 集60 個兒童之含糖飲食攝取量和恆齒齲蝕指數(為恆牙齲齒齒數、缺 牙數及填補數三種牙齒數的總和,數值越小表示齲蝕顆數越少)。 基本資料如下: 變數 樣本數 平均值 標準差 X和Y的樣本共變數 ∑ (ݔ௜−ݔ̅)(ݕ௜−ݕത) ௡ ௜ୀଵ 糖飲食攝取量(X),單位為公斤/年 60 24.55 16.77 782.06 恆齒齲蝕指數(Y),單位為顆 60 2.34 1.59 假設由散布圖已知含糖飲食攝取量和恆齒齲蝕指數有正向的線性關 係,研究人員進一步建立簡單線性迴歸模型Y෡= ܾ଴+ܾଵX。請估計迴歸 係數ܾଵ。(5 分) 研究者也建立變異數分析表(如下)。請說明此迴歸直線是否有達到 統計上的顯著性(顯著水準α = 0.05),並解釋迴歸係數ܾଵ的意義。 (15 分) 變異來源 自由度 平方和 平均值平方 F 值 Pr > F 迴歸 X X 36.88077 18.91 <.0001 誤差 X X 1.95036 總和 X X 計算含糖飲食攝取量和恆齒齲蝕指數的決定係數(coefficient of determination),並說明其意義。(10 分)
邀請某大學護理系大三學生於實習結束後填寫問卷,因應分數(coping) 愈大表示因應措施愈多,而實習壓力分數(stress)愈大表示實習壓力 愈大。採用簡單線性迴歸模式(Y=a+bX+ε)探討因應與實習壓力的關 係,統計分析結果如下: 請完成下方變異數分析表空格(1)~(7),並解釋其意義。(10 分) 寫出此簡單線性迴歸模式對實習壓力的解釋能力。(5 分) 寫出a 及b。(10 分) 設某學生的因應分數為3 分,問其實習壓力分數預期為多少?(5 分) Variable n Mean Std Dev Minimum Maximum stress coping 398 398 1.56 1.59 0.76 0.60 0 0 4.00 4.00 Analysis of Variance Source DF Sum of Squares Mean Square F Value Pr > F Model (1) 6.68 (2) (3) <0.01 Error (4) (5) (6) Corrected Total (7) 230.28 33080 34280 附表 33080 34280 附表 33080 34280 附表 33080 34280 附表
(1)
(7) 10 分
(1)
(2)
(4)
(6)
(7)
疫苗猶豫(Vaccine hesitancy)是指儘管有疫苗可用,但民眾延遲或拒絕 接種疫苗的現象。一調查研究顯示,在800 位醫療工作者中,104 位有 疫苗猶豫,在200 位公共衛生相關政府部門的工作者中,有20 位有疫 苗猶豫。設顯著水準α = 0.05,請檢定醫療人員和政府公共衛生部門工 作人員的疫苗猶豫比例是否不同?請寫出虛無假設和對立假設、統計 量,以及計算該統計量所需的假設、計算檢定統計量,並下結論。(25 分) 34480、36280 附表一、標準常態分配機率對照表 34480、36280 附表二、t 分配臨界值表
在臺灣懷孕週數為40 週的嬰兒的出生體重分布近似正常,平均值為 µ = 3500 克,標準差= 430 克。 假設一個懷孕週數為40 週的新生兒,他或她的出生體重小於2500 克的機率是多少?(5 分) 截斷(cutoff)此出生體重分布最低5%的體重值為何?(5 分) 假設從這個母群體中隨機抽取了一個樣本數為5 的隨機樣本,截斷 此樣本數為5 的樣本抽樣分布最低5%的平均體重值為何?(5 分) 假設此樣本數為5、懷孕週數為40 週新生兒樣本平均值的抽樣分 布,平均出生體重小於2500 克的機率是多少?(5 分) 假設從這個母群體中隨機抽取了五個新生兒,在此五個新生兒中只 有一個出生體重低於2500 克的機率是多少?(5 分) P(Z≧2.33)=0.010;P(Z≧1.645)=0.05;P(Z≧5.21)=0.000
接受常用高血壓處方藥物(drug A)治療的高血壓病人收縮壓平均值 (A)為120 mmHg,某藥廠研發一種新的高血壓藥物(drug B),並 招募25 位病人進行臨床試驗,治療後平均收縮壓為115 mmHg(標準 差s=20 mmHg),99%信賴區間(confidence interval)為115 2.797 (20 / 25)= 103.8 ~ 126.2 mmHg;若是進行雙尾統計檢定,在=0.01 的 顯著水準下,檢定結果顯示drug A 與drug B 之間對於血壓控制的效果 並未達到統計顯著意義,統計檢力(power)僅為0.09。該藥廠於是想重 新進行實驗,請問有那一些方法可以提高統計檢力?(25 分)
某研究欲評估某降血糖藥物的成效,蒐集150 名糖尿病患者並給予降血 糖藥物治療,治療一個月後發現其中42 名患者有效,其血糖至少可以降 低20 毫克/分升。試述此降血糖藥物有效之最佳點估計值為何?並請計 算此最佳點估計值之95%信賴區間。假設給予糖尿病患者安慰劑一個 月,其血糖至少可以降低20 毫克/分升的比例為10%,請以適當的統計 檢定方法檢定該降血糖藥物的確具有療效,而非僅有安慰劑作用,並請 列出其虛無假說及對立假說。(25 分)
使用來自佛拉明罕心臟研究(Framingham Heart Study)的數據比較兩 個男性族群研究起始點的血清膽固醇水平分布,這兩個族群分別為後 續產生冠心病和沒有產生冠心病者。未患冠心病的男性人群的平均血 清膽固醇為µ = 219 mg/100 ml,標準差= 41 mg/100 ml,假設我們並 不知道這群未產生冠心病者其真正母群體的平均值,我們假設µ 等於 244 mg/100 ml。由於未患冠心病的男性的平均血清膽固醇水平不會高 於患有冠心病的男性的平均水平,因此選擇在α=0.05 的顯著性水平下 進行單測檢驗。 請寫下虛無假設與對立假設。(5 分) 如果從沒有產生冠心病的男性族群中選擇樣本數為25 的樣本,如上 面題目所述,此母群體真實平均值為219 mg/100 ml,那麼此檢定的型 二誤差機率是多少?(10 分) 若想降低型二誤差,此研究者該如何做?(5 分) 在單尾α=0.05 的顯著水準、型二誤差為0.05 的情況下,如果沒有冠 心病的男性族群真實平均值為219 mg /100 ml,此檢定需要多大的樣 本?(10 分) P(Z≧1.40)=0.081;P(Z≧1.645)=0.05;P(Z≧1.28)=0.10 16730
全國的醫學中心統計資料顯示:急診室醫師在第一時間將「心臟病發作」 誤診為「消化不良」的機率約為6%,某醫學中心檢視該中心同一時期急 診診斷資料發現:900 位「心臟病發作」到該院急診的病人中,有45 位 在第一時間被誤診為「消化不良」,比率為5%。在=0.01 的顯著水準下, 請檢定該醫學中心的誤診率是否低於全國的水準?請於檢定過程中寫出檢 定的:虛無假設與對立假設統計量及計算該統計量所需要的假設統 計量相對應的p-value 數值或範圍檢定的結論。(註:P(z< -2.33)=0.01; P(z< -1.96)=0.025;P(z< -1.645)=0.05)。(25 分)
某研究欲評估高蔬果低脂飲食(得舒飲食)對於降血壓之功效,共招募 81 名高血壓患者,分別於開始食用得舒飲食前及食用得舒飲食後六個 月,測量其收縮壓,結果如下表: 食用得舒飲食前 食用得舒飲食後六個月 前後改變量 收縮壓平均值 (毫米汞柱) 161.6 147.3 14.3 標準差 14.8 13.9 9.6 樣本數 81 81 81 請以顯著水準0.05 進行統計檢定,檢定得舒飲食是否對於收縮壓改變具 有統計顯著效應?並請列出本研究之統計虛無假說及對立假說。另請計 算得舒飲食前後收縮壓改變量之95%信賴區間,並依據所求得之95%信 賴區間範圍,判斷得舒飲食是否對於收縮壓改變具有統計顯著效應?並 解釋其理由。(25 分) 33680
某研究利用病例對照研究設計以評估喝酒與痛風的關係,結果發現130 名痛風患者,75 名有喝酒情形;125 名正常對照組個案,35 名有喝酒情 形。請以適當統計檢定方法檢定喝酒與痛風間是否有統計顯著相關?設 顯著水準0.05。並請計算兩組間喝酒率差異的95%信賴區間。(25 分)
假設您有興趣調查退休狀態與心臟病之間的關聯。一個潛在的干擾效應 可能是受試者的年齡,即當老年人更有可能退休,也更有可能患有心臟 病。因此,在一項研究中,127 名心臟驟停(cardiac arrest)患者在許多 特徵上與127 名健康對照受試者進行了匹配,包括年齡,然後確定每個 受試者的退休狀態。 心臟驟停 健康者 退休 沒有退休 總計 退休 27 12 39 沒有退休 20 68 88 總計 47 80 127 請進行退休狀態和心臟驟停間是否相關之檢定,請說明你的結論。(10分) 請估計健康者與經歷過心臟驟停者退休的相對勝算,並建立其95%信 賴區間,此區間是否包含1?此代表意義為何?(10 分)
A、B、C 三位心理學教授在星期一上午10:00-12:00 都有擔任心理學概 論通識課程(為選修課)的教學工作,某學期A、B、C 三位教授的心理 學概論修課人數分別有32 人、25 人、10 人。如果以修課人數來代表授課 教授受歡迎的程度,在=0.05 的顯著水準下,請檢定三位教授的受歡迎程 度是否相同?請於檢定過程中寫出檢定的:虛無假設與對立假設統計 量的數值統計量相對應的p-value 檢定的結論(註:P(2>3.84, df=1) =0.05;P(2>5.99, df=2)=0.05;P(2>7.82, df=3)=0.05)。(25 分) 34980 35080 36780 36880
某研究欲了解吸菸狀態與丙胺酸轉胺酶(GPT)的關係,共蒐集575 名 個案,詢問其吸菸狀態並檢測其丙胺酸轉胺酶,並依照其吸菸狀態分成 三組:從未吸菸、已戒菸、現在吸菸,以比較三組間的丙胺酸轉胺酶平 均值是否有顯著差異,得到下表結果: 組別 人數 平均值(U/L) 標準差 從未吸菸 148 25.0 15.0 已戒菸 150 29.1 15.5 現在吸菸 277 34.8 34.6 變異數分析表 變異來源 平方和 自由度 均方 F 值 P 值 組間 9875.6 (b) (d) (e) 0.001 組內 (a) (c) 696.4 總和 408190.6 574 請列出適合本研究之統計虛無假說及對立假說,並請計算變異數分析表 中(a)、(b)、(c)、(d)、(e)之數值,另以顯著水準0.05,說明不同吸 菸狀態組別間的丙胺酸轉胺酶是否有統計上顯著差異?並請計算現在 吸菸組與從未吸菸組兩組母群體之丙胺酸轉胺酶平均值差異的95%信 賴區間。(25 分) 33680 標準常態分布右尾之面積 33680 t分布的百分位數
在一個含有臺灣某家醫院100 名低出生體重嬰兒樣本的資料庫中,懷孕 週數以變項名稱gestage 標示,收縮壓測量值以變項名稱sbp 標示。假設 嬰兒收縮壓和懷孕週數呈線性相關,使用收縮壓作為反應變項,懷孕週 數作為解釋變項,下列報表以SAS 軟體計算最小平方法所估計之迴歸 線。 Parameter Estimates Variable DF Parameter Estimate Standard Error t Value Pr > |t| Intercept 1 10.55207 12.65063 0.834 0.005 gestage 1 1.26438 0.4362311 2.898 0.005 請寫下此迴歸方程式,並解釋直線的估計斜率和與y 軸相交截距所代 表的意思是什麼?(10 分) 在0.05 的顯著水準,請檢定真實母群體斜率等於0 的虛無假設。你 得出什麼結論?(10 分) 懷孕週數為31 週的低出生體重嬰兒的估計平均收縮壓是多少?(5 分)
某觀察性研究探討身體質量指數(BMI,連續性變項)與憂鬱症狀分數 (depression,連續性變項,分數愈高代表憂鬱症狀愈明顯)之間的相關 性,研究者進行一般線性迴歸(general linear regression)分析時同時也 控制了樣本是否來自收入在貧窮線以下的家庭(poverty,二分變項)。以 下是迴歸分析的結果。請根據此結果寫出包括BMI、depression 以及 poverty 三個變項在內的一般線性迴歸方程式,並在顯著水準=0.05 下, 根據模式一與模式二結果說明BMI 與憂鬱症分數之間的關係。(25 分) 模式一 模式二 Parameter Estimate Standard Error t Value Pr > |t| Intercept 0.0112 0.056 0.20 0.8419 BMI 0.0065 0.002 3.15 0.0017 Parameter Estimate Standard Error t Value Pr > |t| Intercept 0.2167 0.0734 2.95 0.0033 BMI 0.0038 0.0021 1.81 0.0720 poverty -.1857 0.0433 -4.28 <.0001
衛生福利部國民健康署對體位的分類如下表: 成人肥胖定義 身體質量指數(BMI)(kg/m2) 體重過輕 BMI<18.5 健康體位 18.5<=BMI<24 過重 24<=BMI<27 肥胖 27 <= BMI 若已知某地區成人身體質量指數服從常態分布,平均值為23 kg/m2,標準 差為4。 請算出成人身體質量指數的四分位差,及體重過輕、過重與肥胖的比例。 再者,若隨機抽取36位文書工作者測量其體位,得到其平均BMI 值為 26,請計算文書工作者BMI 平均值的95%信賴區間。(25分) (註:(0.25)=0.60, (0.674)=0.75, (0.75)=0.77, (0.95)=0.829, (0.975)=0.835, (1)=0.841, (1.125)=0.87, (1.645)=0.95, (1.96)=0.975 其中為常態分布累積分布函數)
(1)
105~109年全國龍膽石斑養殖放養數量分別為103.4, 143.2, 72.7, 78.1, 48.3 百萬尾。 求這五年龍膽石斑養殖放養數量的平均值、中數、變異數、全距、變異 係數(CV)。(10分) 求放養數量平均值的95%信賴區間。(9分) 母群體平均值是否大於100百萬尾?(6分)
某研究欲評估兩種新冠肺炎疫苗(廠牌A 與B)對於接種者是否可產生 有效中和抗體。該研究遂進行隨機臨床分派平行試驗並且以接種者產生 之中和抗體效價數值(Geometric mean titer, GMT),作為疫苗抗原反應 之主要評估指標,結果如下: 受試者人數 GMT 平均值 GMT 標準差 廠牌A 32 180.1 20 廠牌B 32 190.0 20 請應用統計檢定方法評估兩廠牌疫苗接種後之免疫反應是否有所不同, 並寫出三個該檢定方法需遵循的重要假設(Assumptions)以及評論本研 究是否符合。(25分)[型一誤差=0.05] (註1:需寫出假說檢定步驟及統計檢定結論的依據。 註2:Z0.95=1.645, Z0.975=1.96, t0.95, 1=6.31, t0.95, 2=2.92, t0.95, 30=1.697, t0.95, 32=1.694, t0.95, 60=1.671, t0.95, 62=1.670, t0.975,1=12.71, t0.975,2=4.30, t0.975,30=2.042, t0.975,32=2.037, t0.975,60=2.0, t0.975,62=1.998) 34080
三酸甘油脂與遺傳因子LDLR突變可能有關,沒有此突變的20人三酸 甘油脂平均值為170.8(mg/dl),標準差20.8;有突變的10人平均值為 250.3(mg/dl),標準差40.4,假設三酸甘油脂為常態分佈,兩組母群體標 準差相同,請問兩組三酸甘油脂平均值是否相同?(25分)
校園線上課程在近年來逐漸成長,為了解家長與學生對線上課程的接受 度是否有關,A 校針對該校100位學生進行問卷調查,並同時調查這100 位學生的家長之接受度。假設同一個家庭內,家長與學生彼此間會互相 影響。若將接受度分為高、低兩類,結果發現學生族群高接受度的占33%, 家長的高接受度比例為25%,且100個家庭中家長和學生同時都顯示高接 受度的有15%。 請將上述問題整理成列聯表,並提出適當統計檢定方法針對此資料進行 假說檢定。[型一誤差=0.05](25分) (註:需寫出假說檢定步驟及統計檢定結論的依據)
新冠肺炎確診死亡的病例中,許多原有其他病因,如心臟病、糖尿病等, 下表為不同年齡有無其他病因死亡人數: 年齡 <40 40~64 ≥65 有其他病因 250 1340 2630 無其他病因 30 60 70 如上表,列出原來有或無其他病因各年齡層死亡比例的期望值。(6分) 檢驗各年齡層原有其他病因與無其他病因的死亡比例是否相同?(19分)
研究者為了提高病人照護的便利性,開發無線生物感測裝置,希望藉由 脈波到達時間(pulse arrival time, PAT)的資料進行收縮壓(Systolic Blood Pressure, SBP)的量測,以30個樣本進行資料收集,得到以下結果: 變項 平均值 標準差 SBP 137 9.3 PAT 211 23.5 PAT 與SBP 的散布圖如下: 圖中的方程式為利用最小平方法所得到的簡單直線迴歸方程式的估計 結果。 請估計PAT 與SBP 的相關係數及上述迴歸模式的決定係數,並進一步解 釋兩者代表的意義,最後寫出此簡單直線迴歸分析的變異數分析表格 (ANOVATable)檢定PAT 與SBP 的關係是否具統計上顯著意義。(25分) [型一誤差=0.05] (註1:需寫出假說檢定步驟及統計檢定結論的依據。 註2:F(0.95, 1, 28)=4.196, F(0.95, 29, 29)=1.861, F(0.975, 1, 28)=5.61, F(0.975, 29, 29)=2.101)
海水魚類多樣性指數(Y)可能與水深(X,公尺)有關,由拖網漁船在 不同深度取得18個網次樣本,最小平方法求得簡單直線迴歸模型如下: 變數 估計值 自由度 標準誤差 b0 0.0004 1 0.0003 b1 -0.92 a 0.54 線性迴歸模型為何?(3分) 分別解釋迴歸係數b0、b1在此拖網漁船數據的意義、自由度a為何?(6分) 檢驗兩者是否有顯著的線性迴歸關係。(9分) 試求決定係數(coefficient of determination)並解釋其意義。(7分) 35480、37080 37180 附表一 附表二
假設全國45 歲以上成人的尿酸分布近似常態分布,其平均值為6.3 毫克/ 每100 毫升(mg/dL),標準差為1.8 mg/dL,請回答下列問題:(標準常 態分配函數表詳如附表) 從此母群體隨機抽一名成人其尿酸值大於9.5 mg/dL 的機率為何?又 隨機抽一名成人其尿酸值介於4.6~8.2 mg/dL 的機率為何?(10 分) 若從此母群體隨機抽樣重複樣本64 人,請計算全國45 歲以上成人尿 酸平均值的95%信賴區間。(10 分)
某研究欲探討我國民眾的健保使用率,隨機抽取100 位民眾,調查每個 人在過去一年使用健保的次數,得平均值為15 次,標準誤為13 次,請 回答: 這100 個數據為何不適合假設服從常態分佈?(5 分) 為何不能根據上述數據支持「我國大部分民眾使用健保的次數在 15±13 次當中」之敘述?這個15±13 次能說明什麼?(10 分) 根據上述數據,我國民眾過去一年使用健保的平均次數超過20 次的 機率是否達到0.05?為何?(已知標準常態分佈之第5 百分位為 −1.64,第95 百分位為+1.64。)(10 分)
自2006 年6 月,國內反毒政策由中央落實到地方政府。各縣市毒品 危害防制中心接獲通報後,便與戒癮更生人聯繫並進行輔導評估,希 望其生活早日回歸正常,降低再犯情形。下列為某縣市毒品危害防制 中心2006年至2008年對有聯繫上之戒癮更生人資料進行抽樣後獲得 之結果: 性別 n 2 年內再犯率 男 512 267(52.1%) 女 100 39(39.0%) 請執行適當統計檢定方法分析性別與再犯率關係。(當p 值<0.05, 表示達統計顯著意義)(25 分)
某研究團隊欲探討喝酒與三酸甘油脂間的相關性,該研究團隊利用社區 整合性健康篩檢,以問卷收集人口學變項、生活飲食及運動習慣等資 料,並採集空腹血液樣本以測量血糖及血脂,共收集478 名個案。將個 案分成有喝酒組與無喝酒組,以比較有無喝酒兩組間之三酸甘油脂平均 值的差異,結果如下表: 組別 人數 三酸甘油脂平均值 三酸甘油脂標準差 有喝酒組 215 118.4 81.1 無喝酒組 263 102.5 61.6 請列出本研究之統計虛無假說及對立假說,並以統計檢定方法檢定有喝 酒組與無喝酒組之三酸甘油脂平均值是否有統計顯著差異?設第一型 誤差α = 0.05,並請計算兩組間的三酸甘油脂平均值差異之95%信賴區 間。另依據所求得之95%信賴區間範圍,是否可以判斷有無喝酒兩組間 之三酸甘油脂平均值具有統計顯著差異?並說明其理由。(25 分) (t214, 0.95 = 1.652;t214, 0.975 = 1.971;t262, 0.95 = 1.650;t262,0.975 = 1.969; t476, 0.95 = 1.648;t476, 0.975 = 1.965) 34580、35080 35180、35280
某研究欲探討成年女性當中,有吸菸習慣及沒有吸菸習慣者血壓是否不 同,因而隨機抽樣100 位有吸菸習慣的成年女性,及100 位沒有吸菸習 慣的成年女性,測量其血壓,得下列數據: 血壓平均值 樣本變異數 標準差 標準誤 有吸菸者 128 2025 45 4.5 沒有吸菸者 123 1600 40 4.0 以圖形描述這些女性的血壓值,你會使用何種圖形,並檢查什麼特 徵?(10 分) 假設兩個母體的變異數都相等,如何估計此變異數?(請務必寫出算 式)(5 分) 假設兩個母體的變異數都相等,檢定有吸菸習慣及沒有吸菸習慣的人 血壓期望值是否不同,得t 檢定統計量為0.83,p 值比0.05 大,這個 檢定的結論為何?(5 分) 第小題的檢定是那一種t 檢定?(5 分) 第小題的t 檢定是否可以利用變異數分析來完成?為何可以或為什 麼不可以?(10 分) 28130
一簡單線性迴歸方程式:得 , ,且 之 標準差(SX)=1.8, 之標準差 25 分)
某學校午餐過後,發生師生集體食物中毒事件,有95 名師生因上吐下 瀉而就醫,經衛生局人員逐一詢問所有師生午餐攝食情形,推測可能是 蛋沙拉所引起。95 名上吐下瀉師生中有60 名食用蛋沙拉,140 名未發 生身體不適之師生中有10 名食用蛋沙拉。請以統計檢定方法檢定攝食 蛋沙拉與食物中毒事件間是否有統計顯著相關?並請列出本研究之統 計虛無假說及對立假說,設第一型誤差α = 0.05。另請計算兩組間攝食蛋 沙拉比例的差異及其95%信賴區間。(25 分) (Z0.975 = 1.96;Z0.95 = 1.645;χ2 1,0.95 = 3.84;χ2 1,0.975 = 5.02)
若想要利用簡單線性迴歸模式Y=a+bX+ε,探討有固定運動習慣與沒有 固定運動習慣的民眾的體重是否不同;隨機抽取100 位民眾,詢問其是 否有運動習慣並測量其體重後,請回答下列問題: Y 跟X 那一個應該放入是否有運動習慣,那一個應該放入體重?為 何?(10 分) 上述迴歸模式中的係數,那一個是此研究有興趣的目標?為何?(5 分) 若要利用此迴歸模式的迴歸係數(a 與b)及迴歸係數估計值(α與β) 來檢定有無固定運動習慣的民眾的平均體重是否不同,虛無假設與對 立假設各是什麼?(5 分) 上述迴歸係數的t 檢定的自由度是多少?(5 分) 上述「有固定運動習慣與沒有固定運動習慣的民眾的體重是否不同」 的檢定也可以利用那一種t 檢定來取代?(5 分)
某統計分析結果顯示:兩組差異之平均值為3.00,95%信賴區間在 (1.25, 4.75),達統計顯著意義。請說明以上陳述的意義。(不用計算) (25 分)
某研究團隊欲研究身體質量指數(BMI)與空腹血糖(mg/dL)間的關 係,利用社區整合性健康篩檢收集321 人的資料,建立以身體質量指數 預測空腹血糖的迴歸模式,得到的線性迴歸模式及變異數分析表的結果 如下: x y 72 .0 54 . 76 ˆ + = 變異數分析表 變異來源 平方和 自由度 均方 F 值 P 值 迴歸模型 2683.24 1 (b) (c) 0.002 殘差 (a) 319 282.82 總和 92901.60 320 請解釋上述線性迴歸模式,並說明此迴歸模式是否達統計顯著性?(設 第一型誤差α = 0.05)。並請計算當身體質量指數為28 時,其預期的空腹 血糖值為何?依上述變異數分析表請計算(a)、(b)、(c)之數值,同時計算 上述線性迴歸模式的決定係數,並解釋此決定係數的意義。(30 分) 34580、35080 35180、35280 附表 標準常態分配函數表 Φ(z z z)
試述機器學習(machine learning)與統計學在使用上有何異同之處? (10 分)
為提升小學老師對過動症(ADHD)之瞭解,某縣市衛生單位對小學 老師提供相關衛教演講。演講前,請小學老師填寫ADHD 知識問卷, 得到下列結果: 教導年級 低年級 (1-2 年級) 中年級 (3-4 年級) 高年級 (5-6 年級) 多年級 6.1 )1 |ˆ ( = = X Y (SY)=2.7,求X 92 .5 )
|ˆ ( = = X Y 與Y 之決定係數。( X Y n 259 89 45 67 平均數±標準差 7.42±1.54 7.27±1.63 7.27±1.36 6.60±1.77 請執行適當統計檢定方法分析教導四種年級的老師在ADHD 的知 識是否有差異?(當p 值<0.05,表示達統計顯著意義)(20 分) 針對結果進行論述,例如:是否需要進行後續統計分析、又應考 量那些可能影響因素?(不用計算)(5 分) 28680-28980 附表 . 4332 . 4452 . 4345 . 4463 . 4357 28680-28980 28680-28980 28680-28980 28680-28980
鄰苯二甲酸二(2-乙基己基)酯(DEHP)為一種常被使用的塑化劑。為了 探討A 與B 二個社區居民暴露於此類化合物的狀況,某研究分別由A 與B 社區隨機抽取25 位與30 位居民,檢測受試者尿液檢體後,得DEHP 之平 均濃度分別為21.6 與18.2 μg/kg/day,標準差分別為4.5 與1.5 μg/kg/day。 假如顯著水準(α level)設定為0.05,請回答下列問題? (t24,0.950=1.711; 24,0.975=2.064; =1.708; t 5,0.975=2.060; t t t27,0.950=1.703; 27,0.975=2.052; 0=1.701; t 8,0.975=2.048) 25,0.950
取樣7 個糖尿病患者服用降血糖藥,開始服用前和連續服用6 個月後的糖化血色素 (HbA1c)的數據如下: 1
t t28,0.95 2 (χ29,0.025 2 =16.05; χ30,0.025 2 =16.79; χ29,0.975 2 =45.72; χ30,0.975 2 =46.98) (F24,20,0.95=2.08; F24,20,0.975=2.41) A 社區居民DEHP 濃度之母群體平均數的95%信賴區間為何?(5 分) B 社區居民DEHP 濃度之母群體變異數的95%信賴區間為何?(5 分) A 與B 社區居民DEHP 濃度之母群體變異數是否具有顯著差異?(5 分) A 與B 社區居民DEHP 濃度之母群體平均數是否具有顯著差異?(10 分) 此一研究的統計學檢力為何?(5 分) 二、心血管疾病全國的平均發生率為1.24/100 人年。為了探討A 社區居民心 血管疾病的發生率是否與全國的平均發生率不同,某研究於A 社區追蹤 一群隨機選取之居民共1600 人年,並診斷出25 位新發生之心血管疾病 病患。請回答下列問題? 1200 人年之中,全國民眾發生超過或等於22 位心血管疾病個案的機 率為何?(5 分) 500 人年之中,全國民眾發生小於或等於3 位心血管疾病個案的機率 為何?(5 分) A 社區居民心血管疾病的發生率是否與全國的平均發生率顯著不等? 請陳述統計檢定的假說,統計分析的內容,並陳述分析後的結論? (α level = 0.05)(10 分) 33880-33980 34380-34580
某研究探討青少年血液總膽固醇(T-chol)與舒張壓(DBP)之關係, 並考慮性別(Sex)、年齡(Age)、三酸甘油脂(TG)、收縮壓(SBP) 對兩者之關係的作用。分析數據顯示於下,請回答下列問題? (t256,0.95=1.651;t256,0.975=1.969) 模式1:T-chol = a + b*DBP N: 258 T-chol: mean = 161.02 mg/dL; SD(standard deviation)= 37.29 mg/dL DBP: mean = 64.49 mmHg; SD = 9.34 mmHg R2(判定係數): 3.23% Model SS(model sum of square): 11546.61 模式2:T-chol = a + b1*DBP + b2*Sex + b3*Age + b4*TG + b5*SBP N: 258 b1 = 0.620; b5 = -0.178 變數之間的相關係數矩陣 T-chol TG SBP DBP Age TG 0.3324 1.0000 <0.001 SBP -0.0102 0.0854 1.0000 0.8711 0.1717 DBP 0.1798 0.1692 0.4718 1.0000 0.0038 0.0064 <0.001 Age -0.1533 -0.0900 0.2159 0.0181 1.0000 0.0137 0.1494 0.0005 0.7718 Sex 0.0933 -0.0639 -0.2675 0.0504 -0.0343 0.1351 0.3065 <0.001 0.4200 0.5837 迴歸係數(b)之間的共變數矩陣 e(V) TG SBP DBP Age Sex TG .00258341 SBP -.00004219 .04128684 DBP -.0020708 -.02800499 .07428528 Age .01018394 -.10066336 .05074636 4.3939324 Sex .01671834 .30881624 -.2744037 -.37775206 21.096665 模式1 之迴歸係數(b)為何?(5 分)其95%信賴區間為何?(5 分) 模式1 之中,總膽固醇與舒張壓之相關係數為何?(5 分)其95%信 賴區間為何?(5 分) 舒張壓為60 mmHg 時,總膽固醇預測值之95%信賴區間為何?(5 分) 由變數之間的相關係數矩陣判斷,那個變數對總膽固醇與舒張壓之間 的相關性具有最大的干擾作用,理由為何?(5 分) 模式2 之中,每增加2 mmHg 之舒張壓與1 mmHg 之收縮壓,總膽固 醇平均變化量之95%信賴區間為何?(5 分) 33880-33980 34380-34580 標準常態分布表 33880-33980 34380-34580
請試述下列名詞之意涵:(每小題5 分,共15 分) 四分位距(interquartile range, IQR) 第一類誤差(type I error) 中央極限定理(central limit theorem)
服用前 10.2 11.1 10.5 13.0 12.3 10.4 11.5 6 個月後 9.9 10.8 9.9 13.0 12.1 10.3 11.1 求服用前糖化血色素的平均數(mean)、中數(median)、變異數(variance)、 全距(range)、變異係數(CV)。(15 分) 求服用前糖化血色素平均數95%信賴區間。(10 分) 檢驗開始服用前和連續服用6 個月後的糖化血色素有無差異?(10 分) 二、過去20 年漁船海上意外事故有失火、擱淺、碰撞、翻覆,大致維持2:3.5:3:1.5 的比例,根據2017 年統計,漁船失火、擱淺、碰撞、翻覆各有16、17、30、12 件, 請檢驗2017 年的事故是否仍維持過去20 年的比例?(15 分) 三、在探討診斷標準腎功能的腎絲球過濾率(eGFR)是否會受到總膽固醇(TCHOL)的 影響,8 位受測者的資料如下: 受測者 1 2 3 4 5 6 7
eGFR 71 50 111 32 116 97 84 95 TCHOL 215 148 219 126 197 256 137 178 若要由總膽固醇來預測腎絲球過濾率請以上述數據作散布圖(scatter diagram)。(5 分) 求由總膽固醇預測腎絲球過濾率的迴歸係數,請說明得到數值的意義。(10 分) 檢驗迴歸係數是否為0。(10 分) 四、為研究隨著黑潮洄游的黑鰭飛魚體型,三個地區取樣的飛魚身長如下: 蘭嶼:28、27、25、28 花蓮:28、27、28、29 宜蘭:30、29、31 魚體長在地區內、地區之間的平方和各為多少?(10 分) 檢驗不同地區魚體長是否相同?(15 分) 107年公務人員高等考試三級考試試題 代號: 33280、36780 38380、38580 38680 全二頁 第二頁 類 科: 衛生行政、食品衛生檢驗、衛生技術、漁業技術、養殖技術 科 目: 生物統計學 2α χ αt ∞
標準常態分布的中位數(Median)及第5 個百分位數(5% Percentile)各為多少? (10 分)
論述bootstrapping 方法與所用原理,及其衛生醫學應用實例。(25 分)
某研究者擬探討男嬰與女嬰的平均出生身長是否有顯著差異,在大臺北地區醫院中分別 抽樣男嬰與女嬰各31 位,得樣本資料如下: 51 = 男 x 公分, 25 .6 2 = 男 s , 49 = 女 x 公分, 4 2 = 女 s 。 請檢測母體中男嬰與女嬰出生身高變異數是否相等。(請先寫出虛無假設與對立假 設,設顯著水準 = α 0.05,已知F0.95(30,30)=1.84,F0.975(30,30)=2.07,F0.95(1,60)=4, F0.975(1,60)=5.29)(5 分) 試求母體中男嬰與女嬰出生身高平均數差之95%信賴區間,請解釋此區間意義。(5 分) 請以假設檢定方式判斷母體中男嬰與女嬰出生身高平均數是否有顯著差異?請具 體解釋假設檢定結果,並比較假設檢定與前項之信賴區間結果。(假設檢定請先 寫出虛無假設與對立假設,設顯著水準 = α 0.05)(10 分) 若擬探討男嬰與女嬰出生身高平均數是否有顯著差異,可否以變異數分析獲得結 論?如果不行請說明理由,如果可以,請以單因子變異數分析進行檢定,並具體 說明結論。(請先寫出虛無假設與對立假設,設顯著水準 = α 0.05 ,已知 F0.95(30,30)=1.84,F0.975(30,30)=2.07,F0.95(1,60)=4,F0.975(1,60)=5.29)(10 分)
某衛生單位想了解食品廠某添加物超標的情況,全臺灣總共抽取100 件樣品,其中8 件超過標準。已知三年前曾經做過大規模的調查,該添加物超標率為10%,想知道 本次抽檢的結果是否表示臺灣該添加物超標的情況明顯降低。請檢定臺灣該添加物 超標的比率是否比10%為低。顯著水準設定為0.01。 請寫出虛無假說及對立假說,並計算檢定統計量。(10 分) 臨界值或P value 可能的範圍為多少?請判讀檢定結果。(10 分)
論述兩型錯誤與檢力及樣本數間的關聯,及其衛生醫學應用實例。(25 分)
為估計某地區無照攤販的人數(N),某研究者追蹤民國101 年警察秋季取締專案所 查獲之無照攤販300 人,發現在隔年102 年警察春季取締專案共查獲的400 名無照 攤販中,內含20 名是101 年被取締之無照攤販再度被查獲,假設兩次的取締專案為 獨立行動,則可估計該地區無照攤販總數(N)約為多少人?(10 分)
某調查想了解兩個產業的職場工作人員的身心壓力狀況,以問卷量表分數評估,分 數越高代表壓力越大,已知壓力分數在群體中為常態分布。A 及B 產業各抽取20 人。 產業A 平均值與標準差為55 與9,產業B 平均值與標準差為50 與8。以單因子變異 數分析(One-way ANOVA)分析比較A , B 兩個產業工作人員的身心壓力分數平均值 是否相同。顯著水準設定為0.05。 Source 自由度 Sum of Square Mean Square F P value Between(組間) (a) 312.5 (c) (e) 0.043 Within(組內) (b) (d) 72.5 Total 39 請寫出虛無假說及對立假說,並完成此ANOVA 表(a)-(e)。(10 分) 請判讀檢定結果。(10 分) 除了單因子變異數分析,請再舉出2 個統計方法執行上述假說檢定。[此小題不 用計算](10 分) 106年公務人員特種考試警察人員、一般警察 人員考試及106年特種考試交通事業鐵路 人員、退除役軍人轉任公務人員考試試題 全一張 (背面) 考試別: 退除役軍人轉任公務人員考試 等 別: 三等考試 類科別: 衛生行政 科 目: 生物統計學
論述適合度檢定所用統計量與檢定方法及其衛生醫學應用實例。(25 分)
某研究者擬評估人工膝關節置換術後兩週病患的功能恢復指數(設範圍0-100 分,為 一常態分配),分數愈高表示恢復程度愈良好,若自該術後兩週的病患中隨機抽取81 名為一隨機樣本,計算得知功能恢復指數平均數為74 分,變異數為324。 請以 = α 0.05 來檢定人工膝關節置換術後兩週病患功能恢復指數之平均數是否高 於70 分?(請列出假設,寫出算式,依結果具體解釋)(10 分) 承,若真正功能恢復指數之平均數為75.23 分,試求此分析之統計檢定力(power) 為何?請具體解釋此檢定力意義。(10 分) (請接第二頁) 106年公務人員高等考試三級考試試題 27780、27880 全五頁 第二頁 類 科:衛生行政、食品衛生檢驗、衛生技術、漁業技術 科 目:生物統計學
某介入試驗將受試者分為兩組,其中100 人施以新治療方法,10 人有不良反應,另 外100 人施以傳統治療方法,5 人有不良反應。請檢定治療方法與不良反應之間是否 有關聯?顯著水準設定為0.05。 請寫出虛無假說及對立假說,並計算檢定統計量。(10 分) 臨界值或P value 可能的範圍為多少?請判讀檢定結果。(10 分) 此檢定最大可容忍犯的第一型錯誤(Type I error)機率為多少?(5 分)
論述依變項與自變項均為連續數值型態時,所用統計量與檢定方法及其衛生醫學應 用實例。(25 分)
某研究者擬探討婦女罹患乳癌經治療半年後的生活滿意度影響因子,取樣100 位乳 癌患者在治療半年後進行調查,並作簡單線性迴歸分析,其中依變項(Y)為生活滿 意度分數(分數愈高表示滿意度愈高),而自變項X1 為家庭支持(分數愈高表示家 庭支持愈佳),已知∑ = − 39828 ) ( 2 y yi ,∑ = − 28595 )ˆ ( 2 y yi ,試問: 在此簡單線性迴歸分析(simple linear regression)中,決定係數為何?解釋其意義。 (5 分) 已知此簡單線性迴歸方程式為:Y = 40.5 + 0.62X1,若王小姐(符合研究對象條件) 的家庭支持分數為12,請預測王小姐的生活滿意度分數為何?(5 分) 如果研究者增加日常功能障礙分數(分數愈高表示日常功能障礙愈大)之自變項 (X2),發現在觀察到Y 的總變異中,能被迴歸直線所解釋的比例增加12%,請問 此時複迴歸模型之決定係數為何?又此時∑ − 2)ˆ ( y yi 值為何?(5 分) 承,請檢定H0: 1 β = 2 β =0 並清楚說明結論。(設顯著水準 = α 0.05,已知 F0.95(1,98)=3.94,F0.95(2,97)=3.09,F0.975(1,98)=5.18,F0.975(2,97)=3.83)(5 分)
請舉一例說明McNemar test 的適用情況及資料型式。(15 分)
研究者於某社區進行民意調查,了解大眾對於「調漲菸品健康福利捐挹注健保之政策」 的支持度,結果顯示,在調查的600 人中,回答「非常支持」的有204 人,「支持」的 有156 人,「不支持」的有180 人,「非常不支持」的有60 人。 在0.01 的顯著水準之下,有充分的證據認為回答「非常支持」、「支持」、「不支持」、 「非常不支持」四個選項的比例是否相當(即每個選項回答的比例都為四分之一嗎)? (10 分) 若將「非常支持」與「支持」選項合併為支持,「不支持」與「非常不支持」選項 合併為不支持,探討支持「調漲菸品健康福利捐挹注健保之政策」的比例,請使 用Z 檢定,檢定支持這項政策的比例是否過半,請列出演算過程,並具體說明結 果。(設 = α 0.01)(10 分) (請接第三頁) 106 類 科 年公務 類 科 附表一 務人員 科:衛 目:生 員高等 衛生行 生物統 等考試 行政、食 統計學 試三級 食品衛 級考試試 衛生檢驗 標準 (請接 試題 驗、衛 準常態分 接第四頁 衛生技 分佈表 頁) 代 技術、漁 2 漁業技 3180、2 7780、2 技術 26480 27880 全 第 全五頁 第三頁 頁 頁 106 類 科 年公務 類 科 附表二 務人員 科:衛 目:生 員高等 衛生行 生物統 等考試 行政、食 統計學 試三級 食品衛 級考試試 衛生檢驗 (請接 試題 驗、衛 t 分佈表 接第五頁 衛生技 表 頁) 代 技術、漁 2 漁業技 3180、2 7780、2 技術 26480 27880 全 第 全五頁 第四頁 頁 頁 106 類 科 年公務 類 科 附表三 務人員 科:衛 目:生 員高等 衛生行 生物統 等考試 行政、食 統計學 試三級 食品衛 級考試試 衛生檢驗 卡方 試題 驗、衛 方分配臨界 衛生技 界值表 代 技術、漁 2 漁業技 3180、2 7780、2 技術 26480 27880 全 第 全五頁 第五頁 頁 頁
某研究在桃園對醫療人員進行問卷調查,詢問其工作壓力、倦怠及離職意向。 醫檢師部分得有效問卷74 份,有離職意向的36 人。請計算有離職意向比例的95% 信賴區間。(10 分) 職能與物理治療師部分得有效問卷96 份,有離職意向的49 人。請計算有離職意 向比例的99%信賴區間。(10 分)
一個學校做了學生登革熱的調查:(作答時請寫出計算過程) 抗登革熱病毒NS1 IgG 血清檢出比率為10.0%,若隨機篩選6 個學生,假設每人檢 出的可能性都是10.0%,則其中有1 人檢出病毒NS1 IgG 血清的機率為何?(10 分) 這個學校學生身體質量指數(BMI)是常態分佈,若全校學生BMI 平均為20.2, 標準差為2.5,則一個學生BMI 是25.4 以上的機率為何?(10 分)
鰻苗的價格與產量的數據如下:(作答時請寫出虛無假說、對立假說、計算過程及 結論, 05 .0 = α ) 價格(元) 產量(百萬尾) 32 12 24 18 13 31 26 13 36 8 14 40 總和 145 122 由最小平方法,求出產量預測價格的直線迴歸方程式。(15 分) 求價格與產量皮爾森相關係數。(10 分) 檢驗鰻苗的價格與產量是否為顯著相關。(10 分)
某研究採立意取樣在某教學醫院產後一個月在家休養之婦女,以匹茲堡睡眠品質量 表(PSQI)測量其睡眠品質,PSQI 分數愈高,表睡眠品質愈差。83 位與寶寶同床 的婦女,睡眠品質得分為9.05± 3.73;31 位未與寶寶同床的婦女,睡眠品質得分為 6.85± 3.11。設α=0.05,比較兩組婦女在PSQI 有沒有差異,應使用何種統計檢定, 並執行此統計分析?結論為何?(20 分)
要決定4 種餌料對石斑魚養殖產量的影響,變異數分析如下表,英文字母代表需填 入的值。 變異來源 平方和 自由度 均方 F值 餌料 50.7 A B C 誤差 D E F 總和 98.7 11 試完成變異數分析表。(A~F 值各3 分,共18 分) 若每一餌料重複數相同,每一餌料重複幾次?(2 分) 檢驗餌料對石斑魚養殖產量影響是否顯著?(5 分)
某縣市舉辦注意力不足過動症(ADHD)知識衛教活動,於活動進行前請民眾填寫問 卷,以獲知民眾對ADHD 的知識(分數愈高表知識愈高)及其影響因素,得結果如下: 表 ADHD 知識的單變量分析 n mean ± SD p 性別 0.640 男 81 3.05 ± 1.53 女 101 2.94 ± 1.61 年齡 <0.001 20-29 歲 34 3.50 ± 1.29A 30-39 歲 40 3.65 ± 1.33A 40-49 歲 43 3.14 ± 1.41A 50-59 歲 33 2.08 ± 1.50B 60 歲以上 32 1.77 ± 1.69B 親友有無罹患ADHD <0.001 無 104 3.17 ± 1.55A 有 44 3.18 ± 1.42A 不知道 34 2.08 ± 1.69B 請撰寫上述表中使用的統計檢定方法?(不用計算)(10 分) 請簡短扼要解釋此研究結果。(10 分) 105年特種考試地方政府公務人員考試試題 34680-34880 全一張 (背面) 等 別: 三等考試 類 科: 衛生行政、衛生技術、漁業技術、養殖技術 科 目: 生物統計學

退除役軍人轉任 15 題

最近臨床感興趣的議題是使用新開發藥物減少24 小時內發生心肌梗塞 患者的梗塞面積。假設我們知道在未經治療的患者中,平均梗塞面積為 25(ck-g-EQ/m2),標準差為10(ck-g-EQ/m2)。在8 名接受此新開發藥物治 療的患者中,平均梗塞面積為16(ck-g-EQ/m2)。 請問此新開發藥物對減少梗塞面積有顯著減少嗎?請以單尾檢定進 行分析,並報告p 值。(10 分) 如果接受此新開發藥物治療的族群患者真實的平均梗塞面積為 20(ck-g-EQ/m2),且=10(ck-g-EQ/m2),請以單尾檢定計算此檢定的 檢力(power)。(15 分) (備註:P(Z0.23)=0.409 ,P(Z1.645)=0.05 ,P(Z1.96)=0.025 , P(Z2.55)=0.005)
假設有藥商宣稱其新產品的藥物在治療高血壓的有效率為80%,今實際 試驗500 位高血壓患者,結果有375 位高血壓患者在服用後血壓控制為 正常,若欲檢測實際的試驗結果是否與藥商所宣稱的效果相符合,請進 行檢定。(20 分) (備註:ݔ଴.଴ଶହ,ଵ ଶ = 5.02,ݔ଴.଴ଶହ,ଶ ଶ = 7.38,ݔ଴.଴ଶହ,ଷ ଶ = 9.35,ݔ଴.଴ହ,ଵ ଶ = 3.84, ݔ଴.଴ହ,ଶ ଶ = 5.99,ݔ଴.଴ହ,ଷ ଶ = 7.81)
有一臨床試驗評估補充鈣(calcium)與骨化三醇(calcitriol)治停經後骨 質疏鬆症的相對療效。骨化三醇是一種能夠增加胃腸道對鈣吸收的藥 物。由於治療的不良反應,包括口渴、皮膚問題和神經系統症狀,許多 患者提早退出了這項研究。相關數據如下。 治療方式 退出試驗 總計 是 否 骨化三醇 27 287 314 補充鈣 20 288 308 總計 47 575 622 計算每種治療組中退出研究的受試者樣本比例。(5 分) 在0.05 的顯著性水準下,檢驗虛無假設,即治療組與退出研究之間沒 有關聯。得出什麼結論?(10 分) 請計算並解釋OR 和其95%信賴區間。(10 分) (備註:ݔ଴.଴ଶହ,ଵ ଶ = 5.02,ݔ଴.଴ଶହ,ଶ ଶ = 7.38,ݔ଴.଴ଶହ,ଷ ଶ = 9.35,ݔ଴.଴ହ,ଵ ଶ = 3.84, ݔ଴.଴ହ,ଶ ଶ = 5.99,ݔ଴.଴ହ,ଷ ଶ = 7.81)
假設患有某碳水化合物吸收不良症候群的嬰兒被餵食新配方奶粉後,其 增加體重的分布大致呈常態分布,平均磅數為 10.5  和標準差磅數為 13.1  。 有多少百分比嬰兒增加體重介在5.1 到15.2 磅之間?(10 分) 如果從該母群體中重複抽取樣本數25 的樣本,則平均增重在5.1 到 15.2 磅之間的樣本比例是多少?(10 分) 要使95%的樣本增加體重均值位於母群體增加體重均值的2 磅以內, 樣本必須要多大?(即介於10.5-2 和10.5+2 磅之間)(10 分) (備註:P(Z≥0.41)=0.341,P(Z≥0.36)=0.359,P(Z≥1.64)=0.051, P(Z≥1.79)=0.037,P(Z≥1.96)=0.025,P(Z≥2.06)=0.020)
9 10 治療前的視力分數 3 4 2 4 5 3 4 5 3 3 治療後的視力分數 4 4 5 5 6 3 7 6 3 5 下表為某藥廠在各地區所投入的廣告費用(單位:仟元)與藥品銷售量 (以處方簽的數量作為銷售量的指標,單位:仟張處方簽)的數據。研究 者計算廣告費用(x)與處方簽數量(y)的皮爾森相關係數(r)=0.708; 廣告費用(x)對處方簽數量(y)做迴歸分析得到的方程式為: ˆ 2.79 y intercept x   。請計算x 與y 之間的判定係數(coefficient of determination),以及迴歸方程式的截距(intercept),並請根據計算出來的 數值分別解釋「判定係數」與「迴歸方程式截距」所代表的意義。(25 分) 廣告費用(x) 9 2 3 4 2 5 9 10 處方簽數量(y) 85 52 55 68 67 86 83 73 某臨床試驗採用病例交叉設計(case-crossover design)來探討甲與乙兩 種藥膏對濕疹的療效。每一位受試者均須接受甲、乙兩種藥膏的治療, 並觀察其症狀緩解的情況。參與該臨床試驗的生物統計學家將研究結果 的數據以表A 的方式呈現。不過計畫主持人卻希望能將表A 的數據轉 換成表B 的方式來呈現。請您協助計算表B 的4 個數值x y z w。同時, 請您依據表A 與表B 的數據,分別計算相對於甲藥膏,乙藥膏之症狀緩 解勝算比(odds ratio)。最後,你會建議本臨床試驗應該是要使用表A 或 表B的數據呈現方式來檢定藥膏種類與症狀緩解之間的相關性?請敘述 您的理由,以及您建議使用的統計檢定方法(註:僅需指出您所建議的 統計檢定方法名稱,不需要實際進行統計檢定步驟)。(25 分) 表A 乙藥膏 症狀緩解 症狀沒有緩解 甲藥膏 症狀緩解 25 11 症狀沒有緩解 42 22 表B 症狀緩解 是 否 藥膏種類 甲藥膏 x y 乙藥膏 z w
根據英國衛生部門的報告,英國5-12 歲國小兒童每晚看電視的平均時間 為196 分鐘。今有一隨機抽樣調查臺灣地區20 位同年齡層的國小兒童, 平均每晚看電視的平均時間為166 分鐘,標準差為29 分鐘。(顯著水準 05 .0 = α ) 請問臺灣地區國小兒童與英國國小兒童每晚看電視的時間是否有差 異?(10 分) 臺灣地區國小兒童每晚看電視平均時間的95%信賴區間?(10 分)
某民意調查想要了解城市與鄉村居民贊成興建文化中心的比例是否不 同。從城市居民中隨機抽樣2000 名,結果有1200 名贊成,從鄉村居民 中隨機抽樣500 名,結果有240 名贊成。(顯著水準 05 .0 = α ) 請問城市與鄉村居民贊成興建文化中心比例差值的95%信賴區間? (10 分) 由此信賴區間,你認為城市居民贊成興建文化中心的比例是否高於鄉 村居民?(10 分)
有一大學教授使用3 種不同教學方法教學,欲評估三種教學方法的效果 是否有差異,將33 名學生隨機分派為3 組,每組11 人,所得的學生期 末成績如下: 方法A:平均數=22.72 分,標準差=2.87 分 方法B:平均數=29.82 分,標準差=3.95 分 方法C:平均數=20.27 分,標準差=2.05 分 請以顯著水準 05 .0 = α ,檢定三種教學方法的教學效果是否相等?(20 分) 全國工廠的工人?(顯著水準 05 .0 =
某工廠的員工懷疑他們的工作環境不安全,可能導致他們較易罹患呼吸 道疾病。他們與工廠的環安室聯絡,環安室隨即展開調查,隨機抽取100 位工人,並詢問他們去年因呼吸道疾病而請假的天數,結果顯示此100 位工人去年因呼吸道疾病而請假的平均天數為15 天。根據勞動部的調 查,全國所有工廠工人,一年因呼吸道疾病而請假的平均天數為12 天, 標準差為7.5 天,請問此工廠工人因呼吸道疾病而請假的天數是否高於 α )(20 分)
政治學者一向對於電視政見辯論會是否會影響民眾的投票結果非常有 主黨的有28 位 持共和黨的有55 位 ?(顯著水準 興趣。隨機抽取137 位民眾,詢問他們準備投票給民主黨或共和黨;政 見辯論會後,對相同的137 位民眾詢問相同的問題,政見辯論前及後之 投票意願如下: 辯論前後均支持民 辯論前後均支持共和黨的有27 位 辯論前原支持民主黨,辯論後改支 辯論前原支持共和黨,辯論後改支持民主黨的有27 位 請問電視政見辯論前及後,民眾投票的意願是否有改變 05 .0 = α )(20 分)
標準常態分布的中位數(Median)及第5 個百分位數(5% Percentile)各為多少? (10 分)
某衛生單位想了解食品廠某添加物超標的情況,全臺灣總共抽取100 件樣品,其中8 件超過標準。已知三年前曾經做過大規模的調查,該添加物超標率為10%,想知道 本次抽檢的結果是否表示臺灣該添加物超標的情況明顯降低。請檢定臺灣該添加物 超標的比率是否比10%為低。顯著水準設定為0.01。 請寫出虛無假說及對立假說,並計算檢定統計量。(10 分) 臨界值或P value 可能的範圍為多少?請判讀檢定結果。(10 分)
某調查想了解兩個產業的職場工作人員的身心壓力狀況,以問卷量表分數評估,分 數越高代表壓力越大,已知壓力分數在群體中為常態分布。A 及B 產業各抽取20 人。 產業A 平均值與標準差為55 與9,產業B 平均值與標準差為50 與8。以單因子變異 數分析(One-way ANOVA)分析比較A , B 兩個產業工作人員的身心壓力分數平均值 是否相同。顯著水準設定為0.05。 Source 自由度 Sum of Square Mean Square F P value Between(組間) (a) 312.5 (c) (e) 0.043 Within(組內) (b) (d) 72.5 Total 39 請寫出虛無假說及對立假說,並完成此ANOVA 表(a)-(e)。(10 分) 請判讀檢定結果。(10 分) 除了單因子變異數分析,請再舉出2 個統計方法執行上述假說檢定。[此小題不 用計算](10 分) 106年公務人員特種考試警察人員、一般警察 人員考試及106年特種考試交通事業鐵路 人員、退除役軍人轉任公務人員考試試題 全一張 (背面) 考試別: 退除役軍人轉任公務人員考試 等 別: 三等考試 類科別: 衛生行政 科 目: 生物統計學
某介入試驗將受試者分為兩組,其中100 人施以新治療方法,10 人有不良反應,另 外100 人施以傳統治療方法,5 人有不良反應。請檢定治療方法與不良反應之間是否 有關聯?顯著水準設定為0.05。 請寫出虛無假說及對立假說,並計算檢定統計量。(10 分) 臨界值或P value 可能的範圍為多少?請判讀檢定結果。(10 分) 此檢定最大可容忍犯的第一型錯誤(Type I error)機率為多少?(5 分)
請舉一例說明McNemar test 的適用情況及資料型式。(15 分)