lawpalyer logo

統計學考古題|歷屆國考試題彙整

橫跨多種國家考試的統計學歷屆試題(選擇題 + 申論題)

年份:

農業行政 35 題

假設X 與Y 的二元機率密度函數為(每小題4 分,共20 分) f(x, y)= C(x+2y) 0≦x ≦1; 0 ≦y ≦1 =0 其他 計算C 值。 計算X 的期望值。 計算機率P(X>0.5)。 計算Y 的期望值。 計算Y 大於1/3 的機率。
藉由過去數年的資料蒐集與分析,某段道路發生交通事故的次數,為 每星期平均2 次的卜瓦松分配(Poisson distribution)。試問:(計算 至小數點後4 位)(每小題10 分,共20 分) 在12 月第一個星期的時間內,此段道路上發生2 次及2 次以上交 通事故之機率。 在12 月最後二個星期的時間內,此段道路上發生1 次及1 次以下 交通事故之機率。
三家A、B、C 品牌之洗衣機用戶,各隨機抽取400、600 和800 人, 調查其下次會再買同一品牌洗衣機之意願。調查數據如下: 意願\品牌 A B C 願意 100 300 600 不願意 300 300 200 總和 400 600 800 請檢定三家用戶下次購買相同品牌之洗衣機比例是否全部相等。 ⑴列出虛無假設H0 和對立假設H1。(3 分) ⑵寫出檢定統計量及其在H0 為真下的分配。(5 分) ⑶以臨界值方法決定檢定結果。顯著水準為0.05。(3 分) ⑷計算p 值,並據以決定檢定結果。顯著水準為0.05。(5 分) 若只有A 和B 兩種品牌,請檢定A 和B 品牌用戶下次購買相同品 牌的比例是否相等。 ⑴列出H0 和H1。(3 分) ⑵請使用和不同的檢定統計量,寫出其在H0 為真下的分配。請 說明何以為此分配。(6 分) ⑶計算p 值,並據以決定檢定結果。顯著水準為0.05。(5 分) 23320 23420
依據調查,臺灣18 歲以下青少年近視比率為87.2%。若對全國18 歲 以下青少年進行簡單隨機抽樣,試回答下列問題: 隨機抽取8 人,隨機變數X 代表近視的人數,寫出X 的機率分配 函數。(6 分) 承,計算會抽到超過2 人為近視的機率(亦即P(X > 2))。(6 分) 隨機抽取1000 人,剛好880 人為近視的機率(請以常態分配機率 近似)。(12 分) 若隨機變數Y 為抽到第十位為近視者的人數,寫出Y 的機率分配 函數。(6 分) 31920 50620
下表是全國姓名統計前五大姓氏(及其他)的全國占比,及從臺北市 隨機抽取2694 人,其姓氏之分布情形。 姓氏 全國比例(%) 臺北市(人) 陳 11.21 304 林 8.33 217 黃 6.00 143 張 5.30 147 李 5.13 146 其他 64.03 1737 總計 100.00 2694 試問: 建構臺北市姓氏為陳者的母體比例之99%區間估計。(8 分) 在顯著水準為0.05 下,檢定臺北市姓氏為黃者的母體比例是否小於 全國姓氏為黃者的比例。(10 分) 在顯著水準為0.05 下,檢定臺北市各姓氏的比例是否與全國各姓氏 的比例一致。(12 分)
工程師想知道供應商生產的電池平均壽命是否小於240 小時。隨機 抽取電池36 件(n=36),其樣本平均值為235 小時。 假設電池壽命服從常態分配且母體標準差為12 小時。 請檢定電池平均壽命是否低於240 小時。顯著水準為0.1。(5 分) 續上題,寫出檢定統計量分配的拒絕區之臨界值,並寫出此臨界值 對應之樣本平均值。(4 分) 若真實的電池壽命平均值分別為236 和235 小時,請分別計算他 們的型II 誤差機率及檢定力。(8 分) 若只有隨機抽取的電池改為100 件(n=100),其他不變。若真實的 電池壽命平均值分別為236 和235 小時,請分別計算他們的型II 誤差機率及檢定力。顯著水準為0.1。(8 分)
A 和B 兩家公司皆生產相同規格之端子。分別自A 和B 公司隨機抽 取端子並衡量其膜厚,數據如表所示。 公司 膜厚(單位:mm) A
某縣政府想評估四種流程(A、B、C、D 表示之)辦理某一業務的效 率,在申請該項業務的民眾中,各隨機抽取6 位民眾至每一種流程, 觀測其完成程序所需的時間,彙整於下表: 辦理流程 程序完成所需時間(分) 平均 標準差 A 132.0 21.10 B 141.5 19.89 C 149.0 6.22 D 151.5 7.14 在顯著水準為0.05 下,檢定各辦理流程完成程序的平均所需時間是 否相等。(15 分) 詳細說明進行之分析所需的假設。(5 分) 31920 50620 卡方分配表 Table of the Chi-square Distribution 31920 50620 標準常態分配表 31920 50620 F 分配機率表
3 5 7
4 B
7 9 9
6 假設兩家生產的端子膜厚變異數相等,請寫出膜厚變異數之估計量 及估計值。(6 分) 請寫出兩家膜厚平均值差之估計量及估計值。(4 分) 續題,欲比較兩家膜厚之平均值是否有差異,請問該用什麼統計 方法?結論為何?顯著水準為0.05。假設兩家膜厚皆服從常態分 配。(10 分) 續題,請估計兩家膜厚平均值差之95%信賴區間。(5 分) 23320 23420 附表一:Z 值表 23320 23420 附表二:t 值表 23320 23420 附表三:X^2 值表
5.0239 3.8415 5 2.571 2.015
假設全體國民血液中鈉離子的濃度接近常態分布,其平均值(µ)為140 milliequivalents per liter(mEq/L),標準差(σ)為3.5,請回答下列問題: (每小題10 分,共20 分) 假設今隨機抽樣25 位民眾測其血液中鈉離子,請問這25 位民眾血液 中鈉離子的平均濃度高於140.5 mEq/L 的機率約為何? 在母體的標準差(σ)未知情形下,假設今隨機抽樣25 名民眾,其樣 本的標準差(s)為5。請問這25 位民眾血液中鈉離子的平均濃度介 於138~142 mEq/L 之間的機率為何?
令隨機變數 1,..., n X X 彼此獨立且具有相同分配: 1 ( ) f x x    , 0 1 x  , 0    請回答下列問題:(每小題10 分,共20 分) 試求的最大概似估計子(MLE)。 試求題估計子的一階動差。
7.3778 5.9915 6 2.447 1.943
陳老師為了解創新教學方法是否能提升學生學習成效,於是他針對課堂 7 位學生,分別記錄使用創新教學方法前及使用創新教學方法後的測驗 成績,成績越高代表學習成效越好,資料如下: 學生 1 2 3
9.3484 7.8147 10 2.228 1.812
11.1433 9.4877 11 2.201 1.796
12.8325 11.0705 12 2.179 1.782
14.4494 12.5916 一、有一位理財規劃專員為客戶規劃了一個投資組合,其設計為0.7 的比例 投資A 公司股票,0.3 的比例投資B 公司股票。由歷年資料計算得知投 資A 報酬率的平均數為12%,標準差為15%;投資B 報酬率的平均數 為5%,標準差為8%。回答問題至,寫出計算過程且四捨五入至小 數點後第4 位。 這個投資組合報酬率的平均數為多少?(4 分) 若投資A 和投資B 報酬率之間的相關係數為−0.3,則這個投資組合的 報酬率離平均數的1 個正、負標準差的上、下限數值各是多少?(10 分) 若問題得到的下限數值為不低於−0.05,理專就會建議客戶可以考 慮採納此投資組合,理專是根據什麼理由採取這種建議?(5 分) 32920 為評估資金「全部投資A」,或「全部投資B」,或「採取0.7 的比例投 資A 以及0.3 的比例投資B 的投資組合」三種策略的風險,請計算此 三種策略的變異係數。(6 分) 二、若已知簡單線性迴歸模型為 ݕ௜= ߙ+ ߚݔ௜+ ߝ௜, ݅= 1,2, ⋯, ݊,假設ߝ௜為相互獨立且具有共同分配 N(0, ߪଶ)。令ݕ௜的最小平方估計值為ݕො௜= ܽ+ ܾݔ௜,回答以下問題: 令ݑ௜= ݕ௜−ݕത,ݒ௜= ݔ௜−ݔ̅,及此變數變換後之ݑ௜的最小平方估計值為 ݑො௜= ܿ+ ݀ݒ௜,其中ݔ̅和ݕത分別表示݊個ݔ௜和݊個ݕ௜的樣本平均數。請推導 出c 和d。(5 分) 令ݖ௜= ௬೔ି௬ത ௦೤,ݓ௜= ௫೔ି௫̅ ௦ೣ,及此變數變換後之ݖ௜的最小平方估計值為 ݖ̂௜= ݃+ ℎݓ௜,其中ݏ௫和ݏ௬分別表示݊個ݔ௜和ݕ௜的樣本標準差。請推導出 ݃和ℎ。(5 分) 已知ݔ௜的資料結構可以分成二部分,其中第一個部分的݊ଵ個資料點的 數值皆為1,即ݔ௜= 1, ݅= 1,2, ⋯, ݊ଵ;第二個部分的݊ଶ個資料點的數值 皆為0,即ݔ௜= 0, ݅= ݊ଵ+ 1, ݊ଵ+ 2, ⋯, ݊,݊= ݊ଵ+ ݊ଶ。請推導出ܽ 和ܾ。(10 分) 三、有一個手機廠商準備推出一款新式樣的手機A,為了解市場接受程度, 進行以下所述的顧客偏好度調查:隨機選取100 位女性及100 位男性, 對二組內的每一個人給予他們一款A 式樣手機和一款競爭廠商的B 式 樣手機,詢問他們偏好那一款手機;結果顯示女性有85 位偏好A 式樣, 男性有75 位偏好A 式樣。以݌ଵ表示女性群體對A 手機的偏好度,݌ଶ表 示男性群體對A 手機的偏好度,在顯著水準為0.05 下,回答以下問題: 由二項分配觀點出發,在可以引用中央極限定理之下,以檢定統計量 Z 檢定女性和男性對A 式樣手機的偏好度有無差異。(8 分) 由列聯表分析觀點出發,以卡方檢定統計量檢定「女性組內之A 與非 A 的比例」與「男性組內之A 與非A 的比例」有無差異。(8 分) 題之卡方檢定屬於「適合度檢定」、「齊一性檢定」、或「獨立性 檢定」中之何種檢定,說明你的看法。(4 分) 32920 四、為瞭解大學畢業生投入A 產業與B 產業的起始月薪是否有顯著差異, 有一家市場調查公司自二個產業的新進人員母體中隨機抽取了以下樣 本數為6 的A、B 二組起始月薪樣本資料(單位:千元): A產業 29 31 32 32 33 35 B產業 32 33 34 35 41 41 假設二母體資料分配都是常態分配且二分配的變異數相等,根據這個假 設,回答以下四個子問題: 計算出虛無假設:「二母體資料的平均數沒有差異」下的t 檢定統計量 的估計值,計算過程必須列出。(10 分) 利用單因子變異數分析方法再次檢定「二母體資料的平均數是否有差 異」,計算出變異數分析(ANOVA)表中的每一個數值即可,計算過 程必須列出。(10 分) 令Z 表示標準常態分配,U 表示自由度n 的卡方分配,W 表示自由度 m 的卡方分配,且Z、U、W 三者彼此相互獨立。寫出檢定統計量t 與 F 的定義,並根據這二個定義寫出這二個檢定統計量的關係表達式。 (10 分) 利用題的結果及所附三個統計分配的右尾機率表,在顯著水準5% 之下,寫出題中利用單因子變異數分析方法檢定「二母體資料的平 均數是否有差異」的拒絕域及結論。(5 分)
使用前 84 72 61 78 83 86 71 使用後 90 86 72 80 85 88 80 在0.05 的顯著水準下,請利用p 值法檢定是否創新教學方法會提高學生 學習成效?(15 分) 31920 50520 四、使用了三種肥料後農作物的生長高度(cm),如下表所示: A B C 20 27 21 27 24 17 26 21 20 24 25 22 請建立ANOVA 表,並在顯著水準0.1 下檢定三種肥料對農作物的平均 生長高度是否不同?(15 分) 五、醫藥人員想了解服藥的藥量(X)與藥效維持時間(Y)的關係,於是記 錄8 位病人服藥的結果如下: X 2 3 4 2 5 1 3 4 Y 20 20 60 25 75 10 40 60 試用最小平方估計法(LSE)建立一迴歸方程式,來描述藥量對藥效 維持時間的影響。(10 分) 在0.05 的顯著水準下,檢定藥量對藥效維持時間是否有顯著的影響。 (15 分) 此迴歸模型的解釋能力如何?(5 分) 31920 50520 附表1 表中的數值代表對應的z 值 以左,標準常態曲線下方的 面積。例如,z=1.25,累積機 率下0.8944。 累積機率 31920 50520 附表2
(15) 2.13 t  ; 0.05 1 (14) 1.76 t  ; 0.05 3 (15) 1.75 t  P( ) Z z    ; 0.05 1.645 z  ; 0.025 1.96 z  ; 0.0401 1.75 z  ; 0.0985 1.29 z  ; 0.0336 1.83 z  ; 0.0001 4.52 z  ; 0.166 0.97 z  1
(15)
(14)
(15)
令Xଵ, ⋯, X଺表示服從指數分配(Exponential distribution)Exp(ߠ)的隨機樣本, 其機率密度函數為݂(ݔ) = ଵ ఏ݁ିೣ ഇ, ݔ> 0。(每小題8分,共24分) 計算E(Xଵ)。(E:Expectation)(須列出計算過程) 令Y = ∑ ܺ௜ ଺ ௜ୀଵ ,求隨機變數Y的動差母函數(moment generating function),並回答Y的機率分配名稱。(須列出計算過程) 令Yഥ= ∑ ௑೔ ల ೔సభ ଺ ,求隨機變數Yഥ的動差母函數(moment generating function), 並回答Yഥ的機率分配名稱。(須列出計算過程)
P( , )) F F n n     ( ; 0.05(4,30) 2.69 F  ; 0.05 5,30 2.53 ( ) F  ; 0.1 4,30 2.14 ( ) F  ; 0.05 3,20 3.1 ( ) F  50 7.07  ; 15 3.87  ; 60 7.75  ; 30 5.48  ; 1.2 1.095  ; 40 6.32  ; 11.08 3.329  ; 31 5.57  ; 1.056 1.03  一、一家化工廠的管理主管調查該工廠發生誤工事故的數量。根據歷史紀錄 顯示,去年有6%的員工遭遇誤工事故。今年因一項特殊的安全計畫將 使此類事故減少至5%。預估去年發生誤工事故的員工中將有15%之員 工在今年會再發生誤工事故。(每小題5 分,共10 分) 試估算這兩年皆遭遇誤工事故的員工比例為何? 這兩年內至少遭受一次誤工事故的員工比例為何? 二、勞動部的報告指出,所有失業人口的母體中,失業之平均時間為17.5 週, 失業時間之標準差為4 週。令X 代表50 個樣本之平均失業週數。 試問X 的抽樣分配(包括分配與參數)?(6 分) 試問樣本平均值落在母體平均值1 週之內的機率為何?(9 分) 32180
考慮簡單線性迴歸模型,ݕ௜= ߚ଴+ ߚଵݔ௜+ ߳௜, ߳௜݅݅݀ ~ ܰ(0, ߪଶ),ߚመ଴和ߚመଵ分 別為β0與β1之最小平方估計式,計算下列各子題:(每小題10分,共20分) 計算Cov(ݕ,ഥߚመଵ),其中ݕഥ為反應變數Y之平均數,Cov是指共變異數 (Covariance)。 計算Var(ߚመ଴+0.8ߚመଵ),Var是指變異數(Variance)。
一位球場老闆宣稱他的球場地形比較複雜,以至於高爾夫球員打一回合 後會丟失一打或更多的高爾夫球。一位高爾夫球員懷疑這位球場老闆誇 大的宣稱。他蒐集完成一回合的15 位高爾夫球員的隨機樣本,並記錄每 人丟失的高爾夫球數如下: 1,14,8,15,17,10,12,6,14,21,15,9,11,4,8 假設丟失的高爾夫球數服從常態分配。在5%的顯著水準下,以上數據能 否推翻球場老闆誇大的宣稱?(15 分)
有關於汽車碳氫化合物排放量(克/英里)的研究,記錄碳氫化合物排放 量Y(100克/公里),和相對應的累積里程數X(以1000公里為單位)。初步 整理樣本資料如下所示: 2 1 1 1 11 190.2356 212.9375 4086.6461 n n n i i i i i i n x y x           , , , , 2 1 1 4152.344 3808.8281 n n i i i i i y x y       , 。 使用以上資料回答下列問題,請詳細將所使用之公式及計算過程列出。 (每小題9分,共36分) 計算最小平方迴歸線。(計算至小數點後4位數) 迴歸判定係數(ܴଶ)為何? 顯著水準為0.05,檢定迴歸斜率是否顯著異於0.16。 在x=25時,求對應之反應變數Y預測值的95%預測區間。 (10,0.025 9,0.025 10,0.05 9,0.05 2.228 2.262 1.812 1.833 t t t t     , , , ) 33480
某雜誌蒐集兩家超市A 和B 的顧客滿意度評級。每位調查受訪者都被 要求根據多種因素對指定超市進行評分,例如:產品品質、價格、結帳 效率、服務等。整體滿意度得分總結了每位受訪者的評分,分數100 表 示受訪者在所有因素方面都完全滿意。樣本數據整理如下: (每小題15 分,共30 分) A 超市:250 位客戶,整體滿意度平均分數86。 B 超市:300 位客戶,整體滿意度平均分數85。 某雜誌假設兩家超市整體滿意度的母體標準差皆為12,在0.05 顯著 水準下,試以p 值方式檢定兩家超市的整體滿意度平均分數是否有顯 著差異。 試計算兩家超市的整體滿意度平均分數的差異之95%的信賴區間,並 以此信賴區間檢定兩家超市的整體滿意度平均分數是否有顯著差異。
觀察記錄某一城市在最近三個月內(90天)每天汽機車意外事故的次數, 其次數分配如下所示: 意外事故次數 0 1 2 3 4 觀察天數 32 34 17 6 1 檢定每天汽機車意外事故次數是否服從波松(Poisson)分配。 寫出虛無假設與對立假設。(5分) 在顯著水準α=0.05時,寫出檢定統計量、棄卻域和結論。(須列出計算 過程)(15分) ( 2 2 2 2,0.025 3,0.025 4,0.025 7.38 9.35 11.14       , , , 2 2 2 2,0.05 3,0.05 4,0.05 5.99 7.81 9.49       , , ) 波松分配累積機率表 x λ = E(X) 0.5 1.0 2.0 0 0.607 0.368 0.135 1 0.910 0.736 0.406 2 0.986 0.920 0.677 3 0.998 0.981 0.857 4 1.000 0.996 0.947
下列資料是根據國家顧客滿意度指數蒐集的三家公司連續兩年的平均 滿意度分數。假設每家公司每年隨機抽取60 名客戶做為樣本。假設此三 家公司每年滿意度分數的標準差均為6 分。 公司 今年 去年 A 72 75 B 81 83 C 79 80 資料顯示此三家公司今年的滿意度分數均較去年降低。若以α 0.05  進行 假設檢定,試問下降分數須有多大才具有統計顯著性?(15 分) 32180
1.000 0.999 0.983
在完全隨機的設計中,有一個因子包含五個水準,每個水準下都使用了 七個實驗單元。變異數分析表如下: 變異來源 平方合 自由度 均方 F 處理 300 4 誤差 總合 460 試寫下F 值對應之虛無與對立假設,並在α 0.05  的顯著水準下,以p 值 方式進行假設檢定。(15 分)
1.000 1.000 0.995
1.000 1.000 0.999

經建行政 41 題

假設X 與Y 的二元機率密度函數為(每小題4 分,共20 分) f(x, y)= C(x+2y) 0≦x ≦1; 0 ≦y ≦1 =0 其他 計算C 值。 計算X 的期望值。 計算機率P(X>0.5)。 計算Y 的期望值。 計算Y 大於1/3 的機率。
某研究者以樣本數 20 n  的資料建立了一個迴歸模型,已知依變數Y 的 樣本變異數為
藉由過去數年的資料蒐集與分析,某段道路發生交通事故的次數,為 每星期平均2 次的卜瓦松分配(Poisson distribution)。試問:(計算 至小數點後4 位)(每小題10 分,共20 分) 在12 月第一個星期的時間內,此段道路上發生2 次及2 次以上交 通事故之機率。 在12 月最後二個星期的時間內,此段道路上發生1 次及1 次以下 交通事故之機率。
依據調查,臺灣18 歲以下青少年近視比率為87.2%。若對全國18 歲 以下青少年進行簡單隨機抽樣,試回答下列問題: 隨機抽取8 人,隨機變數X 代表近視的人數,寫出X 的機率分配 函數。(6 分) 承,計算會抽到超過2 人為近視的機率(亦即P(X > 2))。(6 分) 隨機抽取1000 人,剛好880 人為近視的機率(請以常態分配機率 近似)。(12 分) 若隨機變數Y 為抽到第十位為近視者的人數,寫出Y 的機率分配 函數。(6 分) 31920 50620
10.53 ys  ,且該模型的殘差平方和(Sum of Squared Errors) 為SSE 30  。 請說明如何利用這些已知的資訊計算出判定係數(Coefficient of Determination) 2 0.85 R  ,並請解釋判定係數所代表的統計意涵。(10 分) 一般而言,若模型能解釋約85%的變異,常被認為是「非常好」的模 型。請就「擬合程度」、「解釋性」與「預測性」三個面向加以討論, 說明高 2 R 並不必然代表模型具有良好的整體表現。(10 分) 二、某疾病在一般族群中的盛行率(發生率)為1%。某快速檢驗的敏感度 (即確實患病者被檢測為陽性的機率)為95%,特異度(即未患病者被檢 測為陰性的機率)為90%。請回答下列問題: 當檢驗結果呈陽性時,個體實際罹患該疾病的條件機率(即「陽性預 測值」,Positive Predictive Value, PPV)為何?請說明完整的計算過程, 並給出具體數值結果。(10 分) 在此例中,若政府大量採用此快速檢驗作為篩檢工具,雖具有快速與 低成本的優點,但也可能導致高誤判率與高社會成本。請具體說明造 成此現象的統計原因,並討論若採用此快速檢驗兩次(兩次都陽性才 認定為陽性),是否能有效降低誤判與社會成本,並說明原因。(10 分) 13450
三家A、B、C 品牌之洗衣機用戶,各隨機抽取400、600 和800 人, 調查其下次會再買同一品牌洗衣機之意願。調查數據如下: 意願\品牌 A B C 願意 100 300 600 不願意 300 300 200 總和 400 600 800 請檢定三家用戶下次購買相同品牌之洗衣機比例是否全部相等。 ⑴列出虛無假設H0 和對立假設H1。(3 分) ⑵寫出檢定統計量及其在H0 為真下的分配。(5 分) ⑶以臨界值方法決定檢定結果。顯著水準為0.05。(3 分) ⑷計算p 值,並據以決定檢定結果。顯著水準為0.05。(5 分) 若只有A 和B 兩種品牌,請檢定A 和B 品牌用戶下次購買相同品 牌的比例是否相等。 ⑴列出H0 和H1。(3 分) ⑵請使用和不同的檢定統計量,寫出其在H0 為真下的分配。請 說明何以為此分配。(6 分) ⑶計算p 值,並據以決定檢定結果。顯著水準為0.05。(5 分) 23320 23420
政府想知道年資超過10 年的計程車司機月收入是否高於4.9 萬。隨機抽 取年資超過10 年的資深司機20 位,月收入(萬元)如下(已由小到大): 2.16, 2.54, 2.78, 3.62, 3.88, 4.26, 4.70, 4.80, 4.92, 5.00, 5.08, 5.54, 6.02, 6.12, 6.46, 6.66, 6.94, 7.76, 8.06, 11.00 請根據上述數據,以 0.05  的顯著水準,討論並完成下列分析與檢定: 若接受資料為近似常態,現欲採用母體平均數檢定: 0 : 4.9 H  , : 4.9 a H  直觀而言,我們以樣本平均X 作為母體平均數的估計,因此可設 { } X c  為拒絕域。請給出c 的明確式子(包含樣本變異數 2 S 、樣本數 以及分布分位數),並說明其原理。接著,利用本資料判定此拒絕域是 否成立,即是否拒絕 0 : 4.9 H  。(20 分) 若資料分布明顯偏離常態,可考慮採中位數m 檢定(sign test): 0 : 4.9 H m  , : 4.9 a H m  請說明此檢定所使用的統計量、p 值的計算,並就本資料說明是否拒 絕 0 H 。(20 分)
工程師想知道供應商生產的電池平均壽命是否小於240 小時。隨機 抽取電池36 件(n=36),其樣本平均值為235 小時。 假設電池壽命服從常態分配且母體標準差為12 小時。 請檢定電池平均壽命是否低於240 小時。顯著水準為0.1。(5 分) 續上題,寫出檢定統計量分配的拒絕區之臨界值,並寫出此臨界值 對應之樣本平均值。(4 分) 若真實的電池壽命平均值分別為236 和235 小時,請分別計算他 們的型II 誤差機率及檢定力。(8 分) 若只有隨機抽取的電池改為100 件(n=100),其他不變。若真實的 電池壽命平均值分別為236 和235 小時,請分別計算他們的型II 誤差機率及檢定力。顯著水準為0.1。(8 分)
下表是全國姓名統計前五大姓氏(及其他)的全國占比,及從臺北市 隨機抽取2694 人,其姓氏之分布情形。 姓氏 全國比例(%) 臺北市(人) 陳 11.21 304 林 8.33 217 黃 6.00 143 張 5.30 147 李 5.13 146 其他 64.03 1737 總計 100.00 2694 試問: 建構臺北市姓氏為陳者的母體比例之99%區間估計。(8 分) 在顯著水準為0.05 下,檢定臺北市姓氏為黃者的母體比例是否小於 全國姓氏為黃者的比例。(10 分) 在顯著水準為0.05 下,檢定臺北市各姓氏的比例是否與全國各姓氏 的比例一致。(12 分)
某縣政府想評估四種流程(A、B、C、D 表示之)辦理某一業務的效 率,在申請該項業務的民眾中,各隨機抽取6 位民眾至每一種流程, 觀測其完成程序所需的時間,彙整於下表: 辦理流程 程序完成所需時間(分) 平均 標準差 A 132.0 21.10 B 141.5 19.89 C 149.0 6.22 D 151.5 7.14 在顯著水準為0.05 下,檢定各辦理流程完成程序的平均所需時間是 否相等。(15 分) 詳細說明進行之分析所需的假設。(5 分) 31920 50620 卡方分配表 Table of the Chi-square Distribution 31920 50620 標準常態分配表 31920 50620 F 分配機率表
某公司欲了解其品牌產品的平均使用年限,隨機抽取樣本7 件,其使用 年限(單位:年)如:5, 7, 4, 4, 5, 4, 6 請試著以不偏的樣本偏態係數(skewness)來說明該分布是否近似常 態。(10 分) 根據中央極限定理(Central Limit Theorem, CLT),說明在本例樣本數 7 n  的情況下,若直接以常態近似來建立平均數信賴區間,會產生什 麼問題?產生的問題可以怎麼處理?(10 分) 註: 若隨機變數 1 ~ n T t 分布,則(1 )   分位數 1 , 1 n t   定義為 1 , 1 ( ) 1 n P T t       。常見的數值有 0.95,19 1.729 t  , 0.975,19 2.093 t  , 0.95,20 1.725 t  ,0.975,20 2.086 t  若隨機變數 ~ (0,1) Z N 分布,則(1 )   分位數 1z   定義為 1 ( ) 1 P Z z      。常見的數值有 0.95 1.645 z  , 0.975 1.96 z 
A 和B 兩家公司皆生產相同規格之端子。分別自A 和B 公司隨機抽 取端子並衡量其膜厚,數據如表所示。 公司 膜厚(單位:mm) A
3 5 7
4 B
7 9 9
6 假設兩家生產的端子膜厚變異數相等,請寫出膜厚變異數之估計量 及估計值。(6 分) 請寫出兩家膜厚平均值差之估計量及估計值。(4 分) 續題,欲比較兩家膜厚之平均值是否有差異,請問該用什麼統計 方法?結論為何?顯著水準為0.05。假設兩家膜厚皆服從常態分 配。(10 分) 續題,請估計兩家膜厚平均值差之95%信賴區間。(5 分) 23320 23420 附表一:Z 值表 23320 23420 附表二:t 值表 23320 23420 附表三:X^2 值表
假設全體國民血液中鈉離子的濃度接近常態分布,其平均值(µ)為140 milliequivalents per liter(mEq/L),標準差(σ)為3.5,請回答下列問題: (每小題10 分,共20 分) 假設今隨機抽樣25 位民眾測其血液中鈉離子,請問這25 位民眾血液 中鈉離子的平均濃度高於140.5 mEq/L 的機率約為何? 在母體的標準差(σ)未知情形下,假設今隨機抽樣25 名民眾,其樣 本的標準差(s)為5。請問這25 位民眾血液中鈉離子的平均濃度介 於138~142 mEq/L 之間的機率為何?
5.0239 3.8415 5 2.571 2.015
令隨機變數 1,..., n X X 彼此獨立且具有相同分配: 1 ( ) f x x    , 0 1 x  , 0    請回答下列問題:(每小題10 分,共20 分) 試求的最大概似估計子(MLE)。 試求題估計子的一階動差。
7.3778 5.9915 6 2.447 1.943
陳老師為了解創新教學方法是否能提升學生學習成效,於是他針對課堂 7 位學生,分別記錄使用創新教學方法前及使用創新教學方法後的測驗 成績,成績越高代表學習成效越好,資料如下: 學生 1 2 3
9.3484 7.8147 10 2.228 1.812
11.1433 9.4877 11 2.201 1.796
12.8325 11.0705 12 2.179 1.782
14.4494 12.5916 一、有一位理財規劃專員為客戶規劃了一個投資組合,其設計為0.7 的比例 投資A 公司股票,0.3 的比例投資B 公司股票。由歷年資料計算得知投 資A 報酬率的平均數為12%,標準差為15%;投資B 報酬率的平均數 為5%,標準差為8%。回答問題至,寫出計算過程且四捨五入至小 數點後第4 位。 這個投資組合報酬率的平均數為多少?(4 分) 若投資A 和投資B 報酬率之間的相關係數為−0.3,則這個投資組合的 報酬率離平均數的1 個正、負標準差的上、下限數值各是多少?(10 分) 若問題得到的下限數值為不低於−0.05,理專就會建議客戶可以考 慮採納此投資組合,理專是根據什麼理由採取這種建議?(5 分) 32920 為評估資金「全部投資A」,或「全部投資B」,或「採取0.7 的比例投 資A 以及0.3 的比例投資B 的投資組合」三種策略的風險,請計算此 三種策略的變異係數。(6 分) 二、若已知簡單線性迴歸模型為 ݕ௜= ߙ+ ߚݔ௜+ ߝ௜, ݅= 1,2, ⋯, ݊,假設ߝ௜為相互獨立且具有共同分配 N(0, ߪଶ)。令ݕ௜的最小平方估計值為ݕො௜= ܽ+ ܾݔ௜,回答以下問題: 令ݑ௜= ݕ௜−ݕത,ݒ௜= ݔ௜−ݔ̅,及此變數變換後之ݑ௜的最小平方估計值為 ݑො௜= ܿ+ ݀ݒ௜,其中ݔ̅和ݕത分別表示݊個ݔ௜和݊個ݕ௜的樣本平均數。請推導 出c 和d。(5 分) 令ݖ௜= ௬೔ି௬ത ௦೤,ݓ௜= ௫೔ି௫̅ ௦ೣ,及此變數變換後之ݖ௜的最小平方估計值為 ݖ̂௜= ݃+ ℎݓ௜,其中ݏ௫和ݏ௬分別表示݊個ݔ௜和ݕ௜的樣本標準差。請推導出 ݃和ℎ。(5 分) 已知ݔ௜的資料結構可以分成二部分,其中第一個部分的݊ଵ個資料點的 數值皆為1,即ݔ௜= 1, ݅= 1,2, ⋯, ݊ଵ;第二個部分的݊ଶ個資料點的數值 皆為0,即ݔ௜= 0, ݅= ݊ଵ+ 1, ݊ଵ+ 2, ⋯, ݊,݊= ݊ଵ+ ݊ଶ。請推導出ܽ 和ܾ。(10 分) 三、有一個手機廠商準備推出一款新式樣的手機A,為了解市場接受程度, 進行以下所述的顧客偏好度調查:隨機選取100 位女性及100 位男性, 對二組內的每一個人給予他們一款A 式樣手機和一款競爭廠商的B 式 樣手機,詢問他們偏好那一款手機;結果顯示女性有85 位偏好A 式樣, 男性有75 位偏好A 式樣。以݌ଵ表示女性群體對A 手機的偏好度,݌ଶ表 示男性群體對A 手機的偏好度,在顯著水準為0.05 下,回答以下問題: 由二項分配觀點出發,在可以引用中央極限定理之下,以檢定統計量 Z 檢定女性和男性對A 式樣手機的偏好度有無差異。(8 分) 由列聯表分析觀點出發,以卡方檢定統計量檢定「女性組內之A 與非 A 的比例」與「男性組內之A 與非A 的比例」有無差異。(8 分) 題之卡方檢定屬於「適合度檢定」、「齊一性檢定」、或「獨立性 檢定」中之何種檢定,說明你的看法。(4 分) 32920 四、為瞭解大學畢業生投入A 產業與B 產業的起始月薪是否有顯著差異, 有一家市場調查公司自二個產業的新進人員母體中隨機抽取了以下樣 本數為6 的A、B 二組起始月薪樣本資料(單位:千元): A產業 29 31 32 32 33 35 B產業 32 33 34 35 41 41 假設二母體資料分配都是常態分配且二分配的變異數相等,根據這個假 設,回答以下四個子問題: 計算出虛無假設:「二母體資料的平均數沒有差異」下的t 檢定統計量 的估計值,計算過程必須列出。(10 分) 利用單因子變異數分析方法再次檢定「二母體資料的平均數是否有差 異」,計算出變異數分析(ANOVA)表中的每一個數值即可,計算過 程必須列出。(10 分) 令Z 表示標準常態分配,U 表示自由度n 的卡方分配,W 表示自由度 m 的卡方分配,且Z、U、W 三者彼此相互獨立。寫出檢定統計量t 與 F 的定義,並根據這二個定義寫出這二個檢定統計量的關係表達式。 (10 分) 利用題的結果及所附三個統計分配的右尾機率表,在顯著水準5% 之下,寫出題中利用單因子變異數分析方法檢定「二母體資料的平 均數是否有差異」的拒絕域及結論。(5 分)
使用前 84 72 61 78 83 86 71 使用後 90 86 72 80 85 88 80 在0.05 的顯著水準下,請利用p 值法檢定是否創新教學方法會提高學生 學習成效?(15 分) 31920 50520 四、使用了三種肥料後農作物的生長高度(cm),如下表所示: A B C 20 27 21 27 24 17 26 21 20 24 25 22 請建立ANOVA 表,並在顯著水準0.1 下檢定三種肥料對農作物的平均 生長高度是否不同?(15 分) 五、醫藥人員想了解服藥的藥量(X)與藥效維持時間(Y)的關係,於是記 錄8 位病人服藥的結果如下: X 2 3 4 2 5 1 3 4 Y 20 20 60 25 75 10 40 60 試用最小平方估計法(LSE)建立一迴歸方程式,來描述藥量對藥效 維持時間的影響。(10 分) 在0.05 的顯著水準下,檢定藥量對藥效維持時間是否有顯著的影響。 (15 分) 此迴歸模型的解釋能力如何?(5 分) 31920 50520 附表1 表中的數值代表對應的z 值 以左,標準常態曲線下方的 面積。例如,z=1.25,累積機 率下0.8944。 累積機率 31920 50520 附表2
疫苗效力(vaccine efficacy)定義為參加實驗的自願者中,染疫人數中注 射安慰劑(沒有疫苗保護)的百分比。某藥廠開發一款COVID-19 疫苗, 宣稱其疫苗效力為92%。假設該疫苗被核准上市,且該疫苗的施打涵蓋 率約為80%。以2023 年COVID-19 發生率為每10 萬人約5,000 人感染 為基礎,請問施打該疫苗的民眾中染疫的機率有多少?又未施打疫苗的 民眾中,染疫的機率有多少?(20 分)
考慮兩壽命分別為 1 X 及
令Xଵ, ⋯, X଺表示服從指數分配(Exponential distribution)Exp(ߠ)的隨機樣本, 其機率密度函數為݂(ݔ) = ଵ ఏ݁ିೣ ഇ, ݔ> 0。(每小題8分,共24分) 計算E(Xଵ)。(E:Expectation)(須列出計算過程) 令Y = ∑ ܺ௜ ଺ ௜ୀଵ ,求隨機變數Y的動差母函數(moment generating function),並回答Y的機率分配名稱。(須列出計算過程) 令Yഥ= ∑ ௑೔ ల ೔సభ ଺ ,求隨機變數Yഥ的動差母函數(moment generating function), 並回答Yഥ的機率分配名稱。(須列出計算過程)
民意調查機構想要規劃一份問卷調查,調查民眾對於特定議題的支持度 (從不支持到支持以1~10 尺度測量支持的程度)。根據過去的經驗,各 支持尺度的比率如下表: 支持度 1 2
X 的電子零件,假設 1 X 及 2 X 為兩互相獨立且具 平均壽命為1 年的指數分配之隨機變數,若將此兩電子零件串聯在一起, 試問:(每小題10 分,共20 分) 此系統壽命之機率密度函數為何? 承小題,此系統的平均壽命為幾年? 二、某教師設計三種不同的教學方法,想要了解那一種教學方法可以提高學 生的成績,隨機抽取若干學生分別參與這三種教學方法的課程,並於課 程結束後測試學生的學習成果,得其成績分別如下: 教學方法一 教學方法二 教學方法三 94 75 70 86 77 65 91 68 72 82 70 68 81 73 68 84 65 65 84 76 平均值 86 72 68 變異數 23 20 7.6 如果這些資料滿足變異數分析的所有假設,檢定三種教學方法對平均成績 表現是否有顯著不同時,試問:(每小題10 分,共20 分) 根據資料所建立的變異數分析表為何? 若只使用教學方法一和二,試問檢定兩種教學方法對平均成績表現是 否有顯著不同時,則計算出來的T 檢定統計量為何?
考慮簡單線性迴歸模型,ݕ௜= ߚ଴+ ߚଵݔ௜+ ߳௜, ߳௜݅݅݀ ~ ܰ(0, ߪଶ),ߚመ଴和ߚመଵ分 別為β0與β1之最小平方估計式,計算下列各子題:(每小題10分,共20分) 計算Cov(ݕ,ഥߚመଵ),其中ݕഥ為反應變數Y之平均數,Cov是指共變異數 (Covariance)。 計算Var(ߚመ଴+0.8ߚመଵ),Var是指變異數(Variance)。
有關於汽車碳氫化合物排放量(克/英里)的研究,記錄碳氫化合物排放 量Y(100克/公里),和相對應的累積里程數X(以1000公里為單位)。初步 整理樣本資料如下所示: 2 1 1 1 11 190.2356 212.9375 4086.6461 n n n i i i i i i n x y x           , , , , 2 1 1 4152.344 3808.8281 n n i i i i i y x y       , 。 使用以上資料回答下列問題,請詳細將所使用之公式及計算過程列出。 (每小題9分,共36分) 計算最小平方迴歸線。(計算至小數點後4位數) 迴歸判定係數(ܴଶ)為何? 顯著水準為0.05,檢定迴歸斜率是否顯著異於0.16。 在x=25時,求對應之反應變數Y預測值的95%預測區間。 (10,0.025 9,0.025 10,0.05 9,0.05 2.228 2.262 1.812 1.833 t t t t     , , , ) 33480
一位球場老闆宣稱他的球場地形比較複雜,以至於高爾夫球員打一回合 後會丟失一打或更多的高爾夫球。一位高爾夫球員懷疑這位球場老闆誇 大的宣稱。他蒐集完成一回合的15 位高爾夫球員的隨機樣本,並記錄每 人丟失的高爾夫球數如下: 1,14,8,15,17,10,12,6,14,21,15,9,11,4,8 假設丟失的高爾夫球數服從常態分配。在5%的顯著水準下,以上數據能 否推翻球場老闆誇大的宣稱?(15 分)
假設我們有6 筆成對資料( , ) x y ,統計資料為 6 1 21 i i x    , 6 2 1 91 i i x    , 6 1 48 i i y    , 6 2 1 496 i i y    和 6 1 203 i i i x y    ,利用這6 筆資料建構簡單線性迴 歸模型 0 1 1, 2, , 6 i i i y x i         , ,在滿足迴歸模型誤差項 i平均值 為0 及變異數為 2 之常態的基本假設下,試問利用最小平方法求取 1 的 估計量 1ˆ(estimator),則:  1ˆ的抽樣分配(sampling distribution)為何?(20 分)  1 的最小平方估計值為何?(5 分)
觀察記錄某一城市在最近三個月內(90天)每天汽機車意外事故的次數, 其次數分配如下所示: 意外事故次數 0 1 2 3 4 觀察天數 32 34 17 6 1 檢定每天汽機車意外事故次數是否服從波松(Poisson)分配。 寫出虛無假設與對立假設。(5分) 在顯著水準α=0.05時,寫出檢定統計量、棄卻域和結論。(須列出計算 過程)(15分) ( 2 2 2 2,0.025 3,0.025 4,0.025 7.38 9.35 11.14       , , , 2 2 2 2,0.05 3,0.05 4,0.05 5.99 7.81 9.49       , , ) 波松分配累積機率表 x λ = E(X) 0.5 1.0 2.0 0 0.607 0.368 0.135 1 0.910 0.736 0.406 2 0.986 0.920 0.677 3 0.998 0.981 0.857 4 1.000 0.996 0.947
某雜誌蒐集兩家超市A 和B 的顧客滿意度評級。每位調查受訪者都被 要求根據多種因素對指定超市進行評分,例如:產品品質、價格、結帳 效率、服務等。整體滿意度得分總結了每位受訪者的評分,分數100 表 示受訪者在所有因素方面都完全滿意。樣本數據整理如下: (每小題15 分,共30 分) A 超市:250 位客戶,整體滿意度平均分數86。 B 超市:300 位客戶,整體滿意度平均分數85。 某雜誌假設兩家超市整體滿意度的母體標準差皆為12,在0.05 顯著 水準下,試以p 值方式檢定兩家超市的整體滿意度平均分數是否有顯 著差異。 試計算兩家超市的整體滿意度平均分數的差異之95%的信賴區間,並 以此信賴區間檢定兩家超市的整體滿意度平均分數是否有顯著差異。
考慮兩生產線零件的不良率 1p 及 2p ,今要比較兩生產線零件不良率 1p 及 2p 的高低,取自兩生產線獨立樣本的結果如下: 樣本1: 1 250 n  1ˆ 0.04 p  樣本2: 2 250 n  2ˆ 0.03 p  1n 、 2n 及 1ˆp 、 2ˆp 分別代表從兩生產線所抽樣的零件樣本數及樣本中的 不良率,假設檢定為: 0 1 2 : 0, H p p   1 2 : 0 a H p p   ,則: (每小題5 分,共25 分) 檢定統計量之值為何? 檢定統計量對應的P 值為何? 當顯著水準 0.1  時,結論為何? 如假設檢定為左尾檢定,則P 值為何? 如假設檢定為雙尾檢定,則P 值為何?
下列資料是根據國家顧客滿意度指數蒐集的三家公司連續兩年的平均 滿意度分數。假設每家公司每年隨機抽取60 名客戶做為樣本。假設此三 家公司每年滿意度分數的標準差均為6 分。 公司 今年 去年 A 72 75 B 81 83 C 79 80 資料顯示此三家公司今年的滿意度分數均較去年降低。若以α 0.05  進行 假設檢定,試問下降分數須有多大才具有統計顯著性?(15 分) 32180
1.000 0.999 0.983
常態分配及T 分配在統計資料分析上是兩個常用到的資料分配,試比較常 態分配及T 分配之機率密度函數曲線或資料結構的異同?(10 分)

統計 24 題

假設隨機變數X 與Y 有下面的聯合(jointly)機率密度函數(probability density function): , 0 ( , ) 0, y e x y f x y        其他範圍 請回答下列問題:(每小題4 分,共28 分) 求隨機變數X 與Y 的聯合動差母函數(moment generating function)。 求隨機變數X 的期望值。 求隨機變數Y 的期望值。 求隨機變數X 的變異數。 求隨機變數Y 的變異數。 求兩隨機變數X 與Y 的共變異數(covariance)。 求兩隨機變數X 與Y 的相關係數(correlation coefficient)。
美國總統川普上任後引發的全球關稅大戰,對臺灣企業造成了重大衝 擊,同時也引起全球股市劇烈波動,導致許多股票投資人蒙受損失。 如何在個人投資生涯中善用投資組合,以分散投資風險,已成為一門 重要的學問。在金融市場中,貨幣市場屬於報酬率較低但風險相對較 小的市場;相對地,股票市場則具有較高的報酬潛力,同時伴隨較高 的風險。下表列示在不同總體經濟景氣狀況下,投資於股票與貨幣型 基金的報酬率資料。 不同總體經濟景氣下,股票與貨幣型基金的投資報酬率 總體經濟景氣 二元f(x,y)機率 股票報酬率x 貨幣型基金報酬率y 衰退 復甦 繁榮 0.3 0.4 0.3 −30% 40% 30% 2% 4% 3% 請問投資股票的個別平均報酬率及風險(以標準差衡量)為何? (4 分) 請問投資貨幣型基金的個別平均報酬率及風險(以標準差衡量)為 何?(4 分) 如果我們想利用兩種投資標的形成投資組合,將資金各50%投資兩 種投資標的,則平均報酬率及風險又為何?請與及小題之結果 合併討論投資組合之效果為何?(12 分)
搭乘甲鐵路對號列車,因可歸責鐵路公司致誤點達45 分鐘以上、或 是不可歸責鐵路公司的天災人禍致誤點達2 小時以上,旅客皆可申 請免費搭乘同區間同等級列車一次。假設上述可歸責與不可歸責之誤 點機率分別為3/4 與1/4,而其對應的每年受影響旅客人數分別服從平 均數為50 與100 之波瓦松分配。(每小題10 分,共30 分) 試問每年可申請免費搭乘同區間同等級列車旅客人次之機率分配 為何? 試問每年可申請免費搭乘同區間同等級列車旅客人次之期望值與 標準差。 若可歸責業者與不可歸責業者之誤點時間分別服從平均數為1 小 時與5 小時之指數分配,試問誤點對號列車中,誤點時間超過2 小 時之比例約多少?
育嬰津貼的實施是否提升各市鎮新生兒人數?隨機抽取14 個市鎮, 得到實施前後之新生兒人數(單位:百人)統計如下: (每小題10 分,共40 分) 1 2
令 1 2 , , , n X X X  是一組樣本大小(sample size)為n,從均勻分配(uniform distribution)U[0, ] 抽樣而來的隨機樣本(random sample),其中的參數 未知。隨機變數 i X 的機率密度函數具有如下的形式: 1 , 0 ( ; ) 0, i i x f x          其他範圍 1,2, i n   請回答下列問題: 令ˆ為參數的最大概似估計量(maximum likelihood estimator)。 (每小題3 分,共12 分) 試求出ˆ。 ˆ是否具有不偏性(unbiased)?請證明之。 ˆ的均方誤差(mean square error,簡稱MSE)是多少?請證明之。 ˆ是否是參數的一致性估計量(consistent estimator of )?請證 明之。 令ߠ෨為利用動差法(method of moments)來對參數做估計所獲得的統 計量。(每小題3 分,共12 分) 試求出ߠ෨。 是否具有不偏性?請證明之。 的均方誤差是多少?請證明之。 是否是參數的一致性估計量?請證明之。 試比較ˆ與的MSE,看怎樣的樣本大小會讓ˆ或那一個比較具優勢? (3 分)
生產製程的管理最重要目標之一為降低生產過程的變異。假設某飲料 商裝填包裝飲料用有兩條生產製程線,平時品管人員都定期抽樣檢驗 飲料,避免製程發生問題而導致產品出現瑕疵。最近一次品管人員 針對兩條製程線進行隨機抽樣,每條製程抽取20 包飲料進行含量檢 驗,假設飲料包裝外標示含量為300 ml,以下為兩條製程抽取的飲料 含量: 第一條製程線 301 300 301 299 298 299 300 302 300 301 302 298 299 300 301 301 300 302 299 300 第二條製程線 303 302 300 298 303 297 300 302 298 299 305 302 300 299 305 304 300 298 300 302 請設立比較兩條生產製程線飲料包裝含量變異數的虛無與對立假 設。(5 分) 假設顯著水準為0.05,請依題目解釋本題的顯著水準的實務意義 (亦即品管主管對顯著水準設為0.05 的解釋)。(5 分) 請以臨界值法比較兩條生產製程線的飲料包裝含量變異數是否有 顯著差異。(6 分) 請以p 值法比較兩條生產製程線的飲料包裝含量變異數是否有顯 著差異。若要改善製程,應以那一條製程線為優先(說明原因)? 19 ) 1 ( , 9 P F 3. ) ( 801 0 0 ( ) . 028   (9 分)
航空公司工會對薪資獎酬福利的權益爭取紛爭不斷。某航空公司最近 委託某大學會計系教授輔導實施一套獎酬制度,希望能提升員工對公 司的薪酬滿意度,以降低紛爭。隨機抽取十位員工進行實施獎酬制度 前後的滿意度分數調查,如下表所示。假設滿意度分數母體資料非常 態分配,但沒有明顯偏態。 員工 實施前滿意度 實施後滿意度 1 3.8 4.5 2 3.5 3.9 3 3.6 3.9
某一出租影印機業者,欲研究維護影印機的時間Y (分鐘)與所出租的影 印機數量X (台)之間的關係,經業者抽樣調查蒐集了10 組維護影印機 的時間與出租影印機數量的資料,如下表所示: Xi 20 23 27 24 19 22 18 19 21 25 Yi 520 547 594 551 509 513 495 511 527 534 若業者想利用這些資料建一個迴歸模型 0 1 Y X     作為未來估計與預測 之用,請回答下列問題:(每小題6 分,共30 分) 請以最小平方法(least square method)求參數 0 與 1 之估計值。 求參數 0 與 1 之95%信賴區間。 針對所算出來的 1 之95%信賴區間,請解釋其意涵。 若欲檢定由所蒐集的資料中是否足以顯示影印機維護時間受到出租影 印機數量的影響,可以怎麼做?結論為何?(顯著水準設為 0.05  ) 針對某一個月份影印機出租數量為26 台時,求其維護影印機時間的預 測值之95%的信賴區間。
隨機選取A、B 兩廠牌的輪胎各10 個,以成對的方式置入10 部車子的後 輪中,以測試這兩種輪胎的耐磨程度,並記錄其耐磨的里程數(里程數越 多代表輪胎越耐磨)。數據資料(單位:千公里)如下表所示: 輪胎 車子 1 2 3 4
3.7 4.3
4 4.6
家戶數 70 82 33 10 3 2 請問此一未成年家戶成員數資料在95%之信心水準下是否服從卜 瓦松分配(Poisson distribution)?(15 分) 請說明在95%之信心水準下是否有顯著之證據指出甲鎮內家戶12 歲 以下未成年家戶成員數目大於或等於2 人之比例大於15%。請敘述 恰當之虛無及對立假設、檢定統計量及檢定結果。(10 分) 四、某人想要研析三種不同的灌溉方式對產量的影響,規劃了15 塊面積 相同的農地,每種灌溉方式各隨機選擇5 塊農地加以應用,三種灌溉 方式所得產量資料整理後如下表: 灌溉方式 A B C 樣本平均 15.4 18.4 28.4 樣本變異數 9.3 20.8 18.3 經一因子變異數分析後,發現三種灌溉方式之產量確有顯著之差距, 請回答下列問題: 請寫出一因子變異數分析之變異數分析表(含檢定三種灌溉方式之 產量是否相同之檢定統計量值)。(10 分) 因為一因子變異數分析顯示三種灌溉方式之產量顯著不同,請用費 雪之最小顯著差異法(Fisher’s Least Significant Difference),以單 一成對比較信心水準為95%之基準下,判斷那幾組成對之兩種灌溉 方式產量比較有顯著之不同。(10 分) 承中之整體型一誤差機率為何(亦即產生至少一次型一誤差之機 率)?若用邦佛洛尼校正法(Bonferroni correction)調整單一成對檢 定之顯著水準,調整後之單一成對檢定之顯著水準以及整體型一誤 差機率為何?(5 分) t 分配表 F 分配表 卡方分配表 卜瓦松機率分配表
4.2 4.4
3 3.6
9 10 11 12 13 14 實施前120 80 60 180 200 160 140 60 190 180 140 80 60 40 實施後124 81 65 187 203 160 143 61 189 185 139 72 59 45 顯著水準為0.05 之下,試以t 檢定說明是否育嬰津貼實施後新生 兒人數增加。 若實施後各市鎮新生兒人數平均增加360 人,試問中檢定方法之 型二誤差為何? 試以直方圖判斷本題使用t 檢定所需的常態假設之合理性。 顯著水準為0.05 之下,試以Wilcoxon 無母數方法進行檢定。 三、超過5 成的企業預期未來幾年的AI 人力需求將持續上升,特別 是在生成式AI 的應用下,相關產業的職缺將大幅增加。過去 20 個月的資料顯示市場對於AI 人才之需求呈線性成長趨勢, 今考慮需求人數 y 對時間之簡單線性模型,得到 2 2 ˆ 362, 4766, 7975, ( ) 15.25 i i i i i y iy y y y          。 (每小題10 分,共30 分) 試求回歸方程式。 試寫出ANOVA 表。 試寫出此模型之假設,並根據以下殘差圖說明模型假設是否合理。 residual t 附表一:t 表 Example: With df =9 and .10 area in the upper tail, t =1.383 6 6 附表二 Critical Values for the Wilcoxon Rank-Sum Test 附表三 Critical Values for the Wilcoxon Signed-Rank Test
9 10 A 廠牌 23 20 26 25 48 26 25 24 15 20 B 廠牌 20 30 16 33 23 24 8 21 13 18 請回答下列的問題(顯著水準皆設為 0.01  ):(每小題5 分,共15 分) 若已知母體為常態分配,根據上表的資料,請問A 廠牌的輪胎平均耐 磨度是否較B 廠牌好? 若已知母體分配未知,請以符號檢定法(The Sign Test)再檢定之 結果。 若已知母體分配未知,請以Wilcoxon 符號等級檢定法(The Wilcoxon Signed-Rank Test)再檢定之結果。
3 3.5 9 3.4 4.3 10 3.2 3.3 請設立虛無與對立假設。(5 分) 在5%的顯著水準下,請問獎酬制度是否能提升員工滿意度?(10 分) 四、有一個針對某夜市三家炸雞店口味的滿意度調查(分數從1~7 分, 極度不滿意~極度滿意),假設三家炸雞店的母體滿意度分數皆為常 態分配且母體變異數皆相等,隨機抽取到該夜市逛街的30 位顧客, 分別隨機指派吃三家店的炸雞,下表為得出的滿意度分數。假設顯著 水準為0.05。 三家炸雞店的樣本滿意度分數 第一家 第二家 第三家 5 3 2 3 3 4 4 4 3 6 5 5 5 4 4 5 4 5 6 3 2 7 3 3 7 4 3 6 5 5 請問三家炸雞店口味的平均滿意度是否有差異?請編製ANOVA 表。 7 ( ) 2,2 P F 8. ) 2 ( 111 0 ( ) .00   (8 分) 請利用Fisher LSD 方法進行事後多重程序比較,三家炸雞店口味 平均滿意度分數有何差異?(6 分) 請利用Bonferroni 調整法進行事後多重程序比較,三家炸雞店口味 平均滿意度分數有何差異? 0.008,2 ( ) 7 (t 2.878)  (6 分) 五、臺中某咖啡店店長想要了解咖啡銷售量與其整體業績是否有關係,以 便進行行銷策略之調整。下表為該店過去10 天的咖啡銷售量與營收 的資料。 臺中某咖啡店咖啡銷售量與營收資料 當日咖啡銷售量 當日營收(百元) 1 125 251 2 104 223 3 98 196 4 145 258 5 113 232 6 156 270 7 105 211 8 94 200 9 121 244 10 130 252 請以咖啡銷售量為自變數,營收為應變數,利用最小平方法估計迴 歸方程式。(7 分) 在顯著水準α 0.05  下,若利用t 檢定來進行檢定,咖啡銷售量與 當日營收之間是否存在顯著關係?(5 分) 請說明上述結果對此咖啡店店長有何管理意涵?(3 分) 當某日咖啡銷售量賣出130 杯時,請預測該日營收的95%的預測 信賴區間。(5 分) 附表 表1 F 分配的臨界值 0 ) 1 , 1 ; ( 2 1   n n F  F值的右尾面積或機率   2 2 2 1 s s F  分母自由度 19 20 右尾面積 0.01 0.025 0.05 0.1 0.01 0.025 0.05 0.1 分 子 自 由 度 10 3.43 2.82 2.38 1.96 3.37 2.77 2.35 1.94 15 3.15 2.62 2.23 1.86 3.09 2.57 2.20 1.84 20 3.00 2.51 2.16 1.81 2.94 2.46 2.12 1.79 25 2.91 2.44 2.11 1.78 2.84 2.40 2.07 1.76 30 2.84 2.39 2.07 1.76 2.78 2.35 2.04 1.74 ) 1 , 1 ; ( 2 1   n n F  表2 標準常態Z 分配的左邊累積機率(z > 0) z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 2.0 2.1 2.2 2.3 2.4 0.9772 0.9821 0.9861 0.9893 0.9918 0.9778 0.9826 0.9864 0.9896 0.9920 0.9783 0.9830 0.9868 0.9898 0.9922 0.9788 0.9834 0.9871 0.9901 0.9925 0.9793 0.9838 0.9875 0.9904 0.9927 0.9798 0.9842 0.9878 0.9906 0.9929 0.9803 0.9846 0.9881 0.9909 0.9931 0.9808 0.9850 0.9884 0.9911 0.9932 0.9812 0.9854 0.9887 0.9913 0.9934 0.9817 0.9857 0.9890 0.9913 0.9936 2.5 2.6 2.7 2.8 2.9 0.9938 0.9953 0.9965 0.9974 0.9981 0.9940 0.9955 0.9966 0.9975 0.9982 0.9941 0.9956 0.9967 0.9976 0.9982 0.9943 0.9957 0.9968 0.9977 0.9983 0.9945 0.9959 0.9969 0.9977 0.9984 0.9946 0.9960 0.9970 0.9978 0.9984 0.9948 0.9961 0.9971 0.9979 0.9985 0.9949 0.9962 0.9972 0.9978 0.9985 0.9951 0.9963 0.9973 0.9980 0.9986 0.9952 0.9964 0.9974 0.9981 0.9986 3.0 3.1 3.2 3.3 3.4 0.9986 0.9990 0.9993 0.9995 0.9997 0.9987 0.9991 0.9993 0.9995 0.9997 0.9987 0.9991 0.9994 0.9995 0.9997 0.9988 0.9991 0.9994 0.9996 0.9997 0.9988 0.9992 0.9994 0.9996 0.9997 0.9989 0.9992 0.9994 0.9996 0.9997 0.9989 0.9992 0.9994 0.9996 0.9997 0.9989 0.9992 0.9995 0.9996 0.9997 0.9990 0.9993 0.9995 0.9996 0.9997 0.9990 0.9993 0.9995 0.9997 0.9998 表3 t 分配的臨界值 自由度 t0.10 t0.05 t0.025 t0.01 t0.005 1 2 3 4 5 3.078 1.886 1.638 1.533 1.476 6.314 2.920 2.353 2.132 2.015 12.706 4.303 3.182 2.776 2.571 31.821 6.965 4.541 3.747 3.365 63.656 9.925 5.841 4.604 4.032 6 7 8 9 10 1.440 1.415 1.397 1.383 1.372 1.943 1.895 1.860 1.833 1.812 2.447 2.365 2.306 2.262 2.228 3.143 2.998 2.896 2.821 2.764 3.707 3.499 3.355 3.250 3.169 11 12 13 14 15 1.363 1.356 1.350 1.345 1.341 1.796 1.782 1.771 1.761 1.753 2.201 2.179 2.160 2.145 2.131 2.718 2.681 2.650 2.624 2.602 3.106 3.055 3.012 2.977 2.947 16 17 18 19 20 1.337 1.333 1.330 1.328 1.325 1.746 1.740 1.734 1.729 1.725 2.120 2.110 2.101 2.093 2.086 2.583 2.567 2.552 2.539 2.528 2.921 2.898 2.878 2.861 2.845 21 22 23 24 25 1.323 1.321 1.319 1.318 1.316 1.721 1.717 1.714 1.711 1.708 2.080 2.074 2.069 2.064 2.060 2.518 2.508 2.500 2.492 2.485 2.831 2.819 2.807 2.797 2.787 26 27 28 29 30 1.315 1.314 1.313 1.311 1.310 1.706 1.703 1.701 1.699 1.697 2.056 2.052 2.048 2.045 2.042 2.479 2.473 2.467 4.462 2.457 2.779 2.771 2.763 2.756 2.750 31 32 33 34 35 1.309 1.309 1.380 1.307 1.306 1.696 1.694 1.692 1.691 1.690 2.040 2.037 2.035 2.032 2.030 2.453 2.449 2.445 2.441 2.438 2.744 2.738 2.733 2.728 2.724 36 37 38 39 40 1.306 1.305 1.304 1.304 1.303 1.688 1.687 1.686 1.685 1.684 2.028 2.026 2.024 2.023 2.021 2.434 2.431 2.429 2.426 2.423 2.719 2.715 2.712 2.708 2.704
人工智慧的興起,帶動了市場對晶片需求量的飆升,也連帶促成相關產 業的蓬勃發展。已知國內有某家公司專門生產晶片半導體製程中使用的 圓形光罩。今由此公司之生產線隨機抽檢n 筆光罩樣本並測量其半徑。 若已知因某些特定原因造成該公司測量儀器不精準,測量之觀測值會有 誤差,令 表其觀測誤差。假設觀測誤差 1
假設某抗肥胖藥物可由政府補助之條件如下: 條件一:有心疾者、且身高體重指數(body-massindex,簡稱BMI)大於28; 條件二:無心疾者、且BMI 大於32。 已知有心疾者占總人口的10%。若有心疾者的BMI 平均值為25、標準 差為5;無心疾者的BMI 平均值為22、標準差為4。請回答下列問題: (每小題10 分,共20 分) 試問無心疾者中,有多少比例可獲補助? 若有心疾者與無心疾者的BMI 分別都服從常態分配,試問可獲補助者 中,屬於有心疾者的比例為何?
甲、乙兩個長期照顧居家服務中心統計其每個月的服務人次,資料如下: 樣本數(月) 樣本平均數 樣本標準差 甲 12 58 4 乙 15 65 5 假設兩母體皆服從常態分配,且變異數相同(σ1 2=σ2 2=σ2)。請回答下列問 題:(每小題10 分,共20 分) 試求σ2的估計值,以及其95%信賴區間。 在顯著水準0.05 之下,試檢定兩母體平均數是否相等。
, ,..., n  彼此相互獨立 且服從平均數為1,變異數為 2 之常態分配,並令為此圓形光罩的真實 半徑。令變數 1 2 , ,..., n Y Y Y 為此n 筆樣本之半徑的觀測值,則 , 1,2,..., i i Y i n      。令 ( ) F y 為變數 iY 之累積分配函數(cumulative distribution function)。(每小題10 分,共80 分) 求出機率  1 2 ( ) ( ) 1 0.5 F Y F Y P   。 求出條件機率  2 1 2 ( ) ( ) ( ) 0.5 P F Y F Y F Y   。 假設和 2 皆未知,請利用觀測值 1 2 , ,..., n Y Y Y 求出此光罩半徑之最大 概似估計量(maximum likelihood estimator)。 假設和 皆未知,請利用觀測值 1 2 , ,..., n Y Y Y 求出此光罩面積 2 之均勻 最小變異不偏估計量(uniformly minimum variance unbiased estimator)。 假設和 皆未知,請求出光罩半徑之信賴水準100(1 )%   的信賴區 間。 若該公司有兩條獨立作業的生產線,且已知此兩條生產線所生產之光 罩的瑕疵率皆為。令變數 iS 為第i 條生產線上檢測產品直到檢測出 第一個瑕疵品前所需的檢測(良品)次數, 1,2 i  ,請求出機率 1 2 [ ] P S S  。 續題,令變數 1 2 { , } U Min S S  代表取 1 2 , S S 之最小值,請求出U 之機 率密度函數 ( ) f u 。 求出題之變數U 的期望值 ( ) E U 。 1 2 , ,..., n    2   2   二、臺灣量子國家隊已成軍5 年,去年突破技術瓶頸,成功自製出5 量子位 元之超導量子電腦,象徵著臺灣的量子時代來臨。已知團隊開發的量子電 腦有一個核心的元件,此核心元件是由三個電路組件串聯及並聯構成。令 變數 1 2
COVID-19 疫情期間,學校關閉或改為線上課程。某教育機構評估疫情 後學生在閱讀方面的能力。隨機抽取600 名八年級學生進行滿分100 分 之閱讀測驗,記錄其成績,得樣本平均數56 分、樣本標準差18 分,分 數分布如下: 分數 [0, 20] (20, 40] (40, 60] (60, 80] (80, 100] 人數 54 144 252 120 30 請回答下列問題:(每小題10 分,共20 分) 在0.05 顯著水準之下,試檢定此資料是否服從常態分配。 若[0, 40]分為「待加強」,(40, 60]分為「基礎」,(60, 100]分為「精熟」。 已知疫情前,此三種等級之比例分別為30%,50%,20%。在顯著水準 0.05 之下,試檢定疫情前後八年級學生閱讀能力之等級分布是否相同。
, , T T T 分別代表此三個電路組件的壽命,此核心元件是先由第一及 第二個電路組件串聯後,再和第三個電路組件並聯而成,因此整個核心元 件的壽命是 1 2 3 { { , }, } X Max Min T T T  ,此處 { , } Max a b 代表取,a b 之最大值, { , } Min a b 代表取,a b 之最小值。假設此三個電路組件的壽命彼此相互獨 立,皆服從具有平均數為2 之指數分配。(每小題10 分,共20 分) 求出變數X 之機率密度函數 ( ) f x 。 求出變數X 之變異數 ( ) Var X 。
王先生蒐集過去12 個月甲市新成屋的交易價格,得每坪平均交易價格 y1,y2,...,y12 (單位:萬元)。已知此樣本之平均數與標準差分別為 y=63,sy=12。又將每坪平均交易價格對時間做線性迴歸,得到截距項係 數估計值為50。請回答下列問題:(每小題10 分,共40 分) 試求斜率係數估計值。 試分別預測接下來兩個月的每坪平均交易價格。 在0.05 顯著水準之下,試檢定斜率係數是否為正值。 接下來兩個月,若每坪平均交易價格的真實值分別為77 萬元與72 萬 元,試計算中預測結果的平均絕對誤差(mean absolute deviation)。