lawpalyer logo

統計學概要考古題|歷屆國考試題彙整

橫跨多種國家考試的統計學概要歷屆試題(選擇題 + 申論題)

年份:

經建行政 49 題

114年公務人員普通考試試題 類 科:經建行政 科 目:統計學概要 考試時間:1 小時30 分 座號: 不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。 本科目除專門名詞或數理公式外,應使用本國文字作答。 研究者想知道A 大學的管院碩士生主修學系是否和大學生主修學系 相關,隨機抽取的樣本資料整理如表。 大學主修\碩士主修 企管 財管 會計 其他 總和 企管 300 100 80 120 600 財管 30 200 40 30 300 會計 60 90 400 50 600 其他 70 90 20 120 300 總和 460 480 540 320 1800 請檢定碩士生主修學系和大學生主修學系是否相關。顯著水準為 0.05。(10 分) 計算機率,P(大學生主修其他或碩士生主修企管)。(5 分) 假設T 大學大一全體學生統計學期末考的分數服從常態分配。隨機 抽取八位同學,其考試分數為65, 70, 75, 80, 75, 80, 65, 90。 (每小題5 分,共30 分) 若母體變異數未知,其不偏估計量和估計值為何? 續上題,此估計量服從什麼分配? 請估計母體標準差的95%信賴區間。 請檢定母體變異數是否為100 分。顯著水準為0.05。 請估計母體平均值的90%信賴區間,假設母體變異數未知。 計算機率,p(S2>80),S2為樣本變異數。假設母體變異數為258.422 分。 高速公路新竹站巡警想知道貨車平均行駛速度是否過高。隨機抽取 81(n=81)輛貨車測其車速,其平均速度為105 公里/每小時且標準 差為6 公里/每小時。假設母體為常態分配。 請問貨車平均速度是否超過100 公里/小時。顯著水準0.05。 寫出虛無假設H0 和對立假設H1。(5 分) 寫出檢定統計量在H0為真下的分配,並說明何以為此分配。(5 分) 分別計算統計量值和p 值,並說明檢定結果。(5 分) 續 母體平均值未知時,其最佳估計量為何?若欲使此估計量估計母 體平均值的誤差最大是0.5 公里/小時的機率至少為0.9,請問樣 本大小應該多少?(5 分) 續上題,若機率更改為至少0.95,請問樣本大小應該多少?(5 分) 甲賣場以三種廣告方式(報紙、網路、直銷)促銷產品。每種廣告下, 隨機抽取5 家分店並調查其年營業額如表。單位:百萬元。 報紙 網路 直銷 18 18 8 24 29 17 15 31 19 26 24 7 27 28 9 平均值 22 26 12 變異數 27.5 26.5 31 每種廣告下的年平均營業額是否都相等?請列出變異數分析表並 檢定結果。顯著水準為0.05。(15 分) (列出H0 和H1,寫出檢定統計量及其在H0 為真下的分配,以臨 界值方法決定檢定結果。) 上題的檢定結果要可信,需要有的假設條件為何?(5 分) 續的檢定結果,請檢定報紙和直銷廣告的年平均營業額是否相 等。顯著水準為0.05。(10 分) (列出H0 和H1,寫出檢定統計量及其在H0 為真下的分配,說明檢 定結果。) 附表一:z 值表 附表二:t 值表 附表三: 附表四: 0.05( 1, 2) F v v 值表
許多航空公司通常使用問卷來收集與飛行體驗相關的客戶滿意度數據。 乘客完成飛行後,會收到一封電子郵件,要求他們對各種因素進行評分。 假設使用五分制評分標準來記錄乘客評分,等級分別為:優(E)、非常 好(V)、好(G)、一般(F)和差(P)。假設50 位乘客搭乘甲航空從臺 灣飛往美國加州的航班,對「請根據您此次航班的整體體驗對航空公司 進行評分」這一問題進行評分。乘客評分結果如下: E E G V V E V V V E E G V E E V E E E V V V V F V E V E G E G E V E V E V V V V E E V V E P E V P V 使用百分比分配和長條圖(bar chart)來彙總這些數據。甲航空的管理階 層是否需要做出重大改變,以便提升整體顧客滿意度?(15 分) 60520
參加研究生入學考試(GET)的學生被問及他們的本科專業以及攻讀 MBA 的意向(全職或兼職)。以下是他們的回答摘要: 攻讀MBA 的意向 本科專業 商業 工程 其他 總計 全職 352 197 251 800 兼職 150 161 194 505 總計 502 358 445 1305 如果學生打算全職攻讀MBA 學位,那麼該學生本科是工程專業的機 率是多少?(10 分) 設事件A 表示學生打算全職攻讀MBA 學位,事件B 表示學生本科專 業是商業。事件A 和B 是否獨立?請說明理由。(5 分)
過去3 年,國內大型股票基金的平均報酬率為14.4%。假設國內大型股 票基金這3 年的報酬率服從常態分布,標準差為4.4%。 一檔國內大型股票基金3 年報酬率至少達到20%的機率是多少?(5 分) 國內股票基金3 年期報酬率要達到多高才能躋身前10%?(10 分)
美國東北部地區每年每人平均處方藥支出為838 美元。中西部地區60 人 的樣本調查顯示,每年每人平均處方藥支出為745 美元。假設美國總體 處方藥年支出的標準差為300 美元。在0.05 的顯著水準下,檢定前述中 西部地區的樣本數據是否支持「中西部地區每年每人平均處方藥支出低 於東北部地區」。詳述此假設檢定的過程,包括虛無與對立假設、拒絕域、 檢定統計量與檢定結果。(20 分)
全球商務旅行協會公布了本年度和上年度的國內商務旅行機票價格。以 下列舉了12 個航班及其2 年的國內商務旅行機票價格。 本年度 上年度 本年度 上年度 345 315 635 585 526 463 710 650 420 462 605 545 216 206 517 547 285 275 570 508 405 432 610 580 在0.05 的顯著水準下,檢定1 年內國內商務旅行機票平均價格是否上 漲。詳述假設檢定的過程,包括虛無與對立假設、檢定統計量、p-Value 與檢定結果。(20 分) 60520
一家鞋店建立了下列估計迴歸方程式: ˆy= 25 + 10x1 + 8x2 其中x1 =庫存投資(仟美元);x2 =廣告支出(仟美元);y =銷售額(仟美 元)。 預測在庫存投資15,000 美元和廣告預算10,000 美元的情況下,銷售 額為何?(5 分) 解釋此估計迴歸方程式中數字10 和8 的意義。(10 分)
某廠商因其生產之商品數量極大,故委託A 與B 兩家代工廠商代為生 產,已知A、B 二家代工廠的生產量比例為3:1。根據以往查核資料, A 代工廠產品的不良率為2%,B 代工廠產品的不良率為4%,此二不良 率皆符合該廠商對其商品不良率的要求。 若有一消費者隨機購買一件該廠商生產之商品, 此商品為從A 代工廠生產且為不良品的機率為何?(4 分) 此商品為從B 代工廠生產且為不良品的機率為何?(4 分) 接續題,若該消費者隨機購買一件該廠商生產之商品,此商品為不 良品的機率為何?(4 分) 若有一消費者隨機購買該廠商生產之商品,發現此商品為不良品,則 該產品是來自B 代工廠的機率為何?(8 分)
臺灣本島總共有四個區域,其中北部區域:包括臺北市、新北市、基隆 市、新竹市、桃園市、新竹縣及宜蘭縣;中部區域:包括臺中市、苗栗 縣、彰化縣、南投縣及雲林縣;南部區域:包括高雄市、臺南市、嘉義 市、嘉義縣、屏東縣;東部區域:包括花蓮縣及臺東縣;唯一不臨海的 縣市是南投縣。今隨機不放回抽取4 個縣市,計算下列三個子題的機率: 沒有抽到南投縣的機率。(8 分) 抽到南投縣的機率。(8 分) 抽到兩個北部區域縣市和一個東部區域縣市的機率。(9 分)
某知名飲品店想瞭解消費者自備飲料杯情形,隨機抽訪1,000 位消費者, 分析資料後得知其中有400 位男生及600 位女生,且男生中有100 位有 自備飲料杯的習慣,而女生中有300 位有自備飲料杯的習慣。 估計來該店之消費者會自備飲料杯比例的95%信賴區間。(7 分) 估計來該店之消費者中,男生與女生有自備飲料杯比例差的95%信賴 區間。(12 分) 若該飲品店準備要進行某一項新品喜好度調查,預估消費者對該新品 的喜好百分比會有60%(即p = 0.6),若要求此喜好百分比在信賴水 準為95%設定下的估計誤差值d 不超過0.02,在假設大樣本條件下, 應抽出多少樣本數?(6 分)
未完成的變方分析表如下: 變異來源 平方和 自由度 均方和 F 處理 Treatment 2 誤差 Error 20 合計Total 500 11 ߤ௜=第i 個處理的母體平均數 完成上述的變方分析表。(10 分) 處理個數和總樣本數。(4 分) 寫出虛無與對立假設。(6 分) 根據變方分析表,在0.05 顯著水準下,對之假設檢定寫下結論。 (5 分) (݂଴.଴ହ,ଶ,ଵ଴= 4.10, ݂଴.଴ହ,ଶ,ଽ= 4.26, ݂଴.଴ହ,ଷ,ଽ= 3.86, ݂଴.଴ହ,ଶ,ଵଵ= 3.98)
某公司為瞭解其推出新產品上市一個月後在北、中、南3 個營業區的平 均銷售量是否會有不同,從3 個營業區各隨機抽出3 家分店,蒐集整理 新品銷售量相關之資料(單位:百件): 北區 中區 南區 分店數 3 3 3 平均數 7 8 12 變異數 — — — 已知9 家分店所有銷售量資料的(總)變異數為10.5,請利用單因子變 異數分析方法,在5%的顯著水準下,檢定3 個營業區銷售量的平均數 是否有差異? 請寫出虛無與對立假設(3 分) 請列出變異數分析表(ANOVA 表)及得到F 統計量的估計值的每一 個計算過程(18 分) 檢定結果與結論(4 分)
某化學工廠僱用時薪員工和受薪員工。人力資源副總裁對380 名員工進 行了調查,以了解他們對當前醫療保健福利計畫的滿意度。然後根據薪 酬類型(即時薪或受薪)對員工進行分類。結果見下表: 薪酬類型 滿意 中立 不滿意 總計 受薪 30 17 8 55 時薪 140 127 58 325 合計 170 144 66 380 在0.05 顯著水準下,得出薪酬類型和醫療保健福利滿意度水準相關的結 論是否合理? 寫出虛無與對立假設。(10 分) 對之假設,完成完整的統計檢定計算過程,並做出結論。(20 分) (߯଴.଴ହ,ଵ ଶ = 3.841, ߯଴.଴ହ,ଶ ଶ = 5.991, ߯଴.଴ହ,ଷ ଶ = 7.815, ߯଴.଴ହ,ସ ଶ = 9.488)
某花生醬公司的品質控制部門負責檢查8 盎司罐裝花生醬的重量。上一 小時生產的15 罐樣品的重量為: 7.50 7.69 7.70 7.72 7.79 7.80 7.85 7.86 7.90 7.94 7.97 8.01 8.03 8.06 8.09 中位數是多少盎司?(10 分) 決定第一四分位數(ܳଵ)和第三四分位數(ܳଷ)對應的重量。(10 分)
某公司的維修部門負責該公司所有機器設備維修工作,部門經理為估計下 年度所需之維修成本,蒐集了過去6 個月的機器運轉時數(ݔ௜)與所耗用 的維修費用(ݕ௜)資料,並建立了二者間的迴歸模型:ݕ௜= ߙ+ ߚݔ௜+ ߝ௜, ݅= 1,2, ⋯, ݊,假設ߝ௜為相互獨立且具有共同分配N(0, ߪଶ)。令ݕ௜的最 小平方估計值為ݕො௜= ܽ+ ܾݔ௜,已知樣本相關資訊如下: ݊= 6,∑ ݔ௜ ௡ ௜ୀଵ = 24,∑ ݕ௜ ௡ ௜ୀଵ = 360,∑ (ݔ௜−ݔ̅)ଶ ௡ ௜ୀଵ = 20, ∑ (ݕ௜−ݕത)ଶ ௡ ௜ୀଵ = 2,000,∑ (ݔ௜−ݔ̅)(ݕ௜−ݕത) ௡ ௜ୀଵ = 190, 其中ݔ̅和ݕത分別表示݊個ݔ௜和݊個ݕ௜的樣本平均數。 計算最小平方估計值ݕො௜中的ܽ和ܾ的數值。(10 分) 已知迴歸模型的判定係數ܴଶ為0.9025,計算出以下迴歸模型的變異數 分析表中A1、A2、A3 的數值。(12 分) 自由度 SS MS F 迴歸(R) − A1 − A3 殘差(E) − — 48.75 總和(T) − A2 為了檢定迴歸模型的斜率ߚ是否大於0,即H0:ߚ≤0對H1:ߚ> 0, 可以利用t 檢定統計量進行,請先計算出b 的標準誤;再計算對 應本資料的t 統計量的數值;最後判斷在5%的顯著水準下,該迴歸 線的斜率是否大於0。(8 分)
某大學調查近年來經濟學系和統計學系的大學部畢業生之平均起薪(月 薪)議題,獲得以下數據訊息: 經濟學系 統計學系 樣本數 n1=10 n2=12 樣本平均數(元) 1x =30,000 2x =30,500 樣本標準差(元) s1=230 s2=250 試計算此兩學系畢業生之起薪差異的95%信賴區間,並解釋之。(10 分) 在α=0.05 顯著水準之下,試檢定此兩學系畢業生之起薪的變異數是否 存在顯著差異。(15 分) 在α=0.05 顯著水準之下,試檢定此兩學系畢業生之平均起薪是否存在 顯著差異。(15 分) (以上、皆需正確寫出虛無假設、對立假設、檢定統計量、拒絕域、 P-值、檢定結果與結論。) 60620 附表一: 卜瓦松機率表X ~ Poisson(μ) 附表二: 標準常態機率分布表(左尾機率),例如:P(Z≤1.96)=0.975 60620 附表三: t 機率分布表(右尾機率),例如:P(t25>0.856)=0.20 附表四: F 分布臨界值與對應之機率值,P(F(v1,v2)>Fα(v1,v2))=α F0.1(9, 11)=2.274, F0.05(9, 11)=2.896, F0.025(9, 11)=3.588, F0.01(9, 11)=4.632, F0.005(9, 11)=5.537 F0.1(10, 12)=2.188, F0.05(10, 12)=2.753, F0.025(10, 12)=3.374, F0.01(10, 12)=4.296, F0.005(10, 12)=5.085 F0.1(11, 9)=2.396, F0.05(11, 9)=3.103, F0.025(11, 9)=3.912, F0.01(11, 9)=5.178, F0.005(11, 9)=6.314 F0.1(12, 10)=2.284, F0.05(12, 10)=2.913, F0.025(12, 10)=3.621, F0.01(12, 10)=4.706, F0.005(12, 10)=5.661
民調公司針對某項新公共政策的支持度進行調查,130 位接受訪談的男 性中有91 位表達贊同,120 位接受訪談的女性中有72 位表達贊同。 整體而言,民眾對此項新公共政策的支持率為何?(5 分) 在0.05 顯著水準之下,試檢定男性和女性對此項新公共政策的支持率是否 相同?須寫出虛無假設與對立假設、檢定統計量、臨界值及結論。(15 分) 試求p 值。(5 分)
令Φ(ݖ)為標準常態累積分配函數,Φ(-2)=0.0228。計算回答下列各子題: (每小題10分,共30分) 假設ܺଵ和ܺଶ是互相獨立的常態隨機變數,其分配分別為
保護動物協會想根據某型寵物犬成犬的體重(自變數X),預測其3 年內 的就醫次數(因變數Y),所蒐集到的資料如下: 8 n  , 1 40 n i i x    , 1 84 n i i y    , 2 1 210 n i i x    , 2 1 980 n i i y    , 1 390 n i i i x y    。 (每小題10 分,共50 分) 試分別計算X 和Y 的樣本標準差。 試分別計算X 和Y 的變異係數。 欲判斷X 和Y 何者變化較大,建議使用標準差或變異係數?請說明 理由。 試求迴歸方程式。 令x 與y 為樣本平均,試說明迴歸線必通過( , ) x y 。
(12,4 ) N 和 2 (2,3 ) N 。計算ܲ(ܺଵ> ܺଶ)和ܲ(ܺଵ+ ܺଶ>26)。 陳述中央極限定理(Central Limit Theorem)。(詳實敘明所需要的假設) 令 48 1 Y i  ܺ௜,ܺ௜為服從齊一分配(uniform distribution)ܷ(0, 4)的隨機 樣本, 1, , 48 i   。利用所述定理,計算 (80 Y 112) P    之近似機 率。(需計算列出ܺ௜的平均數與變異數) 二、一家液體洗滌劑製造商生產的洗滌劑標示宣稱每瓶容量為450毫升(mL)。 隨機抽取14瓶,測量其容量,資料列於下表: 447 459 439 443 462 449 437 458 453 461 445 467 456 448 數據的常態機率圖顯示可以假設內容量呈常態分配。μ表示該製造商生產 的所有洗滌劑瓶子的平均容量。要確定平均容量是否少於標示所宣稱的 容量,回答計算下列各子題: 敘明虛無假設與對立假設。(5分) 在顯著水準α=0.05下,依據所敘明的假設執行統計檢定,含棄卻域和 結論。(15分) 如果常態分配假設不成立,但是資料的分配仍具有對稱分配時,可採用 何種無母數統計檢定?(5分) 在顯著水準α=0.05下,依之統計檢定對此資料進行分析檢定。(13分) 0.05,14 0.05,13 0.05,12 0.05 0.025 0.05,14 0.95,14 ( 1.761 1.771 1.782 1.645 1.960 26 79 ) t t t z z w w        , , , , , , 。
根據以往經驗,民眾洽公時忘記帶足文件的機率是0.25。 若某個上午有16 位民眾前來洽公,至少一位忘記帶足文件的機率為 何?(5 分) 於某個上午,令X 代表第一個忘記帶足文件的民眾是出現在第X 位。 試問X 的機率分配為何?並求X 的期望值。(15 分) 於某個上午,前三位民眾都沒忘記帶足文件的機率為何?(5 分)
某一特徵被認為存在於三種族群,某研究欲檢定各族群具有此一特徵之 比例均為20%。分別從此三個族群中抽取60、120和60的隨機樣本進行測 試,檢驗結果如下表所示: 有顯現無顯現 族群一 28 32 族群二 30 90 族群三 25 35 寫出虛無假設與對立假設。(5分) 在顯著水準α=0.05下,寫出檢定統計量、計算過程、棄卻域和結論。(15分) 2 2 2 0.05,4 0.05,3 0.05,2 0.05,3 0.05,4 0.05,2 ( 9.49 7.81 5.99 2.353 2.132 2.920 ) t t t          , , , , , 。
某種抹片檢查用於檢測女性某種癌症,假設對於患有這種癌症的女性,大 約有15%的假陰性(false negative)檢測結果。對於沒有這種癌症的女性, 大約有20%的假陽性(false positive)檢測結果。假設每100,000人中大約 有8名女性患有這種癌症。在某一抹片檢查呈陽性的情況下,計算此女性 得此癌症的條件機率。(請定義各事件的符號,並敘明所採用的計算公 式。)(12分)
一家食品公司的領班承認,在10%的班次中,他忘記關閉生產線上的旋 轉機。這會導致機器過熱,使得在清晨運行期間產生缺陷產品的機率從 2%增加到20%。(每小題10 分,共20 分) 計算領班忘記關閉生產線上的旋轉機且產生缺陷產品的機率。 計算清晨運行期間產生缺陷產品的機率。
以下是甲、乙二地區之人口分布,以及C 流行病在各年齡層之確診率與 致死率。 人口分布(%): 0-19 20-29 30-39 40-49 50-59 60-69 >=70 甲 15.5 10.5 12.5 15.0 17.5 14.5 14.5 乙 21.0 13.5 17.5 15.0 16.5 12.5 4.0 各年齡層之確診率(%): 0-19 20-29 30-39 40-49 50-59 60-69 >=70 甲 2.5 3.5 6.5 10.5 15.0 25.5 36.5 乙 3.0 6.5 15.5 24.0 22.5 16.5 12.0 各年齡層之致死率(%): 0-19 20-29 30-39 40-49 50-59 60-69 >=70 甲 0.0 0.0 0.0 0.2 0.3 6.5 12.5 乙 0.0 0.2 0.3 0.4 1.5 8.0 13.5 其中,各年齡層之致死率=(該年齡層因C 流行病而死亡之人數)/(該 年齡層之確診人數),各年齡層之確診率=(該年齡層之確診人數)/(所 有年齡層之總確診人數),並依地區分別計算。 試問甲地區人口年齡之中位數落在那個年齡層?(5 分) 不分年齡層之下,試分別計算甲、乙二地區之整體致死率。(10 分) 試說明為何一個地區即使在各年齡層之致死率皆高於另一地區,其整 體致死率仍可能低於另一地區。(5 分)
假設ܺଵ, ܺଶ, . . . , ܺଵ଴଴為從標準常態機率分配隨機抽取之樣本,今從剛畢業之 社會新鮮人隨機抽取100 人,記錄其首份工作之月薪(萬元),得 ܻଵ, ܻଶ, . . . , ܻଵ଴଴。現將此二組數據分別由小至大排序,得ܺ(ଵ) < ܺ(ଶ) <. . . < ܺ(ଵ଴଴)與ܻ(ଵ) < ܻ(ଶ) <. . . < ܻ(ଵ଴଴)。若(ܺ(௜), ܻ(௜))之分散圖,約為一條截距 為4、斜率為0.5 之直線。試問社會新鮮人首份工作之月薪服從何種機率分 配?又,月薪超過5 萬元之比例為何?(10 分)
A 先生和B 先生是房地產經紀人。若X 表示A 先生在每個月內出售的 房屋數量,且Y 表示B 先生在每個月內出售的房屋數量。對他們過去每 個月表現的分析以下列聯合機率表(雙變量機率分布)來說明。 X 0 1 2 Y 0 0.12 0.42 0.06 1 0.21 0.06 0.03 2 0.07 0.02 0.01 計算3X+3Y 的期望值。(10 分)
甲部門負責檢查A 產品之品質,給予優、良、可、差四種評等。根據過去 幾年之經驗,A 產品屬於此四個類別之比例分別為10%、30%、40%、20%。 今年隨機抽取A 產品400 件予以檢查,其中屬於此四種評等之比例分別為 12.5%、24%、37.5%、26%。在0.01 顯著水準下,試檢定今年A 產品之品 質評等分布與過去幾年是否相同?(15 分)
假設一位大學生每月食用的比薩餅數量具有常態分配,平均值為10 個, 標準差為3 個。 一位大學生每月食用超過12 個比薩餅的機率是多少?(5 分) 在25 個學生的隨機樣本中,每月總共食用超過275 個比薩餅的機率 是多少?(10 分)
甲地區設置「樂齡學習中心」,提供A、B 與C 三種課程,這三種課程過去 四期的評鑑分數如下。假設評鑑分數分別為來自三個常態母體之隨機變數, 其母體平均數分別為 B A C    、、 ,而變異數相同。 A 79 78 83 80 B 90 84 91 95 C 80 78 82 76 試寫出ANOVA 表,並在顯著水準0.05 下,檢定三種課程之評鑑分數 是否相同。(15 分) 試估計母體變異數,並求出 B A    的95%信賴區間。(10 分)
商品生產行業員工的平均小時工資目前為24.57 美元。假設我們從製造 業中抽取員工樣本,看平均小時工資是否與商品生產行業報告的24.57 美元的平均值不同。假設來自製造業的30 名員工的樣本顯示了每小時 23.89 美元的樣本平均值,已知其母體標準差為每小時2.40 美元。在5% 的顯著水準下,你是否可以推論製造業的人口平均小時工資是否不同於 商品生產行業的人口平均小時工資?寫下假設檢定的過程,包括虛無與 對立假設,檢定統計量,並以p-value 決定檢定結果。(25 分)
「身高體重指數」(BodyMassIndex)是以身高、體重比例計算之指標,計算 公式為:體重(公斤)/身高平方(公尺平方)。「體脂肪率」(Body Fat Percentage)是全身脂肪重量占體重的比例。王主任隨機抽取20 位60 歲以 上男性,資料顯示兩變數之樣本相關係數為 0.56,以「身高體重指數」(y)對「體脂肪率」 (x)作線性迴歸,得到估計的標準誤(standard error of estimate)為5,以及右方殘差圖: 試寫出ANOVA 表。(10 分) 試求判定係數(coefficientofdetermination) 並解釋其意義。(5 分) 在顯著水準0.05 下,試檢定斜率係數是 否為正值。(10 分) 根據殘差圖試說明迴歸模型之假設是否 合理。(5 分)
2007 年《紐約時報》報導,美國家庭年收入中位數為55,500 美元。 2013 年14 個家庭收入(1,000 美元)的樣本數據按升序排列如下: 46.5, 48.7, 49.4, 51.2, 51.3, 51.6, 52.1, 52.1,52.2, 52.4, 52.5, 52.9, 53.4, 64.5 (平均數52.2,變異數16) 根據以上數據回答下列問題:(每小題15 分,共30 分) 計算五個數字的摘要(five-number summary),包括最小值,第一四分 位數(Q1),第二四分位數(Q2),第三四分位數(Q3),最大值。 使用z 分數方法,2013 年14 個家庭收入的樣本數據是否包含異 常值?若使用第一和第三四分位數的值以及四分位數範圍(即 (Q1-1.5(IQR),Q3+1.5(IQR)))來檢測異常值的方法,請比較其與使用z 分數方法的結果之差異。
某自助餐販賣的便當以重量計價,消費者平均消費金額為77 元,標準差 5 元。假設便當價格為常態分配。 隨機選取一位客人,其消費金額介於77 元和82 元的機率是多少? (6 分) 若以4 位客人為簡單隨機樣本,其平均消費金額介於77 元和82 元的 機率是多少?(6 分) 購買的便當消費金額至少要幾元才算是前2.5%高價的消費金額?(6 分) 要選取多少位客人,才能使平均消費金額的95%信賴區間的邊際誤差 (margin of error)控制在2 元以內?(7 分)
110年公務人員普通考試試題 類 科:經建行政、交通技術 科 目:統計學概要 考試時間:1 小時30 分 座號: 不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。 本科目除專門名詞或數理公式外,應使用本國文字作答。 44350 P(Z > ݖఈ) = ߙ; ݖ଴.଴ହ= 1.645; ݖ଴.଴ଶହ= 1.96; ݖ଴.ଶଵଵଽ= 0.8; ݖ଴.଴ହହଽ= 1.59; ݖ଴.଴ଶଷଷ= 1.99 P൫t > ݐఈ,௡൯= ߙ; ݐ଴.଴ଶହ,ଶଶ଴= 1.96 P(߯ଶ> ߯ఈ ଶ(݊)) = ߙ; ߯଴.଴ହ ଶ (10) = 18.307; ߯଴.଴ହ ଶ (4) = 9.488; ߯଴.଴ହ ଶ (6) = 12.592 P൫F > ܨఈ(݊ଵ, ݊ଶ)൯= ߙ; ܨ଴.଴ହ(2,27) = 3.35; ܨ଴.଴ଶହ(2,10) =5.46; ܨ଴.଴ହ(5,10) =3.33; ܨ଴.଴ହ(6,12) =3 已知隨機變數X 與Y 的二元機率分配如下: f (x, y) x y 0.2 50 80 0.5 30 50 0.3 40 60 計算X 與Y 的期望值與變異數。(8 分) 計算E(X+Y)與Var(X+Y)。(8 分) 計算X 與Y 的共變異數與相關係數,並判斷X 與Y 是正相關、負相 關或不相關。(9 分) 一間百貨公司分析它們最近的銷售情況,並且決定顧客購買商品的付款 方式與商品價格類別之間的關係,得到下表中的聯合機率: 現金 信用卡 簽帳金融卡 $20以下 .09 .03 .04 $20-$100 .05 .21 .18 $100以上 .03 .23 .14 以簽帳金融卡付消費款的比例為何?(5 分) 以信用卡支付之下,消費款超過$100 的機率為何?(5 分) 以信用卡或簽帳金融卡支付消費款的比例為何?(5 分) 44350 某週刊曾報導廣告主與網際網路服務供應商及搜尋引擎簽訂合約,在網 站上刊登廣告,付費方式是根據點擊該項廣告的潛在顧客的數目而定。 不幸的是,點擊詐欺(為了增加廣告收入而點擊該項廣告)已然成為問 題。40%的廣告主宣稱,他們成為點擊詐欺的受害者。假定隨機抽選380 位廣告主,以了解點擊詐欺的狀況: 樣本比例與母體比例的差距在± 0.04 以內的機率是多少?(5 分) 樣本比例大於0.45 的機率是多少?(5 分) 某醫學期刊中描述一項研究,想要判斷運動是否可以延長心臟麻痺病患 的生命。招募801 位心臟麻痺病患的樣本;其中395 位接受運動的訓練, 而另外的406 位則無。在接受運動的群組當中有88 位病患未能延長生 命,而在無運動群組中有105 位病患未能延長生命。 在5%的顯著水準下,研究人員是否可以推論運動訓練能夠延長生命? 寫下假設檢定的過程,包括虛無與對立假設、拒絕域、檢定統計量與檢 定結果。(15分) 有一位候選人在宣告參選之前,評估選民對他的初始支持率。不做任何 事前公開活動之前提下,若選民支持他的比例數p 大約0.15,他將投入 選戰。從隨機選取的n 個選民的ㄧ項民調中,該候選人希望比例數p 的 估計值y/n 距離p 在0.03 之內。也就是說,決策乃基於形如y/n ± 0.03 的ㄧ個95%信賴區間,y 代表支持該候選人的選民人數: 在候選人對於p 的大小沒有任何概念下,如何決定所需樣本數大小, 以便達到所求之可靠度及準確度?(5 分) 假設由該選區隨機選取1,068 個選民進行訪談,得到y = 214 個選民的 支持,求p 的95%信賴區間。根據此樣本所提供的訊息,該候選人是 否決定投入選戰?(5 分) 比較的最大誤差與0.03,說明為何會有如此差別?(5 分) 44350 統計課中一位成績接近底部的學生甲,決定投入一定的練習時數以改善 期末的成績。但是甲並不想做過多的練習,因為甲企圖以最少的工作量 達到最終畢業的目的。甲註冊一門統計課,離期末考僅有3 個星期,並 且最後學期總成績是以下列方式決定: 學期總成績=20%(作業)+30%(期中考)+50%(期末考) 為了決定在剩餘的3 星期內要付出多少努力,甲必須根據作業分數(有 20 分)與期中考分數(有30 分)去預測期末考成績。甲的這些分數分 別是12/20 與14/30。 甲蒐集去年選修這門統計課30 位學生的期末考分數、作業分數 (assignment),與期中考分數(midterm)。 利用以下30 位學生的資料所做的迴歸分析結果回答問題: 決定估計的迴歸方程式並檢定模型的有效性(5%的顯著水準)。(4 分) 估計的標準誤為何?如何詮釋這個統計量?(4 分) 判定係數為何?這個統計量提供什麼訊息?(4 分) 詮釋估計的迴歸方程式中每一個係數。(4 分) 在此模型中,檢定作業分數之係數是否為零(5%的顯著水準)?(4 分)
(10)
(4)
(6) 8 分
假設有四面骰子,其四面之點數分別為1、2、3、4 點。今擲出一對公正 的四面骰子,令X 等於較大點數的結果,例如若擲出點數為1 點與4 點, 則X 等於4 點。 試求(X) E 。(7 分) 試求 2 (X ) E 。(8 分) 試求Var(X)。(10 分)
男生是否比女生更願意花大錢購買高階手機?一項手機購買行為的調 查以男女各400 人為隨機樣本,其中有280 位男生願意花大錢購買高階 手機,而願意花此大錢的女生有200 人。以P1 與P2 分別代表母體中男 生與女生願意花大錢購買高階手機的比例。在0.05 顯著水準之下,檢定 男生比女生更願意花大錢購買高階手機。 試寫出虛無及對立假設。(5 分) 試寫出檢定統計量及結論。(10 分) 試求P1-P2 的95%信賴區間。(10 分)
研究者用多元迴歸分析,以燃料消耗量(單位mpg:英里/每加侖)及汽 車排氣量(單位:立方英寸)來預測汽車售價(單位:千元)。研究者隨 機抽取100 輛汽車進行研究,結果如下: ANOVA df SS MS F Regression Error 34,188,066 Total 43,506,728 係數 標準誤 截距 572.824 701.364 燃料消耗量 -9.362 13.344 汽車排氣量 7.515 2.641 若一輛汽車燃料消耗量為每加侖50 英里,排氣量為100 立方英寸, 售價為549,900 元。根據迴歸分析結果做預測,試問殘差為何?(5 分) 欲知汽車排氣量之係數是否顯著,試問檢定統計量為何?(6 分) 欲知燃料消耗量與汽車排氣量之係數是否同時為0,試問檢定統計量 為何?(7 分) 試問燃料消耗量和汽車排氣量可以解釋多少比例的汽車價格之變異 量?(7 分) 附表 Z分配表 附表 t分配表
已知12個燈泡中有5個瑕疵,任取4個來檢驗。 若取後不放回,請計算至少一個有瑕疵之機率。(5分) 若取後放回,請計算沒有瑕疵之機率。(5分) 請計算並比較取後放回及不放回,瑕疵個數的變異數有何不同。(10分)
下列是關於條件機率、常態分配及隨機變數之期望值的問題: 假定在一跟肺部有關疾病流行期間,共有3種可能型:A型、B型及 C型的肺部疾病。其中染病病人得病機率分別是得A型肺部疾病機率 為0.6、B型肺部疾病機率為0.3,而C型肺部疾病機率為0.1。這三型 肺部相關疾病皆可能有發燒及咳嗽的症狀,其中A型病人中20%有 發燒症狀,B型病人中60%有發燒症狀,而C型病人中80%有發燒症 狀;而且50%的A型病人有咳嗽症狀,35%的B型病人有咳嗽症狀, 25%的C型病人有咳嗽症狀。現有一染病病人有發燒症狀,請分別算 出此病人得這三型肺部疾病的機率並決定這病人最可能得那一型的 肺部疾病。(5分) 某一大型家電公司其某款售出產品之可用時間服從一平均值為μ (年)且變異數為2.25(年2)的常態分配。已知此產品可用超過5年 的機率為0.025,請算出μ的值及此產品可用時間不超過6個月的機 率。(5分) 一家口罩廠商得到一筆從某政局不穩定國家所下總值5千萬元的訂 單,給定有0.7的機率此廠商可收到此5千萬元訂單付款,有0.15的機 率僅可收到3千萬元付款,有0.1的機率僅可收到1千萬元付款,有0.05 的機率收不到任何付款。為保險起見,此廠商投保某一意外險,並 先支付1千萬元保費,承保之保險公司將支付此公司應收款項不足的 任何差額。如果隨機變數X代表此口罩廠商最終在此投保所花費或 賺到的金額。請算出X的期望值E(X)。(5分) 44450
下列是關於資料集中趨勢、分散趨勢及相對位置之統計量的問題: 某公司欲由其A分公司及B分公司所推薦之兩人擇一來晉升主管職 位。這兩家分公司員工績效成績資訊如下: A分公司 B分公司 績效成績84分在該分公司之z分數 0.5 3.0 績效成績72分在該分公司之z分數 −2.5 −1.0 該推薦員工在其所在分公司之績效成績 90.0 82.5 人事主管決定用z分數(z score)來決定晉升人選,請問是那一家分 公司推薦的員工得以晉升並說明原因。(5分) 一組樣本數為10且以華氏溫標為單位之溫度資料x1,…,x10,其重要資 訊如下: 第30百分位數 (30th percentile) 平均值 四分位距 (interquartile range) 變異數 變異係數 (coefficient of variation) 74.3 81.5 16.2 76.5 0.11 若以攝氏溫標為單位,即資料為   5 32 9 i i y x   , i = 1,…,10,請算出 關於攝氏溫標資料y1,…,y10的5個統計量:第30百分位數、平均值、 四分位距、變異數及變異係數。(10分) 一組資料其頻率分布圖呈現鐘形分布,利用經驗法則(empirical rule) 可得知區間[12,22]包含大約此組資料的95%資料。請利用經驗法則得 到包含大約此組資料的68%資料之區間。(5分)
快速檢驗(Rapid Test)經常被用來判斷某人是否有HIV(造成AIDS 的 病毒)。偽陽性與偽陰性發生的機率分別是0.03和0.08。一位醫師剛收到 一份快速檢驗報告,病患檢測的結果呈現陽性。在收到此報告之前,這 位醫師將這位病患歸類在低危險群,其為HIV 帶原的機率只有0.6%。 這位病患實際有HIV 的機率為何?(10分) 假設病患檢查結果是陰性,實際上是陽性的機率為何?(5分)
某保險理賠公司接獲申請理賠電話的間隔時間(單位:分鐘)為指數分 配: /3 1 ( ) , 0 3 x f x e x    請問接獲申請理賠電話的平均間隔時間是多少?(5分) 等待下一通申請理賠電話的時間大於30秒的機率為何?(5分) 請用卜瓦松分配計算5分鐘內都沒有來電申請理賠的機率為何?(10分) 43560
一公司利用簡單線性迴歸模式來建立其銷售額(Y)與所進行的廣告次 數(X)之間的關係。給定下列10組資料(y1, x1),…,(y10, x10),其中yi為 第i個月之銷售額,而xi為第i個月所進行的廣告次數,根據所得之資訊: 10筆銷售額資料y1,…,y10其平均值為130而變異數為1748,10筆廣告次 數資料x1,…,x10其平均值為14,此外,銷售額資料y1,…,y10與廣告次數資 料x1,…,x10其共變異數為316,利用最小平方法(least squares method) 所得估計迴歸關係式為Y = 60 + 5X。 若第3個月的銷售額為y3 = 88而所進行的廣告次數為x3 = 8,試算出 此月銷售額的配適值(fitted value)及殘差值(residual)。(5分) 算出判定係數(coefficient of determination)R2及銷售額資料y1,…,y10 與廣告次數資料x1,…,x10的相關係數。(5分) 在顯著水準α = 0.05,利用t檢定法檢定是否廣告次數會影響銷售額, 即檢定迴歸之線性關係式的斜率是否為0。(5分) 44450
治療師想了解,聽音樂是否能讓患有憂鬱症的病患降低其憂鬱指數,於 是抽選了7位病患,分別測他們聽音樂前及聽音樂後的憂鬱指數,資料如 下: 病患 1 2 3 4
下列是關於母體比率其估計量之抽樣分配及母體平均之檢定的問題: 欲判斷某生產線每日平均產量μ是否不少於一定數量,對此生產線隨 機取得16筆日產量資料且此16筆日產量資料其標準差為3。利用此組 樣本及t檢定法檢定此生產線每日平均產量μ是否不少於70,即檢定 H0:μ ≥ 70對H1:μ < 70,所得之p值(p value)為0.01。在顯著水準 α = 0.1,請利用此組樣本及t檢定法檢定每日平均產量μ是否不少於 69,即檢定H0:μ ≥ 69對H1:μ < 69。(10分) 針對母體比率p,p ≤ 0.5,利用樣本數為1600之隨機樣本所得之樣本 比率統計量P 來估計p,可得抽樣誤差P p  在0.015內的機率約為 0.8664。請算出p的可能值及當樣本數為2500時,P 大於0.22的機率。 (10分) 欲比較A廠牌儀器的平均壽命μ1與B廠牌儀器的平均壽命μ2之差異。 隨機抽樣7台A廠牌儀器,此7台A廠牌儀器壽命平均值為10,而隨 機抽樣9台B廠牌儀器,此9台B廠牌儀器壽命平均值亦為10。這16台 儀器之壽命變異數為4。在顯著水準α = 0.01,請利用t檢定法檢定 H0:μ1−μ2≥ 2對H1:μ1−μ2 <2。(10分)
欲比較三種不同品牌的電池其平均壽命是否一致,每種品牌電池各 隨機抽測5顆電池並記錄其壽命。這三組樣本其壽命的平均值分別為3、 4.5及3.6,而其壽命的標準差分別為1.5、1及1.5。在顯著水準α = 0.05, 請利用單因子變異數分析法(one-way ANOVA)來檢定這三種品牌電 池平均壽命是否一致,即檢定: H0:μ1 = μ2 = μ3對H1:μ1、μ2及μ3並不完全相等。 其中μ1、μ2及μ3分別是這三種品牌電池的平均壽命。(10分)
欲調查某種家電產品市場是否由四家廠商平均瓜分,即使用此四家廠 商之人數比率p1、p2、p3及p4皆為0.25。一組隨機樣本其樣本數為n之問 卷結果其資訊如下: 使用家電廠商A人數比率為27%,使用家電廠商B人數比率為25%,使 用家電廠商C人數比率為26%,使用家電廠商D人數比率為22%。根據 上述問卷結果,利用卡方檢定(chi-squared test)來檢定市場是否由此 四家廠商平均瓜分,即檢定: H0:p1 = p2 = p3 = p4 = 0.25對H1:並非p1 = p2 = p3 = p4 = 0.25。 在顯著水準α = 0.01,結果為拒絕H0。試求出n最小可能值。(已知n為 100的倍數)(10分) 44450 附表一 44450 附表二 44450 附表三 44450 附表四
聽音樂前 52 56 52 41 45 50 49 聽音樂後 47 51 45 38 43 46 42 請問病患聽音樂前後的平均憂鬱指數差異(後-前)約為何?(5分) 在0.05的顯著水準,利用臨界值法檢定是否聽音樂後會降低憂鬱指 數?(15分) 五、2017年某款750 ml 紅酒的拍賣價格及酒齡資料如下表: 酒齡(年) 36 20 29 30 34 價格($) 245 142 212 209 237 試用最小平方估計法(least squares estimation)建立一估計迴歸方程 式,來描述酒齡對拍賣價格的影響。(10分) 在0.05的顯著水準下檢定此迴歸線是否顯著。(10分) 使用此估計迴歸方程式預測25年酒齡的紅酒其拍賣價格。(5分)

統計 41 題

甲市警察局研究酒駕年齡之分布,已知其平均數為42 歲。(每小題10 分,共20 分) 若酒駕年齡服從常態分配,且介於34 至50 歲者占五成,試問酒駕 者中60 歲以上者占多少比例? 若酒駕年齡之分配未知,試問酒駕者中60 歲以上者占多少比例?
假設新冠肺炎之某快篩試劑的準確率為95%,亦即若有一人感染該病症, 那麼該試劑的檢測結果有95%的機率為陽性。反之,若一人未感染該病 症,那麼該試劑的檢測結果有9%的機率為(偽)陽性。若某一城市有25% 的人口已感染新冠肺炎,且該城市的某一市民使用該快篩試劑的檢測結果 為陽性,在此情形下,該市民實際感染新冠肺炎的機率為何?(15 分)
某甲投擲三個公正銅板(亦即正反面的出現機率皆為1/2),並觀察其落 地後的正反面結果。請回答下列問題: 請寫出此一隨機實驗的樣本空間(sample space)。(提示:三個銅板的 投擲結果若分別為“正面”、“反面”、“正面”,那麼樣本空間中有一個元 素為“(正反正)”,其餘類推)(5 分) 令隨機變數X 代表三個銅板投擲後的正面出現次數(例如,當三個銅板 的投擲結果分別為“正面”、“反面”、“正面”,那麼 2 X ,其餘類推), 請寫出X 的機率分布。(7 分) 請計算X 的期望值( ) E X 與變異數 ( ) Var X 。(8 分) 若有10000 人輪流做此種三個銅板的投擲實驗,得出如題之X 的 10000 個隨機變數 1 2 10000 , , , X X X  ,那麼 1 2 10000 10000 X X X X      會很接 近題那個數值?請說明你的答案及所依據的統計學定理。(10 分)
甲廠商宣稱其開發之A 型燈泡之平均壽命高於100 天。隨機抽取50 顆進行測試,得到其樣本平均數與樣本標準差分別為104 天與12 天。 (每小題10 分,共20 分) 在顯著水準為0.01 之下,試檢定廠商之宣稱是否成立? 若燈泡一出廠就有瑕疵而無法使用的機率為0.005,而其餘燈泡之壽 命服從平均數為105 天之指數分配。試問壽命低於5 天之機率為何?
健康單位提供各式抽獎獎項鼓勵40 歲以上民眾接受癌症篩檢,民眾 可以選擇一種獎項參與抽獎。以下是不同年齡層之篩檢人次及選擇抽 獎獎項之統計資料: 40-50 50-60 60-70 70+ 演唱會門票 70 60 50 30 Xbox360 80 30 30 20 登山踏步健身機 80 80 70 60 在顯著水準為0.05 之下,試檢定年齡層與獎項是否相關?(10 分) 在顯著水準為0.05 之下,試檢定各年齡層之篩檢人次是否相同? 並檢定各式獎項之篩檢人次是否相同?(20 分)
某賣場經理為研究其顧客之入場消費情況,他隨機抽取了400 個顧客的消 費紀錄,發現這400 個顧客的平均消費金額為新臺幣(下同)2150 元,並 且已知其賣場顧客消費金額的(母體)標準差為625 元,且其顧客的消費 金額呈常態分布。 請計算出全體入場顧客平均消費金額的95%信賴區間。(15 分) 如果賣場經理覺得題的信賴區間太寬,那麼在維持信心水準95%及消 費金額標準差不變的情況下,應該怎麼做才能讓信賴區間變窄?請說明 你的理由。(5 分) 如果其他情況保持不變,將信賴區間的信心水準由95%降至90%,則信 賴區間會變窄還是變寬?請說明你的理由。(5 分) 若在進行抽樣調查之前,賣場經理決定使用樣本平均數(sample mean) 做為所有顧客平均消費金額的點估計,且已知其賣場顧客消費金額 的(母體)標準差為625 元,在此情形下,其顧客消費金額的抽樣數目 應至少設定為多少,才能有95%的機率使估計誤差可以控制在50 元 以內?(10 分)
甲、乙、丙三種疾病第四期病人之存活年數統計資料如下,在顯著水 準為0.1 之下,試問三種疾病存活年數之分布是否相同?(10 分) <1 1-2 2-3 3-4 >4 甲 8 10 11 4 2 乙 30 15 8 3 1 丙 16 9 3 2 0
某人修習一門程式設計課程,並撰寫了模擬投擲骰子的程式,任課老師為 了檢定其程式是否能模擬出公正的擲骰子實驗(亦即1、2、3、4、5、6 點 的出現機率皆為1/6),於是利用該程式模擬出120 次的骰子投擲,其結 果如下: 點數 1 2 3 4
假設手機的應用程式之生命週期(y)(單位:年)與其發布後半年內的 下載次數(x)服從線性模型,y x e     ,其中e 服從 2 (0, ) N  。 若隨機取樣12 款已經被市場淘汰之應用程式,得到以下數據: 2 2 6345, 4050445, 39.64, 152.7, 24708 x x y y xy           , 且判定係數為0.9288。(每小題10 分,共20 分) 試求回歸方程式與β 的95%信賴區間。 若一新款應用程式發布後半年內被下載500 次,試求其生命週期的 95%預測區間。 附表一:z 表 Example: If z=1.96, then (0 to z)=0.4750 附表二:t 表 Example: With df =9 and .10 area in the upper tail, t =1.383 附表三:χ2 表 Example: With 17 df and a 0.02 area in the upper tail,X2=30.995 附表四:F 表 附表五:F 表
出現次數 15 25 22 17 25 16 請寫出任課老師進行卡方適合度檢定(goodness of fit test)的虛無假設 與對立假設。(5 分) 請寫出在題之虛無假設下,該程式在此實驗中生成骰子點數1、2、3、 4、5、6 的期望出現次數。(5 分) 請以題與題的結果進行適合度檢定,並說明該修課的同學,其程式 是否能成功模擬公正骰子的投擲。(10 分) 常態機率表 常態機率表使用示例: 0.00 1.29 0.9015 卡方機率表使用示例: 0.00 9.49 面積=0.05 4 2 卡方機率表
豪華型價格(美元) 39 39 45 38 40 39 35 標準型價格(美元) 27 28 35 30 30 34 29 該製造商建議的兩種型號零售價有10 美元的價差。請以0.05 的顯著 水準,檢定這兩種型號價格之間的母體平均差是否為10 美元。 請計算兩種型號平均價格之差的95%信賴區間。 t 分配的左尾機率: ( ) ( ) T t df P T t p    , 自由度 5 5 5 5 5 5 5 t 值 3.3649 2.5706 2.015 1.4759 0.9195 0.7267 0.5594 機率值p 0.01 0.025 0.05 0.1 0.2 0.25 0.3 自由度 6 6 6 6 6 6 6 t 值 3.1427 2.4469 1.9432 1.4398 0.9057 0.7176 0.5534 機率值p 0.01 0.025 0.05 0.1 0.2 0.25 0.3 自由度 7 7 7 7 7 7 7 t 值 2.998 2.3646 1.8946 1.4149 0.896 0.7111 0.5491 機率值p 0.01 0.025 0.05 0.1 0.2 0.25 0.3 四、一名氣象觀測員記錄了過去5 年來,每年5 月同一個5 日期間的每日最 高氣溫(單位:℉),數據如下: 55, 86, 94, 58, 55, 95, 55, 52, 69, 95, 90, 65, 87, 50, 56, 55, 57, 98, 58, 79, 92, 62, 59, 88, 65 該觀測員想檢定這些數據是否服從常態分配。他採用卡方適合度檢定, 並在常態分配的假設下,依據累積百分比(20%、40%、60%、80%)將 資料分為5 個組別,計算出的組界如下:第1 組:小於56.72;第2 組: 56.73~66.75;第3 組:66.76~75.25;第4 組:75.26~85.28;第5 組: 85.29 及以上。在α = 0.01 的顯著水準下,請根據計算結果,說明統計檢 定結論為何?(需寫出虛無假設及此檢定的自由度,需計算檢定統計量 及決定臨界值)(15 分) 卡方分布臨界值表(α = 0.01) 自由度(df) 1 2 3 4 5 6 7 臨界值 6.6349 9.2103 11.3449 13.2767 15.0863 16.8119 18.4753 五、六家小型租車公司的營運車輛數(千輛)與年營收(百萬美元)之間的 關係如下表: 公司名稱車輛數(千輛)年營收(百萬美元) 安順租車 11.5 118 節省租車 10.0 135 王牌租車 9.0 100 優選租車 5.5 37 三角租車 4.2 40 超值租車 3.3 32 令x 營運車輛數(千輛),y 年營收(百萬美元),估計的迴歸方程式 為ˆ 17.005 12.966 y x   。此模型的誤差平方和SSE 1043.03  。請回答下 列問題:(每小題10 分,共20 分) 計算判定係數並解釋此數值的意義。說明估計的迴歸方程式是否提供 良好的配適? 樣本相關係數值為何?根據此係數,營運車輛數與年營收之間呈現強 相關還是弱相關?
假設股票本益比樣本的平均值為13.5,標準差為2。如果這些股票本益比 呈現鐘形分布,說明落在11.5 及15.5 之間的股票本益比的比例為何?落 在7.5 及19.5 之間的股票本益比的比例為何?(15 分)
目前核融合技術的重大突破,讓未來核融合發電可望成真。已知國內某 大學的實驗室有三座核融合反應爐,令變數 iT 為第i 座反應爐的核融合 實際反應時間與目標反應時間之間的差異, 1,2,3 i  。假設變數 1
3 名學生參加某家大型企業公司的暑期工作面試,每個學生的面試結果, 要不是收到某個職位的錄用通知(Y),就是沒有收到錄用通知(N)。實 驗結果(experimental outcome)是根據3 名學生面試的結果來定義。 請列出所有可能實驗結果。(10 分) 定義一個代表錄用人數的隨機變數,說明該隨機變數之類型及其可能值 之範圍。寫出每個實驗結果對應的隨機變數之值。(15 分)
依據某國家勞動統計單位報告指出,2018 年有10.2%的工人加入工會。假 設某工會在2023 年蒐集了400 名工人的樣本,詢問是否會加入工會,樣 本結果顯示,400 名工人中有47 名工人加入工會。在5%的顯著水準下, 以計算p 值的方式進行假設檢定,並寫下假設檢定的所有過程,請確認工 會組織持續的努力是否有提升工人加入工會的意願?(20 分)
, , T T T 彼 此相互獨立,且都服從平均數為0,變異數為4 之常態分配。 求出機率 2 2 1 2 [ + 2] P T T  。(10 分) 令變數 ,請求出變數S 之機率密度函數 ( ) f s 。(10 分) 令變數 2 1 2 2 1 2 T T T W   ,請求出變數W 之機率密度函數 ( ) f w 。(10 分) 求出題之變數W 的期望值 ( ) E W 。(10 分) 求出機率 1 2 3 [ { { , }, }<0] P Min Max T T T ,此處 { , } Max a b 代表取,a b 之最大 值, { , } Min a b 代表取 之最小值。(10 分) 假設每一座反應爐每次點火成功的機率為0.2,且假設三座反應爐點火 成功與否彼此相互獨立。令 i X 為第i 座反應爐直到第一次點火成功前, 所需的點火(失敗)次數, 1,2,3 i  。請求出機率 1 2 [ ] P X X  。(10 分) 二、ChatGPT 的問世帶動了AI 商機的蓬勃發展,也促成了市場對GPU 需求 量的急遽增加。已知國內某生產GPU 的工廠,所生產的GPU 之壽命服 從變異數為之指數分配。今由此公司之生產線隨機抽檢n 筆GPU 樣本 並測驗其壽命,令 1 2 , ,..., n Y Y Y 表此n 筆相互獨立樣本之觀測值。令 1 2 { , ,..., } n Min Y Y Y 代表取 1 2 , ,..., n Y Y Y 之最小值, 1 2 { , ,..., } n Max Y Y Y 代表取 1 2 , ,..., n Y Y Y 之最大值。 求出此GPU 壽命分配之中位數的均勻最小變異不偏估計量(uniformly minimum variance unbiased estimator)。(10 分) 求出機率 1 2 [ { , ,..., } 1] n P Min Y Y Y  之最大概似估計量(maximum likelihood estimator)。(10 分) 求出機率 1 2 1 2 [ { , ,..., } 1, { , ,..., } 2] n n P Min Y Y Y Max Y Y Y   。(10 分) 令 ( ) F y 為變數 iY 之累積分配函數(cumulativedistributionfunction)。請求出 機率 1 1 1 2 1 2
有2 家具有支配市場地位的公司,公司A 與公司B 最近積極執行廣告活 動以增加其產品的市場占有率。在廣告活動開始之前,公司A 的市場占有 率是45%,公司B 的市場占有率是40%,其他競爭者則為其餘的15%。 為了確認廣告活動之後這些市場占有率是否有所改變,公司A 蒐集了200 位使用該項產品之顧客的隨機樣本,並詢問對產品偏好的資料。200 位顧 客當中,102 位表明偏好公司A 的產品,82 位偏好公司B 的產品,其餘 16 位偏好其他競爭者的產品。在5%的顯著水準下,請以卡方檢定來判定 在廣告活動之後,顧客偏好的程度是否改變,並寫下假設檢定的所有過程。 (25 分)
2 [ { ( ), ( ),..., ( )} , { ( ), ( ),..., ( )} ] n n P Min F Y F Y F Y Max F Y F Y F Y   。 (10 分) 2 2 2 1 2 3 S T T T    ,a b
湯泉庭園綠化公司蒐集了14 戶家庭房屋價值(單位:千美元,下同)和景 觀美化支出的數據,希望開發預測模型來向潛在客戶行銷。令x =房屋價值, y =景觀美化支出,原始資料整理如下: / 5,761/14 411.5 / 211.7 /14 15.1214 i i x x n y y n       2 ( )( ) 8,194.15 ( ) 382,633.5 i i i x x y y x x        請使用最小平方法建立估計迴歸方程式,並預測價值575 千美元的房屋所 需的景觀美化支出。(15 分)
某煞車片製造商為了解其產品性能,選了10 部車作實驗。X 為車速(公 里/小時),Y 為緊急煞車後的滑行距離(公尺),資料及迴歸ANOVA 結 果如下: car 1 2 3 4 5 6
9 10 Y 1.6 2.1 2.6 3.6 4.2 4.3 4.9 5.5 5.0 6.2 X 30 40 40 50 50 60 70 80 80 90 Predictor Coef StDev T P Constant -0.2371 0.4407 -0.54 0.605 X 0.07181 0.00710 (a) (b) Analysis of Variance Source DF SS MS F P Regression 19.031 19.031 102.3 0.000 Error (c) (d) 0.186 Total (e) (f) 填滿以上表中空白(a)~(f)。(15 分) 求該迴歸模式之判定係數R 平方(R square)。(5 分) 附表一 常態分配表 附表二 F 分配臨界值表 v2(d.f.) v1(d.f.) α=0.05 P( F>Fa)=α α Fa 0
一汽車生產工廠將某日生產的309部汽車,依A、B、C、D四種缺點及大、 中、小三種車型,分別檢驗並記錄其資料如下表: 車型\缺點 A B C D 大 15 21 45 13 中 26 31 34 5 小 33 17 49 20 在α = 0.05下,試以卡方檢定汽車缺點與車型大小是否有關(請詳細寫出 a.虛無與對立假設、b.檢定統計量公式、c.拒絕域、d.檢定值之計算過程、 e.檢定結果與結論)?(25分)
已知函數݂௑(ݔ)為 ݔ 0 1
݂௑(ݔ) 1/3 1/2 1/6 試求:(每小題5分,共25分) 驗證݂௑(ݔ)為一機率函數。 ܲ(ܺ≤2.5|ܺ> 1)。 ܸܽݎ(ܺ)。 ܧ[(ܺ+ 1)ସ]。 ܸܽݎ[(ܺ+ 1)ଶ]。 三、在簡單直線迴歸中,設自變數ܺ為廣告費用,應變數ܻ為銷售量,樣本 數n = 10。已知: ෍ݔ௜ ௡ ௜ୀଵ = 140, ෍ݕ௜ ௡ ௜ୀଵ = 1300, ෍ݔ௜ݕ௜ ௡ ௜ୀଵ = 21040, ෍ݔ௜ ଶ ௡ ௜ୀଵ = 2528, ෍ݕ௜ ଶ ௡ ௜ୀଵ = 184730 用最小平方法求迴歸直線。(10分) 求斜率ߚଵ之95%信賴區間。(10分) 求判定係數ܴଶ。(5分)
為了測定工廠安全訓練的效率,下列資料是12家工廠於安全訓練前之年 平均意外事件數(X)和安全訓練後之年平均意外事件數(Y): ܺ 50 87 37 141 59 65 24 88 25 36 50 35 ܻ 41 75 35 129 60 53 26 85 29 31 48 37 假設資料的差異具有常態分配。令d =XY,請以顯著水準α = 0.05,進行單 尾檢定,以檢定安全訓練的效果(請詳細寫出a.虛無與對立假設、b.檢定統 計量公式、c.拒絕域、d.檢定值之計算過程、e.檢定結果與結論)。(25分) 附表一:t值表 α ∞ 附表二:卡方分配臨界值表
(X ) , 1, 0, 4, 8. 4 P x x    求母群體平均數E(X)。(5 分) 求母群體的變異數Var(X)。(5 分) 驗證Var(X+1)是否與Var(X)相等?需計算Var(X+1)。(5 分) 驗證Var(-X)是否與Var(X)相等?需計算Var(-X)。(5 分) 假設兩隨機變數X 和Y,其聯合質量機率函數如下: , , (X , Y ) 1,2,4 1,2 23 x y P x y x y       。 計算隨機變數X 和Y 的各自邊際質量機率函數。(10 分) 隨機變數X 和Y 是否獨立?驗證你的答案。(10 分) 一位研究人員對特定的公司比較女性和男性員工的工資,已知男女員工 薪資服從常態分配。簡單隨機抽樣得23 名獨立樣本,其中8 名女性員 工和15 名男性員工。全部雇員每月的工資如下(以萬元計): 女性 4.95 7.60 5.56 9.04 5.20 10.05 7.43 6.60 男性 7.22 5.18 5.62 9.04 8.80 11.50 5.20 8.05 5.00 4.80 12.50 9.70 7.50 6.05 16.40 在5%的顯著水準下,數據是否提供了足夠的證據得出結論公司女員工 平均工資低於男員工平均工資。 寫出此題的虛無假設與對立假設。(5 分) 兩組資料的變異數(variance)是否相等?以適當的檢定統計量計算之。 (12 分) 陳述子題之檢定統計量並利用上述資料計算之。(12 分) 陳述子題的棄卻域(rejection region),並作此題的結論。(11 分) 0.05,22 , 1.717 t  0.05,21 , 1.721 t  0.05,20 , 1.725 t  0.95,22 , 1.717 t  0.95,21 , 1.721 t  0.95,20 , 1.725 t  0.05,7,14 , 2.7642 f  0.05,8,15 , 2.6408 f  0.05,14,7 , 3.5292 f  0.05,15,8 3.2184 f  。
關於事件A、B、C,已知  P 0.24 A B  ∩ ,  P | 0.2 A B C  ∩ , P 0.6 C  , C表C 的補集。求  P A B C ∩ ∩ 。(15 分)
三種遺傳型態A、B、C 在某基因模式下,出現機率分別為 /6 /3   、 、 (1 / 2)   ,研究者收集120 位受測者,A、B、C 人數分別為10、25、85 人。 (每小題10 分,共20 分) 求之最大概似估計。 請問在α 0.05  下,檢定該模式是否合適?
八位受試者接受某降膽固醇藥物,接受前先測量一次,接受後再測量一 次,結果如下表。下降表示該藥物有效果。請以符號檢定(Sign test)在 α 0.05  顯著水準下檢定H1:藥物對降膽固醇有效果。(20 分) 受試者 1 2 3
前 51 48 52 62 64 51 55 60 後 46 45 53 48 57 55 42 50 四、教育當局想測試A、B 兩區學童數學程度是否相同,A 區250 位學童受 測,及格比率0.40,B 區200 位學童受測,及格比率0.37。請以α 0.01  顯著水準下檢定兩區學童數學測試及格之比例是否相同?(25 分) 五、反應變數Y 在三組(以類別變數X=1,2,3 表示)中的母體平均為u1、u2、u3。 為比較此三平均之差異,會將X 轉成2 個虛擬變數1 2 x x 、 ,然後配適迴歸 模式 0 1 1 2 2 Y x x         。假設三組樣本數相同。 若虛擬變數(1 2 , x x )的設定為: X=1 時,1 1 x , 2 0 x  X=2 時,1 0 x , 2 1 x  X=3 時,1 0 x , 2 0 x  結果顯示:1顯著大於0 而 2 顯著小於0。請依此比較u1、u2、u3的大小。 (20 分) 附表一、߯ଶ分配右尾百分點߯ఈ ଶ(݂݀) 附表二、常態分配表
某單位250 人中,100 人訂A 報,125 人訂B 週刊,75 人兩種都沒訂。 求兩者都訂的機率。(7 分) 兩事件(訂A 報,訂B 週刊)是否獨立?說明之。(8 分)
110年公務人員普通考試試題 類 科:統計 科 目:統計學概要 考試時間:1 小時30 分 座號: 不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。 本科目除專門名詞或數理公式外,應使用本國文字作答。 參考值: z0.006=2.51,z0.01=2.33,z0.025=1.96,z0.05=1.65,z0.1=1.28, t0.025, 8=2.31,t0.025, 9=2.26,t0.05, 8=1.86,t0.05, 9 =1.83, χ3, 0.025 2 =9.35,χ4, 0.025 2 =11.14,χ5, 0.025 2 =12.83,χ3, 0.05 2 =7.81,χ4, 0.05 2 =9.49,χ5, 0.05 2 =11.07 χ3, 0.1 2 =6.25,χ4, 0.1 2 =7.78,χ5, 0.1 2 =9.24 X 族人之平均身高為160 公分,標準差為10 公分。某製造商欲生產一 款長度為200 公分之床墊。假設床墊之長度必須比身長多出至少15 公 分方能讓使用者感覺舒適。 若不知X 族人身高之分配為何,試問約有多少比例族人使用此床墊感 覺舒適?(10 分) 若X 族人之身高服從常態分配,試問感覺舒適之比例為何?(10 分) 甲公司有4 名員工,月薪分別為4 萬、6 萬、8 萬、8 萬。經由簡單計算 已經求出母體平均數(ߤ)為6.5 萬,母體變異數(ߪଶ)為2.75 萬。今擬以抽 後不放回的方式抽取2 名員工,得樣本平均數 ܺതଶ。將 ܺതଶ的平均數與變 異數分別記為ߤ௑തమ與(ߪ௑തమ)ଶ。 試寫出ܺതଶ之機率分配,並依此計算ߤ௑തమ與(ߪ௑തమ)ଶ。(10 分) 假設母體個數為N,以抽後不放回的方式抽取n個值,將樣本平均數之 變異數記為(ߪ௑ത೙)ଶ。在考量有限母體修正係數之下,試寫出(ߪ௑ത೙)ଶ與ߪଶ 之關係式。(5 分) 當樣本數n遠小於母體數N時,試問中之修正係數近似何值?(5 分) 甲乙丙為三名職棒左打者,下表為去年此三名打者面對左投手與右投手 時之表現。 打數(左投)安打數(左投) 打數(右投) 安打數(右投) 甲 224 63 532 116 乙 245 49 567 238 丙 231 35 525 147 棒球打擊率之計算公式如下:打擊率=安打數/打數 試分別計算甲乙丙於左投時之打擊率的95%信賴區間,並依此兩兩比 較(甲、乙)、(乙、丙)、(甲、丙)面對左投手時之打擊率是否不同? (10 分) 在顯著水準0.1 下,試檢定甲打者面對左投與右投時,打擊率是否不同? (10 分) A 辦事處使用抽號機供訪客抽取號碼,並使用叫號機呼叫訪客前往櫃檯 接受服務。根據過去一週抽號機與叫號機之紀錄,製作訪客到訪之等候 時間(分鐘)與人次如下: 等候時間 (0, 5) [5, 10) [10, 15) [15, 20) [20, 30) 人次 147 65 22 9 7 試求平均等候時間。(5 分) 在顯著水準0.1 下,試檢定等候時間是否服從指數分配。(期望值為ߣ 的指數分配之機率密度函數為݂(ݔ) = (1/ߣ)݁ି௫/ఒ, ݔ≥0;累積機率分 配函數為ܨ(ݔ) = 1 − ݁ି௫/ఒ, ݔ≥0。)(10 分) 賈先生欲購買一輛油電混合二手車。他蒐集一組隨機樣本,其中車齡 (年)與價格(萬元)之資料如下: X:車齡 8 3 6 5 5 2 8 10 9 8 Y:價格 55 145 82 68 100 140 35 40 65 70 已經算出ܵ௫௫= ߑ(ݔ−ݔ¯)ଶ= 62.4,ܵ௬௬= ߑ(ݕ−ݕ¯)ଶ= 12948, ߑ(ݔ−ݔ¯)(ݕ−ݕ¯) = −808。 在顯著水準0.05 下,試檢定車齡與價格之相關係數是否為負值。(5 分) 考慮以價格為依變數、車齡為因變數之線性回歸模型。試求出回歸方 程式,並於顯著水準0.05 下,試檢定斜率係數是否為負值。(10 分) 試比較之檢定統計量之異同。(5 分) 試求出判定係數,並說明其意義。(5 分)
已知ܺଵ, … , ܺସ為期望值ߤ、變異數σଶ的隨機變數。令ܺത= (ܺଵ+ ܺଶ+ ܺଷ+ ܺସ)/4。 試求 1 ( 1.5 ) P X     的最小值。(5 分) 試求( 1.5 ) P X     的最小值。(5 分) 若ܺଵ, … , ܺସ服從常態分配,試求 1 ( 1.5 ) P X     。(5 分) 同,試求( 1.5 ) P X     。(5 分)
某單位接受客戶委託進行民意調查以了解某政策之支持率;假設一份有 效樣本之成本為100 元。 若客戶要求抽樣誤差在正負2 個百分點內,且信心水準需達95%,則 調查所需成本為何?(10 分) 若客戶要求抽樣誤差在正負2 個百分點內,但願意支付之經費為 160,000 元(即最多1,600 份有效問卷)。試問在此限制下之信心水準 為多少?(10 分)
某醫院想測試三種不同牆壁材質之靜音效果。在其三個樓層的建築中, 每層隨機選12 間房,這12 間隨機均勻分配到三種材質其中一種。實驗 總共蒐集到36 個測量值。 說明此種實驗的名稱。(5 分) 以「樓層」和「材質」執行含有交互作用的二因子變異數分析(two- way ANOVA)得到以下變異數分析表: Source DF SS MS 材質 2 250.48 125.24 樓層 2 413.92 206.96 樓層*材質 4 64.21 16.052 Error 27 339.6 12.578 在顯著水準0.05 之下,試檢定三種材質效果是否有差異。(10 分)
設x 為身高,y 為體重。分析師甲以y 對x 做線性迴歸,得估計式 ݕ= ߚመ଴+ ߚመଵݔ。乙以x 對y 做線性迴歸,得估計式ݔ= ߛො଴+ ߛොଵݕ。 若身高單位由公分改成公尺,體重單位不變,試問新迴歸式的ߚመଵ、ߛොଵ 是否改變?和原來的估計之關係為何?(10 分) 同,試問檢定ܪ଴:ߚଵ= 0的t -檢定統計量會如何改變?(t -檢定統計 量為ߚመଵ/se(ߚመଵ), 其中se(ߚመଵ)為ߚመଵ的標準誤(standard error))。(10 分) 試以ߚመ଴、ߛො଴、ߚመଵ、ߛොଵ表示x 和y 的相關係數ρ。(10 分) 註:本試題可能使用之數值如下: √2 ≒1.414,√3 ≒1.732,√5 ≒2.236,√7 ≒2.646 標準常態分配表P(Z < Zα)
下表為108年某縣政府家庭收支調查的300個樣本戶住宅面積的分組次數 分配表資料: 組別 住宅面積(坪) 戶數 累積戶數 1 0~20以下 18 18
為開發某新型流行病的檢測工具,研發單位分別招募經醫師診斷確認 已得病與未受感染的自願受測者。檢測結果顯示,已得病者的陽性率 為90%;未受感染者的陰性率為95%。過去的資料顯示這個新型疾病 的盛行率(整體得病的比率)大約15%。根據這些檢測工具的資訊, 請回答下列問題: 整體的陽性率為何?(8分) 檢測為陽性的民眾其得病的機率為何?檢測為陰性的民眾其未受 感染的機率為何?(12分)
20~40以下 177 195
咖啡豆批發商販售母豆(或稱平豆,為雙核果咖啡豆)、公豆(或稱 圓豆,為單核果咖啡豆)以及混合豆(公、母豆以特定比例混合)等 三類型咖啡豆。某連鎖咖啡店欲購買一批標示為30%混合咖啡豆(公 豆顆數約30%),透過重量推估,這批貨約N 顆咖啡豆,為確保品質 (公豆比例超過30%),採購經理先隨機取出100顆混合豆樣本,逐一 檢視並記錄其中公豆的個數,記為x,作為下單決策的參考。假設真 正的混合比例為p,請回答下列問題: 請以隨機變數的概念,寫出公豆個數X的分配,以及其對應的常態 近似分配。(10分) 經理將透過統計檢定決定是否採購,並希望該決策的錯誤率控制 在5%內。請寫出適當的檢定假說、檢定統計量的計算公式、臨界 值,以及棄卻域,在x=38下,完成檢定假說並建議經理,是否採 購。(15分)
40~60以下 57 252

交通技術 10 題

某A 先生同時符合長照交通接送服務和復康巴士接送服務資格,此二個 交通接送服務是個別獨立作業,根據過去統計資料,訂到長照交通接送 服務的機率為0.6,訂到復康巴士接送服務的機率為0.4,試求A 先生: (1)可訂到長照交通接送服務或復康巴士接送服務的機率。(2)連續二 次都可訂到長照交通接送服務的機率。(3)沒訂到長照交通接送服務, 也沒訂到復康巴士接送服務的機率。(25 分)
(1)
(2)
(3) 25 分
某研究應用皮爾森相關係數(Pearson’s correlation coefficient)探討兩個 數值型變數間的關係,該研究分析結果之皮爾森相關係數(r)值=0.1。 請說明此分析結果之意義,並說明將進行那些統計分析以了解其關係。 (25 分)
某二個縣市過去上半年中,每個月的道路交通事故死亡率(每十萬人口 的死亡人數)如下表所示。假設甲和乙二個縣市交通事故死亡率之變異 數相等,在=0.05 之顯著水準下,請分析這二個縣市道路交通事故死亡 率是否有差異?(25 分) 縣市別 月份 1 2 3
甲 14.4 13.0 12.0 11.6 12.5 12.2 乙 12.3 11.8 11.1 12.0 10.2 11.8 四、某地區A 路口闖紅燈問題嚴重,主管單位欲了解該路口闖紅燈問題與車 種關連性進行調查,其結果如下表所示。在=0.05 之顯著水準下,請分 析汽車與機車闖紅燈之比例是否相同?並以闖紅燈率解釋該路口闖紅 燈問題與車種關連性。(25 分) 車種 是否闖紅燈? 是 否 合計 機車 250 4,750 5,000 汽車 120 3,880 4,000 合計 370 8,630 9,000 附表一:標準化常態分配機率表 附表二:t分配表 ߙ P(tk≥tk,ߙ)=ߙ tk,ߙ 單尾顯著水準 附表三:卡方分配表
判定下列各子題之真偽,如為錯誤,試舉例說明。 當一組資料均為負值時,則中位數、變異數、眾數均為負值。(6 分) 當一組資料之變異數等於0,則平均數、中位數、眾數均等於0。 (6 分) 當一組資料之全距愈大,則平均數、中位數、眾數也愈大。(6 分) 當一組資料呈單峰右偏分配,則平均數小於中位數與眾數。(7 分)
110年公務人員普通考試試題 類 科:經建行政、交通技術 科 目:統計學概要 考試時間:1 小時30 分 座號: 不必抄題,作答時請將試題題號及答案依照順序寫在試卷上,於本試題上作答者,不予計分。 本科目除專門名詞或數理公式外,應使用本國文字作答。 44350 P(Z > ݖఈ) = ߙ; ݖ଴.଴ହ= 1.645; ݖ଴.଴ଶହ= 1.96; ݖ଴.ଶଵଵଽ= 0.8; ݖ଴.଴ହହଽ= 1.59; ݖ଴.଴ଶଷଷ= 1.99 P൫t > ݐఈ,௡൯= ߙ; ݐ଴.଴ଶହ,ଶଶ଴= 1.96 P(߯ଶ> ߯ఈ ଶ(݊)) = ߙ; ߯଴.଴ହ ଶ (10) = 18.307; ߯଴.଴ହ ଶ (4) = 9.488; ߯଴.଴ହ ଶ (6) = 12.592 P൫F > ܨఈ(݊ଵ, ݊ଶ)൯= ߙ; ܨ଴.଴ହ(2,27) = 3.35; ܨ଴.଴ଶହ(2,10) =5.46; ܨ଴.଴ହ(5,10) =3.33; ܨ଴.଴ହ(6,12) =3 已知隨機變數X 與Y 的二元機率分配如下: f (x, y) x y 0.2 50 80 0.5 30 50 0.3 40 60 計算X 與Y 的期望值與變異數。(8 分) 計算E(X+Y)與Var(X+Y)。(8 分) 計算X 與Y 的共變異數與相關係數,並判斷X 與Y 是正相關、負相 關或不相關。(9 分) 一間百貨公司分析它們最近的銷售情況,並且決定顧客購買商品的付款 方式與商品價格類別之間的關係,得到下表中的聯合機率: 現金 信用卡 簽帳金融卡 $20以下 .09 .03 .04 $20-$100 .05 .21 .18 $100以上 .03 .23 .14 以簽帳金融卡付消費款的比例為何?(5 分) 以信用卡支付之下,消費款超過$100 的機率為何?(5 分) 以信用卡或簽帳金融卡支付消費款的比例為何?(5 分) 44350 某週刊曾報導廣告主與網際網路服務供應商及搜尋引擎簽訂合約,在網 站上刊登廣告,付費方式是根據點擊該項廣告的潛在顧客的數目而定。 不幸的是,點擊詐欺(為了增加廣告收入而點擊該項廣告)已然成為問 題。40%的廣告主宣稱,他們成為點擊詐欺的受害者。假定隨機抽選380 位廣告主,以了解點擊詐欺的狀況: 樣本比例與母體比例的差距在± 0.04 以內的機率是多少?(5 分) 樣本比例大於0.45 的機率是多少?(5 分) 某醫學期刊中描述一項研究,想要判斷運動是否可以延長心臟麻痺病患 的生命。招募801 位心臟麻痺病患的樣本;其中395 位接受運動的訓練, 而另外的406 位則無。在接受運動的群組當中有88 位病患未能延長生 命,而在無運動群組中有105 位病患未能延長生命。 在5%的顯著水準下,研究人員是否可以推論運動訓練能夠延長生命? 寫下假設檢定的過程,包括虛無與對立假設、拒絕域、檢定統計量與檢 定結果。(15分) 有一位候選人在宣告參選之前,評估選民對他的初始支持率。不做任何 事前公開活動之前提下,若選民支持他的比例數p 大約0.15,他將投入 選戰。從隨機選取的n 個選民的ㄧ項民調中,該候選人希望比例數p 的 估計值y/n 距離p 在0.03 之內。也就是說,決策乃基於形如y/n ± 0.03 的ㄧ個95%信賴區間,y 代表支持該候選人的選民人數: 在候選人對於p 的大小沒有任何概念下,如何決定所需樣本數大小, 以便達到所求之可靠度及準確度?(5 分) 假設由該選區隨機選取1,068 個選民進行訪談,得到y = 214 個選民的 支持,求p 的95%信賴區間。根據此樣本所提供的訊息,該候選人是 否決定投入選戰?(5 分) 比較的最大誤差與0.03,說明為何會有如此差別?(5 分) 44350 統計課中一位成績接近底部的學生甲,決定投入一定的練習時數以改善 期末的成績。但是甲並不想做過多的練習,因為甲企圖以最少的工作量 達到最終畢業的目的。甲註冊一門統計課,離期末考僅有3 個星期,並 且最後學期總成績是以下列方式決定: 學期總成績=20%(作業)+30%(期中考)+50%(期末考) 為了決定在剩餘的3 星期內要付出多少努力,甲必須根據作業分數(有 20 分)與期中考分數(有30 分)去預測期末考成績。甲的這些分數分 別是12/20 與14/30。 甲蒐集去年選修這門統計課30 位學生的期末考分數、作業分數 (assignment),與期中考分數(midterm)。 利用以下30 位學生的資料所做的迴歸分析結果回答問題: 決定估計的迴歸方程式並檢定模型的有效性(5%的顯著水準)。(4 分) 估計的標準誤為何?如何詮釋這個統計量?(4 分) 判定係數為何?這個統計量提供什麼訊息?(4 分) 詮釋估計的迴歸方程式中每一個係數。(4 分) 在此模型中,檢定作業分數之係數是否為零(5%的顯著水準)?(4 分)
(10)
(4)
(6) 8 分
經調查得出機車每公升耗油量行駛之距離之平均值為38.5 公里,標 準差為6 公里;有甲、乙兩廠商研發出機車省油裝置,甲廠商之裝置 可使每公升行駛距離增加3.5 公里,乙廠商之裝置可使每公升行駛距 離提升17%,試回答下列問題: 裝設甲廠商省油裝置後,機車每公升耗油量可行駛距離之平均值與 標準差。(5 分) 裝設乙廠商省油裝置後,機車每公升耗油量可行駛距離之平均值與 標準差。(5 分)
調查A、B 兩條公車路線之誤點情形,發現路線A 誤點之機率為0.65, 路線B 誤點之機率為0.6,同一天兩條公車路線同時誤點之機率為 0.48,試回答下列問題: 上個月任一天至少有一條路線誤點之機率。(5 分) 給定某一天路線A 準點的條件之下,試問當天路線B 亦準點之機 率。(5 分) 給定某一天路線B 誤點的條件之下,試問當天路線A 準點之機率。 (5 分)
一電池製造商宣稱其生產之電池充電後可讓電動車行駛超過500 公 里,購買者懷疑製造商之宣稱過於誇張。若已知行駛里程數為常態分 配,且標準差為26 公里,今抽驗25 部電動車,得其樣本平均數為 490 公里,在1%之顯著水準下,欲檢定電池製造商之宣稱是否合理。 試寫出虛無假設與對立假設。(5 分) 試寫出檢定統計量及結論。(10 分) 若樣本增加為49 部,樣本平均數仍為490 公里,試檢定電池製造 商之宣稱是否合理。(10 分)
欲了解某地區之交通事故件數(Z)是否與該區臨檢次數(X)和違規 件數(Y)有關,今蒐集19 組資料構建下列線性迴歸模式, ˆZ = 3.0-1.8 X + 0.25 Y,各參數估計值之標準誤為1.5,0.5,0.3,另 外得出部分變異數分析(ANOVA)表如下: 變異來源 平方和(SS) 迴歸 40 殘差 32 在 0.05  時, 試說明該模式中,X 的參數估計值之意義。(6 分) 試檢定該模式是否顯著。(6 分) 試求該模式中X、Y 對應之t 值,並分別檢定X、Y 之係數是否顯 著。(6 分) 試求Z 的變異被該模式解釋的程度。(7 分) t分配表 單尾顯著水準 自由度 附表 Z分配表