lawpalyer logo

經建行政 108 年統計學考古題

民國 108 年(2019)經建行政「統計學」考試題目,共 12 題 | 資料來源:考選部

0 題選擇題 + 12 題申論題

請試述下列有關對應不同分配的統計性質為何?請分小題標記並寫下 正確答案:(每小題5 分,共25 分) 假設隨機變數X 服從獨立試驗次數為n且每次試驗成功機率為p的二項 分配 ) , ( p n B ,當p 愈接近0.5 時,X 的分配愈傾向左偏或右偏或對稱? 假設隨機變數Y 服從自由度m 的卡方分配 ) ( 2 m χ ,Y 的分配是屬於左 偏或右偏或對稱? 假設隨機變數T 服從自由度݇的t 分配,當自由度݇愈大或愈小時, t 分配會愈接近標準常態分配? 隨機變數Y 的變異數為何? 隨機變數T 的變異數為何?
根據內政部統計,臺灣滿65 歲以上之老年人口比率已在2018 年達 到14.1%,臺灣已正式邁入「高齡社會」。某社會學學者研究發現臺 灣6 個直轄市的家戶用在長期照護的年支出服從平均數為µ,變異數 為
某班級同學同時參加微積分及管理學兩科目考試,兩科目成績平均數及 標準差如下表所示: 微積分 管理學 平均數 56 68 標準差 14 10 為了比較結果,我們將微積分的分數(x)進行線性轉換(f (x)=ax+b, 此處a 及b 為常數),使轉換後的分數之平均數及標準差與管理學分數 的平均數及標準差相同。 a 及b 分別為何?(5 分) 相對而言,此班級同學考試原始成績那一個科目分數之離散程度較 高?說明理由。(10 分) 某同學微積分及管理學原始分數分別為44 分及54 分,相對而言,此 同學那一科考得比較好?為什麼?(10 分)
已知A、B、C 為樣本空間S 中之事件,若 35 .0 ) ( = A P 、 43 .0 ) ( = B P 、 26 .0 ) ( = C P 、 56 .0 ) ( = B A P ∪ 、 091 .0 ) ( = C A P ∩ 。 (每小題5 分,共15 分) 請問 ) ( C A P ∪ 為何? A、C 兩事件是否獨立(independent)?請寫出完整理由。 A、B 兩事件是否互斥(mutually exclusive)?請寫出完整理由。
σ 之常態分配,此處µ 與 2 σ 皆未知。今由6 個直轄市隨機抽出n 個家戶,調查其用在長期照護的年支出,得到隨機樣本 n X X X , , , 2 1 … 。(每小題10 分,共40 分) 求出母體變異係數µ σ 之最大概似估計量(maximum likelihood estimator)。 某衛生福利部官員提出未來補助上限擬定為 σ µ θ
下列兩個有關於X 隨機變數的機率密度函數: 其他 0 2 1 X 0 X 8 ) X ( : 0 = < < = f H 其他 0 2 1 X 0 X 8 4 ) X ( : = < < − = f H a 請畫出此兩假說之機率密度函數圖。(5 分) 檢定之決策法則如下:某單一X 值被觀察到,如果此X 值超過某一特 定值a(0 < a < 2 1 ),則接受H0;否則接受Ha。如果已知H0 是對的, 卻接受Ha 的機率為16 1 ,請計算出a 値。(10 分) 承,計算出此題之統計檢定力。(10 分) 22880、28180
根據下列之機率分配: X -2 0 1
+ = ,求出此上限θ 之最小變異不偏估計量(uniformly minimum variance unbiased estimator)θˆ。 假設 2 σ 已知,求出機率 ) 5 ( 1 > X P 之不偏估計量的變異數的 Cram’er-Rao 下限(Cram’er-Rao lower bound)。 假設 2 σ 已知,求出機率 ) 5 ( 1 > X P 之信賴水準 ) 1( 100 α − %的信賴區間。 二、交通部檢討斷橋事件後,嚴格要求未來各單位在進行橋梁施工時,所使 用之鋼索的韌性的誤差值,必須符合平均數為0,變異數為1 之常態分 配。今由符合規定之廠商隨機抽取二支鋼索,測其韌性之誤差值,得二 筆隨機樣本資料。(每小題10 分,共30 分) 求出此二筆觀測值中之較小者,小於分配之中位數的機率。 求出此二筆觀測值之全距R 之機率密度函數。 求出上述題中,全距R 的變異數。 三、中美貿易戰一開打,台股就應聲跌了七百多點。某財經學者研究台股加 權指數(以Y 表示)與美元兌人民幣之匯率(以X 表示)的關係,考慮 建立下列迴歸模型: i i i x Y ε β β + + = 2 1 0 ,= i 1, 2, …, n;其中 n ε ε ε ε , , , , 3 2 1 … 為相互獨立且具常 態分配 ) ,0 ( 2 σ N 之隨機變數。(每小題10 分,共30 分) 求出 0 β 與 1 β 之最小平方估計量 0ˆβ 及 1ˆβ 。 求出上述 0ˆβ 及 1ˆβ 之共變異數 ) ˆ , ˆ ( 1 0 β β Cov 。 求出 0ˆβ + 1ˆβ 之變異數 ) ˆ ˆ ( 1 0 β β + Var 。
兒童福利機構想了解10 歲兒童每週看電視時間(X)與其體重過重程度 (Y)間之關係,隨機蒐集6 位10 歲兒童每週看電視時間及體重過重程 度(實際體重減理想體重,以公斤為單位)的資料,如下表: X 34 18 38 33 29 x6 Y 6 -7 14 7 8 y6 以最小平方法估計迴歸線為Yˆ 然而,在存檔過程中, 分析人員不小心將第6 位兒童的資料刪除,試問: X 0.937 -22.609+ = 。 第6 位兒童每週看電視時間(x6)及其體重過重程度(y6)各為何? (15 分) 顯著水準為0.01 情況下,檢定此迴歸模型是否具有配適能力?(10 分)
1 請計算c 的可能值以及根據此組樣本所得之參數θ 的最大概似估計 量的值。 某電競遊戲設計為共4 道關卡的闖關遊戲,假定X 為通過關卡數的 隨機變數且其分配是一個成功機率為p 的二項式分配(binomial distribution),其中X 的可能值為0, 1, 2, 3, 4。針對以下假設 2 1 0 = p H: 對 4 1 1 = p H: ,給定以下4 種檢定法: 檢定法A:如果X=4,則拒絕 0 H ,反之則不拒絕 0 H ,即拒絕域 (rejection region)為集合{ } 4 ; 檢定法B:如果X=0,則拒絕 0 H ,反之則不拒絕 0 H ,即拒絕域為 集合{ } 0 ; 檢定法C:如果 1 ≤ X ,則拒絕 0 H ,反之則不拒絕 0 H ,即拒絕域為 集合{ } 1 ,0 ; 檢定法D:如果X=0 或X=4,則拒絕 0 H ,反之則不拒絕 0 H ,即拒 絕域為集合{ } 4 ,0 。 設定顯著水準為 16 1 = α ,請決定上述4 種檢定法,那一個或那些檢 定法是符合α 之設定且有最大檢定力(power)的檢定法? 34880 三、以下是關於朴松分配(Poisson distribution)以及二項式分配(binomial distribution)的參數估計問題。 若某一速食店一日來客人數服從於平均值為λ (人)的朴松分配 (Poisson distribution),以下是隨機收集該速食店5 日的每日來客人數 資料:433 人,375 人,450 人,375 人,367 人。根據上述資料,請算 出λ 的最大概似估計量(maximum likelihood estimator)的值。(5 分) 若隨機變數 10 2 1 , , , X X X … 是彼此獨立且其分配為做一次試驗 且成功機率為0.2 的二項式分配(binomial distribution)。 請算出 9 ) ( 2 10 1 2 ∑= − = i i X X S 的期望值E(S2) 以及∑ = 10 1 2 i i X 的變異數 ) Var( 10 1 2 ∑= i i X ,其中 10 10 1 ∑= = i i X X 。(10 分) 34880 四、以下是關於卡方檢定(chi-squared test)以及單因子變異數分析法 (one-way ANOVA)的問題。(每小題10 分,共20 分) 在一次有3 位總統候選人的總統大選,某電視名嘴宣稱候選人甲的 支持率為p1=0.425,候選人乙的支持率為p2=0.235,候選人丙的支 持率為p3=0.115,而不表態或都不支持這3 位候選人的比率為 p4=0.225。某一民調單位得到以下樣本數為1000 的問卷結果:支持 候選人甲的人數為450 人,支持候選人乙的人數為225 人,支持候 選人丙的人數為125 人,不表態或者都不支持這3 位候選人的人數 為200 人。根據這份問卷,在顯著水準α=0.05 下,請利用卡方檢定 (chi-squared test)來驗證此名嘴的說法是否與該民調單位調查結果 一致,即檢定 H0:p1=0.425,p2=0.235,p3=0.115,p4=0.225 對 H1:p1,p2,p3以及p4並非 p1=0.425,p2=0.235,p3=0.115,p4=0.225。 一機械零件生產公司欲比較其3 條生產線所生產之零件的平均規 格(分別為 1 µ , 2 µ 以及 3 µ )是否一致。此公司在每一條生產線各 取得5 件隨機樣本,這3 組樣本其規格之平均值分別為3.6,3.4 以及4.1。另外,這總共15 件零件其規格之變異數為0.14。在顯著 水準α=0.05 下,請利用單因子變異數分析法(one-way ANOVA) 來檢定這三條生產線所生產零件的平均規格是否一致,即檢定 H0:μ1=μ2=μ3 對H1:μ1,μ2以及μ3並不完全相等。 34880
下列為10 台同品牌二手汽車車齡及賣價資料(α=0.05): 車齡 8 12 9 11 6 7 10 8 6 13 賣價 23 12 24 11 26 30 24 15 24 12 請計算二手汽車車齡與賣價之皮爾森相關係數(Pearson correlation coefficient)並檢定其顯著性。(10 分) 請計算二手汽車車齡與賣價之斯皮爾曼等級相關係數(Spearman's rank correlation coefficient)並檢定其顯著性。(10 分) 皮爾森相關係數與斯皮爾曼等級相關係數間之差異為何?(5 分) 22880、28180 t 分配之臨界值 22880、28180
) (x f X 0.32 0.2 0.15 0.16 0.17 試求:(每小題5 分,共20 分) E(X) Var(X)  ) 2 7.0 ( + X E  ) 2 7.0 ( − X Var 四、假設Y 代表某行銷公司在小巨蛋過去代理演唱會的門票銷售量,X 代表 該公司事前所投注的網路行銷費用(萬元),若行銷公司想用網路行銷 費用來預測門票銷售量,即以Y 為反應變數,X 為解釋變數來進行簡單 線性迴歸分析。以過去舉辦10 個場次所收集的資料如下: 7. 203 = x 5. 11281 = y 9. 174880 ) )( ( = − − = ∑ y y x x Sxy 21 . 7675 ) ( 2 = − = ∑ x x S xx 4443432 ) ( 2 ∑ = − = y y S yy (每小題10 分,共20 分) 以Y 為反應變數,X 為解釋變數來進行簡單線性迴歸分析,請寫出截 距項 0ˆβ 、斜率 1ˆβ 及簡單線性迴歸方程式。 請問該簡單線性迴歸預測模型的解釋能力判定係數R2 為何? 五、某軟體公司想要了解某些特定機器學習分類演算法和計算速度有無關 聯,因此各模擬了100 次運算,彙整之後得到下面的列聯表: 計算速度 演算法 慢 中 快 隨機森林 78 21 1 支持向量機 40 57 3 類神經網路 51 44 5 梯度提升 1 3 96 請在顯著水準 05 .0 = α 下,進行檢定計算速度和該特定機器學習分類演 算法是否有關聯?(每小題10 分,共20 分) 請採用傳統臨界值檢定法進行檢定。 請採用p 值檢定法進行檢定。 2 χ 分配右尾切點(cut-off points) α χ χ α = ≥ ) ( 2 , 2 v v P 0 2 , α χ v α 附表