lawpalyer logo

統計 93 年統計學大意考古題

民國 93 年(2004)統計「統計學大意」考試題目,共 14 題 | 資料來源:考選部

0 題選擇題 + 14 題申論題

請「舉例」解釋以下名詞 :(共20 分,每小題4 分) 實驗 樣本空間 複合事件(compound event) 隨機變數 相對次數的機率(relative frequency probability)
假設 1 X ,⋯, n X 是一組取自N(μ,σ2) 的隨機樣本,則下列敘述何者正確? 統計量 1 (X +⋯+ ) n X /n 適合估計μ 統計量 )1 /( ) (
某民調機構意欲以簡單隨機抽樣方式,進行高雄市市長候選人支持度民調,事先規 劃民調的抽樣誤差最多為2.5%,並且訂定信賴水準為95%。請問: 該民調公司至少得從全市市民當中隨機抽選多少人,才能達到以上的要求?(10 分) 若該民調機構依據您在上第 小題所算出的樣本數進行民調,並且在所有被選中的 市民中,有600 人支持甲候選人。請算出甲候選人支持度的99%信賴區間。(10 分)
1 − − ∑= n X i n i µ 適合估計σ2 僅 僅 和 皆是 二者皆非 2 假設X 的分布是binomial (25,0.5),若要計算Pr{10<X≤15}的機率,我們採取常態分布逼近,而且使用連續 性修正 (continuity correction),下列何者正確? Φ(1.2)-Φ(-0.8) Φ(1.0)-Φ(-1.0) Φ(0.12)-Φ(-0.08) Φ(0.10)-Φ(-0.10)
某教育研究所進行青少年英語程度與城鄉差距影響的調查。他們從台灣各地隨機抽 選400 名國中一年級學生,並記錄其英語課程成績,整理如下表。請問居住地區與 英語程度的好壞是否有相關性?(請使用 05 .0 = α )(20 分) 地區\英語程度 良好 普通 不佳 鄉村 30 120 50 都市 80 80 40
針對全台灣住民的抽樣調查,一般喜歡用住戶電話調查,下列何者不是電話調查的優點? 省時 省錢 所得樣本一定是簡單隨機抽樣 在電話通話中可直接輸入資料,電腦可即刻檢查輸入資料的明顯錯誤。
某化妝品公司進行廣告費用(X)與當月銷售金額(Y)的迴歸分析,從電腦統計軟 體算出的變異數分析表格(ANOVA Table)如下表。 請算出表格中空缺部分的數字(1)~(5)。(10 分) 請計算此迴歸估計模型的R2 值,並檢定H0: 1=0。(請使用 05 .0 = α )(10 分) Source DF SS MS F P-Value Regression 1 (2) (3) (5) 0.00035 Error (1) 10152.4 (4) Total 29 13598.3 九十三年公務人員升官等考試委任升等考試試題 代號:51540 類 科: 統計 全一張 (背面)
(1)
(5) 10 分
(2)
(5)
(1)
(4)
某個檢定問題的資料分析,電腦報告F 統計量是9.75,p 值 ( p-value) 是0.011,則下列何者正確? 我們不知道F 統計量的自由度,所以資料不足,不能結論 在10%顯著水準之下,接受H0 在5%顯著水準之下,拒絕H0 在1%顯著水準之下,拒絕H0
某職業棒球隊決定採用一種新的訓練方法來增加球員的體能表現。10 個新球員在訓 練前與訓練後,所得到的體能測量值(0~100 分)紀錄如下。請問這個新的訓練方 法是否能有效增進球員的體能?(請使用 05 .0 = α )(20 分) 球 員 1 2 3 4 5
在民意調查中,若採用簡單隨機抽樣得到樣本,則下列敘述何者正確? 若要維持相同的準確度,則2 倍 大小的母體,需要2 倍的樣本數 若增加樣本數,則可以縮小95%信賴區間的寬度 僅 僅 二者皆正確 二者皆不正確
假設大前年金價是15000 元,前年漲20%,去年跌20%,則去年金價是: 15000 18000 14400 14000
設 1x ,⋯, nx 是觀測到的資料,下列何者不適合描述數值資料的分散程度? n x x x n /) ( 1 + + = Λ , n x x m , , ˆ 1 Λ = 的中位數, ∑= − = n i i n n x x s 1 2 2 / ) ( , ∑= − = n i i n n x x A 1 / 。 m x ˆ − 2 ns ns n A
9 10 訓練前 70 60 65 72 73 66 68 64 78 72 訓練後 77 64 69 62 69 68 69 72 85 79 附表一:t 分配臨界值表Pr(T > t)= p(註:最上面橫列為右尾機率) df 0.75 0.8 0.85 0.9 0.95 0.975 0.99 0.995 0.997 0.998 1 1.000 1.376 1.963 3.078 6.310 12.71 31.82 63.66 106.1 159.2 2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 12.85 15.76 3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 6.994 8.053 4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 5.321 5.951 5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 4.570 5.030 6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.152 4.524 7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 3.887 4.207 8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 3.705 3.991 9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 3.573 3.835 10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 3.472 3.716 附表二:卡方臨界值 2 05 . 0 χ (V) (註:右尾機率為 0.05) 自由度V 1 2 3 4 5 6 7 臨界值 3.84 5.99 7.81 9.49 11.07 12.59 14.07
四群學生,人數是15、20、30、25 人,平均體重分別是40、50、60、70 公斤,則全部學生的平均體重是 (四捨五入): 55 57 59 資料不足,不能計算 9 8 支球隊參加單淘汰賽(所以連贏3 場者就是冠軍)。某隊勝率是6 成,則該隊得到亞軍的機率是 3/5 18/125 27/125 9/125 10 6 個相同球4 黑2 白,置於盒中,不放回抽樣,抽二球。設p1 = 先黑球後白球機率,p2 = 一黑球一白球( 不分順序)的機率,則p2-p1=? 8/30 1/2 8/15 -8/30 11 二個互斥事件A、B,機率分別是0.5、0.4,則Pr{Ac∪Bc}=? 0.6 0.8 0.9 1.0 12 二個獨立事件A、B,機率分別是0.5、0.4,則Pr{A∪B}=? 0.9 0.8 0.7 0.6 13 設X 是隨機變數,E (X) = E (X2) = 1,則Var (X) =? 2 1 0 不可能發生如題目的情況 14 設X 是丟一個公平骰子的點數,Y 是丟3 個公平銅板的正面個數,假設二者獨立。則E (X+Y) =? 6 5 4 樣本空間不同,不能計算 15 設5 位秘書的薪水分別是(單位:千元)22, 25, 26, 30, 32,平均是μ= 27,現在隨機抽出3 人,則此3 人的 薪水平均大於等於μ的機率是: 0.4 0.5 0.6 0.7 16 假設離散型隨機變數X, Y 的聯合機率密度函數是f (x, y) = c (x+y),x = 0, 1, 2, y = 1, 2。則c = 1/5 1/6 1/15 1/21 17 續上題。Pr (Y = 2) =? 1/2 1/5 3/5 2/15 18 續上題。E (X | Y = 2) =? 1 3/9 11/9 19/9 19 一盒中有5 白球3 黑球2 紅球,現在放回抽樣抽4 球,出現2 白1 黑1 紅的機率是: 1/15 0.09 0.015 0.01 20 假設 1 X ,⋯, n X 是取自N (μ,σ2) 的隨機樣本,下列何者是有偏差 (biased),但我們還很喜歡使用的統計量? n X X X n /) ( 1 + + = Λ :估計μ n X X n /) ( 1 1 − + +Λ :估計μ )1 (/ ) ( 1 2 − − ∑= n X X n i i :估計σ2 n X X n i i ∑= − 1 2 / ) ( :估計σ2 21 關於統計檢定,下列何者不正確?(H0表示虛無假設,null hypothesis,P(θ)表示檢定力函數,power function) 第一類誤差是指錯誤拒絕H0 檢定N (μ,1) 的μ時,樣本平均數常用為檢定統計量 通常我們要求第一類誤差的機率小於某數 P(θ)雖然是愈大愈好,但是和第二類誤差機率並無關係 22 關於統計假設檢定,下列何者錯誤? 一般而言,固定型Ⅰ錯誤≤5%時,型Ⅱ錯誤也固定,不管檢定統計量 一般而言,固定檢定統計量時,型Ⅰ錯誤愈小則型Ⅱ錯誤愈大 一般而言,拒絕域固定以後,型Ⅰ錯誤也固定 一般而言,我們先固定型Ⅰ錯誤,然後決定決策規則 23 擲一個6 面骰子n 次,設X 是出現3 點或者6 點的次數,又設p = Pr{擲一次骰子出現3 點或者6 點}。則下 列何者是p 的不偏 (unbiased) 估計量? 1/3 X/3 n X X n /) ( 1 + +Λ n X / 24 續上題。p 的95%信賴的逼近區間是(若pˆ 是上題中p 的估計,使用 n p p /)ˆ 1(ˆ − 當做var( pˆ ),亦,假設n 夠大;又記 )ˆ 1(ˆ ˆ 2 p p − = σ 。) n p / ˆ 96 .1 ˆ σ ± n p σˆ 96 .1 ˆ ± σˆ 96 .1 ˆ ± p 以上皆非 25 擲6 面骰子3 次,設X 是出現3 點或6 點的次數,又設p = Pr{擲一次骰子出現3 點或者6 點}。如果要檢定 H0:p = 1/3 vs. H1:p = 1/2,而且選定拒絕域 (rejection region) 是{X = 3},則此時型Ⅰ誤差機率α是: 1/27 1/20 1/8 7/8 26 續上題。型Ⅱ誤差機率β是: 26/27 19/20 7/8 1/8 27 若二維變數X, Y 是隨機樣本觀察值 (x1, y1),⋯,(xn, yn),具備 7 = x , 5 = y , 132 ) ( 2 = − ∑ x xi , 56 ) ( 2 = − ∑ y yi , 84 ) )( ( = − − ∑ y y x x i i ,則該資料的相關係數 (correlation coefficient) 最接近: 0.98 0.76 0.54 n 不知道,無法計算 28 若x1,⋯,x100 是取自N (μ,σ2) 的隨機樣本,假設 = x (x1+⋯+x100)/100,σ2 已知為100。則μ的95.4%信賴區間 是: 1.0 ± x 2.0 ± x 1 ± x 2 ± x 29 中央極限定理說, n n S X n Z /) ( µ − = 會分布收斂到N (0, 1),下列何者正確? 如果n 非常大,Z 的分布就是N (0, 1) 如果n 非常大,Z 的分布就是N (μ, σ2) 如果n 非常大,Pr{Z ≤z}的值非常接近Φ(z) 如果n 非常大,Z 的值非常接近0 30 “阿強在1500 公尺賽跑中得到冠軍"句中的“冠軍",是何種量度尺度? 順序尺度 區間尺度 名目尺度 以上皆非 31 “阿強在1500 公尺賽跑中跑了3 分58 秒"句中的“3 分58 秒",是何種量度尺度? 順序尺度 區間尺度 名目尺度 以上皆非 32 假設天狗熱(登革熱)的某種檢驗藥劑,效率如下:若天狗熱帶原者,陽性反應機率是90%,若非天狗熱 帶原者,陰性反應機率是90%。假設人口中的天狗熱的帶原者占10%,現在隨機抽出一人,檢驗結果是陽 性的機率是: 0.10 0.18 0.90 0.91 33 假設在上次的民意調查中得知,設立腳踏車專用道的贊成比率是49%。假設民意無改變,若現在重新隨機 抽樣調查400 人,則在此400 人中贊成的比率在51.5%以上的機率,最接近數字是: 0.16 0.13 0.05 0.025 34 假設蕃石榴重量分布是N (μ, σ2),μ= 300(公克),σ= 30(公克),現在36 粒裝一箱,設其總重量是X 公克,則X 在10800 ± 360 公克之間的機率最接近的數字是: 0.90 0.95 0.99 0.999 35 設 1 X ,⋯, n X 是N (μ, σ2) 的隨機樣本,則 )1 (/ ) ( 1 2 − − ∑= n X X n i i 的分布是: 2 n χ 2 1 − n χ nt 1 − nt 36 檢定兩個常態母體的隨機樣本的變異數是否相等,我們常用的檢定統計量的分布是: 常態 F t 2 χ 37 若對立假設H1是複合假設,而且事實上是正確的,但是檢定結果是接受虛無假設H0,則下列敘述何者正確? 此檢定犯了型Ⅰ錯誤,而且型Ⅰ錯誤機率事先給定 此檢定犯了型Ⅰ錯誤,而且型Ⅰ錯誤機率無法事先給定 此檢定犯了型Ⅱ錯誤,而且型Ⅰ錯誤機率事先給定 此檢定犯了型Ⅱ錯誤,而且型Ⅰ錯誤機率無法事先給定 38 在“騎機車不戴安全帽"實行處罰以前,我們調查發現不帶安全帽的比率是80%。現在實施之後,我們想 知道不戴安全帽的比率p 是否變小,那麼檢定假設應該如何設? H0:p = 0.5 vs. H1:p≠0.5 H0:p = 0.8 vs. H1:p≠0.8 H0:p = 0.8 vs. H1:p > 0.8 H0:p = 0.8 vs. H1:p < 0.8 39 續上題。若現在實際隨機調查3000 人,發現不戴安全帽的比率是20%,在顯著水準1%之下: 拒絕H0 接受H0 吾人不應該隨便做結論,應該繼續研究 以上皆可以 40 10 男生15 女生,隨機抽出4 人參加演講比賽,設X 是抽出的女生人數,則X 的分布是: 常態分布 均勻分布 幾何分布 超幾何分布