lawpalyer logo

統計 110 年統計學大意考古題

民國 110 年(2021)統計「統計學大意」考試題目,共 40 題 | 資料來源:考選部

38 題選擇題 + 2 題申論題

當柴比雪夫定理應用在機率分配上時,下列敘述何者正確? (A)該定理只適用在對稱的機率分配上 (B)大約68%的觀測值會落在平均數上下一個標準差之內 (C)至少25%的觀測值會落在平均數上下兩個標準差之內 (D)至多11%的觀測值會落在平均數上下三個標準差之外
假設E 和F 為兩個非空集合的事件且滿足P(F | E) = P(F),下列敘述何者錯誤? (A)P(E and F) = P(E)P(F) (B)P(E or F) = P(E) + P(F) (C)E 和F 為相互獨立事件 (D)P(E | F) = P(E)
美國密西根州55%的公民是男性,45%的公民是女性。已知本次總統大選該州60%的男性和40%的女性投票給共和黨候選人。請問票投給共和黨候選人的密西根州公民之中,屬於男性的機率有多少? (A)0.605 (B)0.736 (C)0.647 (D)0.338
隨機變數X 服從指數分配(exponential distribution),其機率密度函數為0>,
0=(-0.5xe.)xfx。請問該指數分配的中位數為多少? (A)2.008 (B)1.649 (C)1.386 (D)2.6855下列為108 年公務人員初等考試統計學科目分數的箱型圖(box plot):根據此圖,請問此考試分數的前標(第75 百分位數)和後標(第25 百分位數)相差幾分? (A)22 (B)41 (C)67 (D)90
下列為36 位臺北某餐廳服務人員的年齡累積次數(cumulative frequency)分配表:根據此表,下列對該餐廳服務人員年齡的分配敘述何者最有可能正確? (A)眾數< 中位數< 平均數 (B)平均數< 眾數< 中位數 (C)眾數< 平均數< 中位數 (D)平均數< 中位數< 眾數
2019 年商學院學生的TOEIC 成績大約服從一個常態分配,平均分數610μ,標準差160σ。某大學MBA 學程給外國學生的獎學金申請最低門檻是TOEIC 成績前3%。請問TOEIC 至少要考幾分才能到達此最低門檻? (A)932 (B)911 (C)895 (D)876年齡累計次數18 up to 23
23 up to 281728 up to 332433 up to 383038 up to 43368nX,,X,X…21為一組從常態分配)(2σ,μN隨機抽樣得到的樣本,令樣本平均數niiXn/X1)1(,樣本變異數21112)(XXSniin,下列敘述何者錯誤? (A)22)1(σ/Sn 為卡方(2)分配,自由度是n (B)當n 趨近於無窮大,n/SμX 的分配會收斂到標準常態分配 (C)22)(S/μXn為F 分配,其自由度1 和n 1 (D)X 和2S相互獨立
當使用T 分配來建立母體平均數的信賴區間時,下列何者假設是不需要的? (A)樣本平均數的分配必需是常態或近似常態分配 (B)母體的標準差未知 (C)樣本數必需很大 (D)樣本觀測值之間相互獨立
民調公司想要了解美國公民對現任總統的支持度百分比。在信心水準95%和誤差範圍5%的要求之下,請問該民調公司至少需要多少樣本數? (A)297 (B)385 (C)897 (D)1,067
有關母體參數假設檢定的P 值(P-value),下列敘述何者錯誤? (A)P 值的計算和顯著水準有關 (B)P 值的計算和虛無假設有關 (C)P 值的計算和樣本的檢定統計量有關 (D)P 值越小,越傾向於拒絕虛無假設
某跨國企業管理階層想要比較兩個工廠A 和B 製造的不良品數目的變異程度(variance),下列為從A 和B 兩個工廠隨機抽樣的結果:假設所有檢定的顯著水準都是α =0.05 ,另給定3.18,=(9,9)4.03,=(9,9)0.050.025FF3.72,=(10,10)0.025F18.31=(10)16.92,=(9)2.98,=(10,10)0.0520.0520.05F,下列何者最有可能正確? (A)工廠A 的變異程度比較大 (B)工廠A 和B 的變異程度差異不顯著 (C)工廠B 的變異程度比較大 (D)根據檢定的結果,無法下結論
為了測試新的線上學習系統成效,老師隨機從班上選取8 位同學並記錄他們使用此系統前後的考試成績:令1X和2X 分別為使用系統後和使用系統前8 位同學的平均成績、21S 和22S 為對應的成績變異數、且2DS 為成績相減後(後-前)的變異數。如果要檢定使用此線上學習系統後平均成績是否有顯著進步,下列何者檢定統計量最為適當? (A)
df)8/)8(21211,S/SXXT (B)14df/8)(2222121,SSXXT (C)2222212222122221388887df)/8(1SSSSSSXXT, (D)7df8214,/SXXTD樣本平均數樣本變異數樣本大小工廠A82.2510工廠B109.1110學生(1)(2)(3)(4)(5)(6)(7)(8)使用前成績6270837688836355使用後成績7470847397826872成績相減(後-前)1201-39-151714如果執行卡方適合度檢定(顯著水準為α )時有許多細格(cell)的期望次數太少,會造成下列那一種影響? (A)該檢定比較容易拒絕H0 (B)該檢定的檢定力會變小 (C)該檢定的檢定統計量自由度會變少 (D)不會有任何的影響
下列資料是從美國三家大企業隨機抽出的資料科學家年薪(以萬元美金為單位):如果用變異數分析來檢定這三家企業的資料科學家平均年薪是否相同,在給定α =0.05 下,下列何者為該檢定的拒絕域臨界值?(下列符號),(baFα為右尾機率α 且自由度為(a, b)的F 分配臨界值) (A)F0.05 (2,12) (B)F0.025 (2,12) (C)F0.05 (3,14) (D)F0.025 (3,14)
下列為二因子變異數分析的部分輸出結果,其中因子A 有4 群,因子B有5 群:如果要檢測因子A 和因子B是否存在交互作用,計算出來的檢定統計量F 值等於多少? (A)0.5625 (B)1.875 (C)3.608 (D)2.50
根據調查,大學生每天上網時間(X)和統計學考試成績(Y)的散布圖(scatter plot)如下:YX根據上圖,X 和Y 的相關係數最有可能為下列那一個? (A)0.498 (B)0.867 (C)-0.762 (D)-0.016
下表為迴歸模型iiiεβXY++= 的變異數分析輸出結果:根據上表,Y 變數的變異程度可以讓X 變數解釋的百分比為多少? (A)33.3% (B)50.0% (C)66.7% (D)90.0%
下列為最小平方法得到的迴歸估計式bXaYˆ的殘差分析圖:YˆY Yˆ෡根據此殘差分析圖,下列那一個迴歸分析的假設最有可能是不成立的? (A)Y 和X 的關係約為一直線 (B)給定X 值,Y 值服從一個常態分配 (C)給定X 值,Y 的變異程度為一常數 (D)Y 值之間為相互獨立A 企業18242945B 企業151923294051C 企業1617213343變因平方和自由度均方值F因子A130因子B交互作用270誤差480總和100059來源自由度平方和均方和F 值迴歸13003004.50誤差960066.67總和10900Fitted ValueResidual
檢定母體平均數時考慮一虛無假設0H :10μ和下列的決策準則:如果樣本平均數15X,則拒絕H0。如果母體真正的平均數為13μ,下列何者決策準則為造成型II 誤差的機率? (A))1315(μ|XP (B))1015(μ|XP (C))1315(μ|XP (D))1015(μ|XP
考慮一簡單迴歸分析,Y 為反應變數,X 為自變數,假設現在共有15 組觀測值(x1, y1), … , (x15, y15)。若知道6x,12y,30)(1512 iixx,48)(1512 iiyy,36)()(151iiiyyxx,則測量標準誤(standard error of estimate)為多少? (A)0.891 (B)1.254 (C)0.207 (D)0.608
在複迴歸的模型中加入一個具有高度共線性(collinearity)的自變數所造成的影響,下列敘述何者錯誤? (A)最小平方法的估計式可能會不存在 (B)R2(判定係數)可能會變小 (C)某些自變數X 和Y 之間的關係可能會被錯誤解釋 (D)某些自變數X 的係數估計值可能會由正轉成負
資料中有收入(低、中、高)及年齡群(21 歲-30 歲、31 歲-40 歲、41 歲-50 歲、51 歲-60 歲)兩個變數。若要以卡方檢定(Chi-square)檢定收入與年齡群有無關聯性,其自由度為何? (A)6 (B)7 (C)8 (D)12
下列那一個假設檢定的程序不適合採用卡方統計量來做檢定? (A)檢定多組獨立的數值資料是否來自相同的機率分配 (B)檢定Spearman 的等級相關係數(coefficient of rank correlation)是否顯著 (C)檢定“性別” 和“支持的政黨” 之間是否有關係 (D)檢定迴歸分析的殘差項是否相互獨立
根據世界綠色和平組織的抽樣調查和迴歸分析,得到一個估計式X..Yˆ006050,其中Y 為大氣增加的溫度(華氏℉),X 為空氣中二氧化碳濃度的增加量(PPM),且R2 高達0.92。如果現在將同一筆資料溫度Y 的單位改成攝氏(℃),並重新計算迴歸估計式,則下列敘述何者正確?(註:華氏=( 攝氏59)+32) (A)迴歸估計式的截距項變成-31.5 (B)R2 數值不會改變 (C)X 的係數估計值變成0.0108 (D)迴歸估計式的截距項變成32.9
當移動平均數(Moving Average)的方法用在一時間數列的時候,下列敘述何者錯誤? (A)此方法可以用來觀察時間數列的長期趨勢(secular trend) (B)此方法可以移除時間數列的不規則變動(irregular variation) (C)當移動期數變大時,時間數列的波動會變小 (D)此方法可以移除時間數列的季節變動(seasonal variation)
過去兩年每個季節臺北市豪宅的交易數目如下:若冬、春、夏、秋的季節指數(seasonal index)分別為1.2、0.8、1.3、0.7,且去除季節性因素後交易數目(Y)和季節(t)之間的迴歸估計式為tYˆ698 ,其中t = 1 代表2018 年的冬天,t = 2 代表2018年的春天,依此類推。請問2020 年春天臺北市豪宅的交易數目估計約為多少? (A)126 (B)158 (C)185 (D)198
下列的資料為某班級的考試分數,分數的四分位距(interquartile range)為何?10, 31, 42, 46, 48, 55, 56, 58, 70, 75, 76, 77, 78, 80, 82, 83, 84 (A)22 (B)32 (C)70 (D)77年份冬天春天夏天秋天2018120801307020191248012674
令隨機變量X 具有pmf2( | | + 1)( ),1,0,19xf xx。29X 的期望值為何? (A)49 (B)4 (C)89 (D)8
假設手稿中的印刷錯誤數量是卜瓦松(Poisson)分配,某本500 頁的手稿有200 個印刷錯誤。某頁完全沒有錯誤的機率為何? (A)0.4e (B)0.4e (C)0.4 (D)0.6
一個調查欲研究全國成人玩線上遊戲是否超過四分之三,用了400 個成人為全國代表性樣本,調查發現有320 個成人玩線上遊戲,檢定統計量為何? (A)1.1547 (B)2.3094 (C)2.50 (D)3.1254
某種統計認證的考試分數為常態分配,平均數為200 分,母體標準差為20 分。隨機抽取16 個分數取其平均,這個平均分數大於210 分的機率為何? (A)0.9772 (B)0.6915 (C)0.3085 (D)0.0228
假設母體呈常態分配,平均數μ 未知。欲檢定H0:μ ≤ 100 vs. Ha:μ > 100,顯著水準設為0.01。若將型二錯誤(type II error)控制為5%。當虛無假設H0 為偽,拒絕H0 的機率為何? (A)0.010.05 (B)0.95 (C)0.99 (D)
一個青少年研究,調查400 個男生及400 個女生(男生及女生為獨立樣本),欲探討過去一年中,他們是否曾向父母撒謊。其中240 個男生及200 個女生曾向父母撒謊。若檢定H0:男生跟女生曾向父母撒謊的比例沒有差異,結論為何? (A)若顯著水準()為0.10,拒絕H0;若顯著水準()為0.05,則不拒絕H0 (B)若顯著水準()為0.05,拒絕H0;若顯著水準()為0.025,則不拒絕H0 (C)若顯著水準()為0.025,拒絕H0;若顯著水準()為0.01,則不拒絕H0 (D)若顯著水準()為0.01,拒絕H0
承上題,如果以卡方檢定(Chi-square)檢定性別與是否曾向父母撒謊有無關聯性,其檢定統計量為何? (A)8.08 (B)8.16 (C)400 (D)1,600
一般科幻小說平均290 頁。某出版社隨機選擇他們出版的16 部小說,其平均長度為335 頁,標準差為48 頁。欲檢定這出版社的小說是否明顯比一般科幻小說長,根據以上資料,得出結論為: (A)若顯著水準()為0.10,拒絕H0;若顯著水準()為0.05,則不拒絕H0 (B)若顯著水準()為0.05,拒絕H0;若顯著水準()為0.025,則不拒絕H0 (C)若顯著水準()為0.025,拒絕H0;若顯著水準()為0.01,則不拒絕H0 (D)若顯著水準()為0.01,拒絕H0
為了瞭解電腦中需要修理的零件個數是否影響客服電話的時間長短(分鐘),抽取了5 通客服電話。以最小平方法得到下列迴歸模型:如果某通客服電話的時間是14 分鐘,所需要修理的零件數是6 個。依據迴歸模型,殘差為何? (A)1.6 (B)-1.6 (C)15.6 (D)-15.6
一個資料中只有收入(低、中、高)及年齡群(21 歲-30 歲、31 歲-40 歲、41 歲-50 歲、51 歲-60 歲)兩個變數。若要將收入、年齡群及兩個變數的交互作用以虛擬變數放入迴歸模型當自變數,會有幾個自變數? (A)7 (B)9 (C)11 (D)12
為了研究某品牌手機在北中南三個地區銷售量是否有差異,隨機在三個地區各選5 家經銷商,其銷售量如下:銷售量北中南樣本平均數332928樣本變異數2417.59.5如以ANOVA 檢定北中南三個地區銷售量是否有差異,組間變異量(Sum of Square Between / Among)為何? (A)14 (B)30 (C)35 (D)70
假設過去的資料顯示60%的大學生喜歡C 牌的可樂,隨機抽取5 名學生至少有1 名學生喜歡C 牌可樂的機率為何? (A)0.07776 (B)0.2 (C)0.92224 (D)0.98976係數標準誤截距-1.22.4X 變數2.80.5657附表一Probability Contentfrom- to Zz附表二Table of the Student's t-distributionαvt;The table gives the values ofvt;where,)(;vvtTPrwith ν degrees of freedom附表三Chi-square distributiond.f.=degree of freedom)(22P02