假設Y 為一連續型隨機變數(continuous random variable),其機率密度
函數(probability density function, pdf)與累積分配函數(cumulative
distribution function, cdf)分別為
( )
Yf
y 與
( )
Y
F
y 。令
1
2
,
,
,
n
Y Y
Y
為對應於隨
機變數Y 的一隨機樣本(random sample),則:
若另一連續型隨機變數Z
aY
b
,其中a 和b 為常數,且
0
a
。試
求隨機變數Z 的機率密度函數
( )
Zf
z ?(10 分)
何謂此隨機樣本
1
2
,
,
,
n
Y Y
Y
對應的最大次序統計量(largest order
statistic)?(5 分)
承上,求此最大次序統計量對應的機率密度函數與累積分配函數。
(10 分)
令
1
2
,
,
,
n
Y Y
Y
為相互獨立的反應變數(response variables),其對應的資料
觀察值為
1
2
,
,
,
n
y y
y
。假設每一
iY 皆服從參數為
i的伯努利(Bernoulli)
分配,即
)
~ Bernoulli(
i
i
Y
,且
i的值與
ix 變數間滿足以下關係:
log(
)
1
i
i
i
x
式中的與為兩待估計的模型參數。
請問與的意涵為何?(8 分)
此模型對應的概似函數(likelihood function)為何?(7 分)
請詳細推導如何求得與的最大概似估計值(maximum likelihood
estimates)。(10 分)
假設一實證研究轉職(或跳槽)有關的線性模型:
2
1
2
2
3
4
5(
)
f
f
k
k
y
exper
wage
wage
age
D
D
age
x
e
式中,y 為是否轉職的二元(binary)變數,若轉職或跳槽,則其值為1,
反之則為0。解釋變數exper 為工作經驗,age為年紀,wage為現職的薪
水,
f
D 為虛擬變數(若女性則其值為1,男性則為0),
6
k
x
x
為其餘解
釋變數,e 則為模型所無法捕捉的外生干擾隨機變數。
為何一般稱此模型為線性機率模型(linear probability model,LPM)?
若直接以最小平方法估計此模型,會遇到什麼樣的缺點?(10 分)
請問迴歸係數
1
所代表的意思為何?wage 或age 怎麼影響轉職或跳
槽的結果y?(9 分)
我們可以如何修正模型設定,以避免LPM 模型的缺點?新的模型設
定該如何估計?(6 分)
考慮一個簡單線性迴歸方程式,其應變數已取自然對數,即log(
)
ty ,自
變數是應變數的落後期
1
(log(
))
ty
:
0
1
1
log(
)
log(
)
,
1, ...,
t
t
t
y
y
u t
T
(樣本數)
其中
0
與
1
代表未知參數,
tu 代表隨機干擾項,其平均數等於零,變異
數為常數,具有相同且獨立的分配(identically and independently
distributed)。(每小題10 分,共20 分)
請證明
1
的最小平方估計式(least squares estimator),
1ˆ,是否具有
不偏性(unbiasedness)?
假設
ty 與
1
ty 擁有相同分配,請證明
1
1
。
令一個簡單迴歸方程式如下:
0
1
,
1,...
,
,
i
i
i
i
y
x
v
u
i
n
其中
0
與
1
代表迴歸係數,下標i代表樣本點,共有n 筆資料,以下敘述
為簡潔起見,有時會省略下標i。v
u
稱為組合誤差項(composed errors),
2
~
(0,
)
v
v
N
代表隨機干擾項,
2
~
(0,
)
u
u
N
文獻上稱為半常態分配,是
將常態分配隨機變數從0 以下截斷,假設隨機變數v與u 統計獨立。已
知u 的機率密度函數(probability density function, pdf)為
2
2
0
.
2
1
( )
,
2
2
u
u
u
f u
exp
u
令
i
i
i
v
u
,已知的pdf,即
2
2
2
1
( )
2
f
exp
,
其中( )
代表標準常態分配的累積分配函數,
/
u
v
,
2
2
2
u
v
。
請推導u 的條件pdf,即
(
)
f u 。(15 分)
假設使用兩種生產要素的生產函數設定如下:
1
2
2
3
3
,
1,...,
i
i
i
i
y
x
x
i
n
(樣本數)
其中
iy 是第i家公司取自然對數的生產量,
2
ix 與
3
ix 分別代表取自然對數
的勞動與資本財投入量,
i為隨機干擾項。已知
2
2
2
2
3
3
1
1
(
)
12,
(
)
12,
n
n
i
i
i
i
x
x
x
x
2
2
2
3
3
1
1
(
)(
)
8,
(
)
10,
n
n
i
i
i
i
i
x
x
x
x
y
y
2
2
3
3
1
1
(
)(
)
10,
(
)(
)
8,
n
n
i
i
i
i
i
i
y
y
x
x
y
y
x
x
各變數有上橫線者,代表樣本算術平均數。在樣本數等於23 以及迴歸基
本假設都成立的情況下:(每小題10 分,共20 分)
請計算
2
與
3
的最小平方估計值。
請檢定此產業的生產技術是否為固定規模報酬(constant returns to
scale)?即檢定
0
2
3
:
1
H
的虛無假設。(本題t 分配的雙尾5%
臨界值為±2.086)
複迴歸模型設定:
1
2
2
3
3
t
t
t
t
y
x
x
,
應變數為
ty ,
2
tx 與
3
tx 為自變數,三個迴歸係數以符號代表,誤差項
t
表為:
1
,
2,3, ..., .
t
t
tu t
T
自我迴歸係數
1
,隨機變數
tu 可稱為白噪音(white noise)。在其他
迴歸基本假設或稱高斯馬可夫假設(Guass-Markov assumptions)都成立
的情況下:
若採用最小平方法直接估計本題複迴歸方程式,估計式是否具備最佳
線性不偏(best linear unbiased)性質?應如何轉換迴歸模型,可讓最
小平方估計式具備此性質?(10 分)
請證明估計式
1
2
2
1
2
ˆ
T
t
t
t
T
t
t
e e
e
是自我迴歸係數的一致性估計式,te 與
1
te 分別是本題複迴歸模型的當期與落後一期的最小平方殘差。(5 分)
請說明如何計算Durbin-Watson 統計量。在大樣本之下,此統計量會
趨近於什麼數值?(5 分)
如果研究者估計一條迴歸方程式並得到以下結果:
2
1
3.7
0.38
0.93
,
0.98,
1.9
t
t
t
t
y
x
y
e
R
DW
S.E.
(0.39)(0.06)
其中
te 是殘差項,S.E.為估計標準誤(standard error),
2
R 代表判定係
數(coefficient of determination),DW 代表Durbin-Watson 統計量。
以上數據顯示模型配適度極佳,而且DW 統計量很接近2,顯示不存
在自我相關(autocorrelation)。
前段說法是否正確?(5 分)