假設Y 為一連續型隨機變數(continuous random variable),其機率密度
函數(probability density function, pdf)與累積分配函數(cumulative
distribution function, cdf)分別為
( )
Yf
y 與
( )
Y
F
y 。令
1
2
,
,
,
n
Y Y
Y
為對應於隨
機變數Y 的一隨機樣本(random sample),則:
若另一連續型隨機變數Z
aY
b
,其中a 和b 為常數,且
0
a
。試
求隨機變數Z 的機率密度函數
( )
Zf
z ?(10 分)
何謂此隨機樣本
1
2
,
,
,
n
Y Y
Y
對應的最大次序統計量(largest order
statistic)?(5 分)
承上,求此最大次序統計量對應的機率密度函數與累積分配函數。
(10 分)
令
1
2
,
,
,
n
Y Y
Y
為相互獨立的反應變數(response variables),其對應的資料
觀察值為
1
2
,
,
,
n
y y
y
。假設每一
iY 皆服從參數為
i的伯努利(Bernoulli)
分配,即
)
~ Bernoulli(
i
i
Y
,且
i的值與
ix 變數間滿足以下關係:
log(
)
1
i
i
i
x
式中的與為兩待估計的模型參數。
請問與的意涵為何?(8 分)
此模型對應的概似函數(likelihood function)為何?(7 分)
請詳細推導如何求得與的最大概似估計值(maximum likelihood
estimates)。(10 分)
假設一實證研究轉職(或跳槽)有關的線性模型:
2
1
2
2
3
4
5(
)
f
f
k
k
y
exper
wage
wage
age
D
D
age
x
e
式中,y 為是否轉職的二元(binary)變數,若轉職或跳槽,則其值為1,
反之則為0。解釋變數exper 為工作經驗,age為年紀,wage為現職的薪
水,
f
D 為虛擬變數(若女性則其值為1,男性則為0),
6
k
x
x
為其餘解
釋變數,e 則為模型所無法捕捉的外生干擾隨機變數。
為何一般稱此模型為線性機率模型(linear probability model,LPM)?
若直接以最小平方法估計此模型,會遇到什麼樣的缺點?(10 分)
請問迴歸係數
1
所代表的意思為何?wage 或age 怎麼影響轉職或跳
槽的結果y?(9 分)
我們可以如何修正模型設定,以避免LPM 模型的缺點?新的模型設
定該如何估計?(6 分)