考虑简单回归模型 y=β0+β1x+u 令z为x的二值工具变量。运用教材(15.0),证明Ⅳ估计量β
考虑简单回归模型
y=β0+β1x+u
令z为x的二值工具变量。运用教材(15.0),证明Ⅳ估计量β1可以写成:的那部分样本中yi和xi的样本平均值,而的样本平均值。该估计量称为群组估计量,它是由沃德(Wald,1940)最先提出。
考虑简单回归模型
y=β0+β1x+u
令z为x的二值工具变量。运用教材(15.0),证明Ⅳ估计量β1可以写成:的那部分样本中yi和xi的样本平均值,而的样本平均值。该估计量称为群组估计量,它是由沃德(Wald,1940)最先提出。
第1题
(i)在前4个高斯-马尔科夫假定之下,考虑简单回归模型y=β0+β1x+u对某个函数g(x),比如g(x)=x2或g(x)=log(1+x2)。定义zi=g(xi)定义一个斜率估计量为
证明β1是线性无偏的。记住,在你的推导过程中,因为E(ulx)=0,所以你可以把x和z,都看成非随机的。
(ii)增加同方差假定MLR.5,证明
(iii)在高斯-马尔科夫假定下,直接证明是OLS估计量。
第2题
第3题
第4题
数据集401KSUBS.RAW包含了净金融财富(nenfa)、被调查者年龄(age)、家庭年收入(inc)、家庭规模(fsize)方面的信息,以及参与美国个人的特定养老金计划方面的信息。财富和收入变量都以千美元为单位记录。对于这里的问题,只使用无子女已婚者数据(marr=1,fsize=2)。
(i)数据集中有多少无子女已婚夫妇?
(ii)利用OLS估计模型
nettfa=β0+β1inc+β2age+u;
并以常用格式报告结果。解释斜率系数。斜率估计值有何惊人之处吗?
(iii)第(ii)部分的回归截距有重要意义吗?请解释。
(iv)在1%的显著性水平上,针对H0:β2>1检验H0: β2=1,求出p值。你能拒绝H0吗?
(V)如果你做一个nettfa对inc的简单回归,inc的斜率估计值与第(ii)部分的估计值有很大不同吗?为什么?
第5题
本题使用JTRAIN.RAW中的数据。
(i)考虑简单回归模型
其中,scrap表示企业的废品率,grant表示是否得到工作培训津贴的一个虚拟变量。你能想到u中的无法观测因素可能会与grant相关的原因吗?
(ii)利用1988年的数据估计这个简单的回归模型。(你应该有54个观测。)得到工作培训津贴显著地降低了企业的废品率吗?
(iii)现在增加一个解释变量log(scrap87)。这将如何改变grant的估计影响?解释grant的系数。相对于单侧备择假设它在5%的显著性水平上统计显著吗?
(iv)相对双侧备择假设,检验log(scrapg)的参数为1的虚拟假设。报告检验的P值。
(v)利用异方差-稳健标准误,重复第(iii)步和第(iv)步,并简要讨论任何明显的差异。
第6题
假设制造业中每个工人的平均生产力(avgprod)取决于培训的平均小时数(avglrain)和工人的平均能力(avgabil)两个因素:
avgprod=β0+β1avgtrain+β1zavgabil+u
假设这个方程满足高斯-马尔科夫假定。如果将培训津贴给了那些工人能力较差的企业,以致avgtrain和avgabil呈负相关,那么,将avgprod对avgtrain进行简单回归所得到的β1,可能出现什么样的偏误?
第7题
在简单线性回归模型证明:这个模型总可以改写为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。
第8题
利用BWGHT2.RAW中的数据。
(i)估计模型并按照通常的方式报告估计方程,包括样本容量和R²。斜率系数的符号与你的预期一致吗?请加以解释。
(ii)如果npvis增加一个样本标准差,对出生重量(bwght)有什么影响?
(iii)现在做log(bwght)对cigs的简单回归,并将斜率系数与第(i)部分中得到的估计值进行比较。估计出来吸烟的效应是否和第(i)部分的有明显差别?
(iv)找出cigs和npvis之间的系数,并用它来解释简单回归和多元回归下β1估计值的相似性。
(v)向第(i)部分的回归方程中加入变量mage,meduc,fage和feduc。出生体重[更确切地说是log(bwght)]是一个容易解释的变量吗?
第9题
利用TWOYEAR.RAW中的数据。
(i)变量stotal是一项标准化测试变量,可用作无法观测的能力的代理变量。求stotal的样本均值和标准差。
(ii)做警察和univ对stotal的简单回归。两个大学教育变量都与stotal统计相关吗?请解释。
(iii)在教材方程(4.17)中增加stotal,并检验二年制大专和四年制大学教育具有相同回报的假设,备择假设是四年制大学的回报更高。你的结论与4.4节中的结论有何区别?
(iv)在第(iii)部分估计的方程中增加stotal2。测试分数变量的二次项有必要吗?
(v)在第(iii)部分的方程中增加stotal·警察和stotal·univ。这两项联合显著吗?
(vi)你通过使用stotal而控制能力变量的最终模型是什么?说明你的理由。
第10题
简单直线回归分析中作b的假设检验,其t统计量的自由度为
A、1
B、2
C、n-1
D、n-2
E、k
第11题
A.固定效应模型
B.logistic回归模型
C.随机效应模型
D.一般线性模型
E.广义线性模型