如果模型中的解释变量存在完全的多重共线性,则参数的最小二乘估计量是()
A.无偏的
B.有偏的
C.不确定
D.确定的
A.无偏的
B.有偏的
C.不确定
D.确定的
第1题
为了检验抵押贷款市场中的歧视,可使用一个线性概率模型:
(i)如果对少数民族存在歧视,并控制了适当的因素,那么,的符号是什么?
(ii)将qpxe对white做回归,并以通常的形式报告结果。解释white的系数。它是统计显著的吗?它实际上大吗?
(iii)作为控制因素,增加变量hrat,obrat,loanprc,unem,male,married,dep,sch,cosign,chist,pubrec,mortlatl,mortlat2和vr。white的系数会有什么变化?仍有对非白人存在歧视的证据吗?
(iv)现在容许种族效应与度量了其他债务占收入比例的变量(obrat)存在着交互作用。交互项显著吗?
(v)利用第(iv)部分的模型,当债务负担达到样本均值obrat=32时,作为白人对贷款许可的概率有多大的影响?构造这种影响的一个95%的置信区间。
第4题
利用BWGHT2.RAW中的数据。
(i)估计模型并按照通常的方式报告估计方程,包括样本容量和R²。斜率系数的符号与你的预期一致吗?请加以解释。
(ii)如果npvis增加一个样本标准差,对出生重量(bwght)有什么影响?
(iii)现在做log(bwght)对cigs的简单回归,并将斜率系数与第(i)部分中得到的估计值进行比较。估计出来吸烟的效应是否和第(i)部分的有明显差别?
(iv)找出cigs和npvis之间的系数,并用它来解释简单回归和多元回归下β1估计值的相似性。
(v)向第(i)部分的回归方程中加入变量mage,meduc,fage和feduc。出生体重[更确切地说是log(bwght)]是一个容易解释的变量吗?
第5题
(i)用OLS估计以下模型
并解释估计值。特别是,固定age不变,多受一年教育对生育率的影响估计是多少?如果100位妇女再多受一年教育,预期她们的孩子数目将减少多少?
(ii)frsthalf是虚拟变量,若该妇女在上半年内分娩则取值1。假定frsthalf与第(i)部分中的误差项不相关,说明frsthalf是educ的一个合理的Ⅳ备选。(提示:你需要做一次回归。)
(iii)通过用frsthalf作为educ的Ⅳ,估计第(i)部分中的模型。将所估计的教育影响与第(i)部分中得到的OLS估计值进行比较。
(iv)在模型中增添二值变量electric、tv和bicycle。假定它们都是外生的。用OLS和2SLS估计方程,并比较educ的估计系数。解释tv的系数,以及为什么拥有电视对生育率有负效应。
第6题
现在假定δj是j的二次函数:为参数。这是多项式分布滞后(polynomialdistributedlag,PDL)模型的一个例子。
(i)将每个δj的公式代入分布滞后模型,并把它写成用γh表示的模型h=0,1,2。
(ii)解释你用来估计γh的回归方程。
(iii)上面的多项式分布滞后模型是一般模型的一个约束形式。它受到了多少个约束?你如何来检验它们?(提示:用F检验。)
第7题
利用APPLE.RAW中的数据。这些电话调查数据是为了得到(假想的)“环保”苹果需求。调查者向每个家庭都(随机地)介绍了正常苹果和环保苹果的一组价格,并询问他们愿意购买每种苹果的磅数。
(i)对于样本中的660个家庭,有多少家庭报告称在预定价格上不愿意购买环保苹果?
(ii)变量ecolbs看上去在严格正值上具有连续分布吗?你的回答对ecolbs托宾模型的适当性有何含义?
(iii)以ecoprc、regprc、famic和hhsize作为解释变量,估计一个托宾模型。哪些变量在1%的水平上显著。
(iv)faminc和hhsize联合显著吗?
(v)第(iii)部分中价格变量系数的符号与你的预期一致吗?请解释。
(vi)令β1和β2为ecoprc和regprc的系数,相对一个双侧备择假设,检验假设H0:-β1=β2。报告检验的p值。(如果你的回归软件不能很容易地计算这种检验,你可能还要参考教材4.4节
(vii)对样本中的所有观测求E(ecolbslx)的估计值[见方程(17.25)],称之为ecolbsi。最大和最小拟合值是多少?
(viii)计算ecolbs,和ecolbsi之相关系数的平方。
(ix)现在,利用第(iii)部分中同样的解释变量,估计ecolbs的一个线性模型。为什么OLS估计值比托宾估计值小那么多?从拟合优度来看,托宾模型比线性模型更好吗?
(x)评价如下命题:“由于托宾模型的R,如此之小,所以估计的价格效应可能是不一致的。”
第8题
利用JTRAIN.RAW,以确定工作培训津贴对每个雇员工作培训小时数的影响。三年的基本模型是:
(i)用固定效应法估计方程。在此估计中利用了多少个企业?如果每个企业都有这三年的所有变量数据(特别是hrsemp的数据),总观测个数会是多少?
(ii)解释grant的系数并评论它的显著性。
(iii)grant-1不显著有什么惊人之处吗?请解释。
(iv)平均地说,更大的企业为其职工提供了更多还是更少的培训?差别有多大?(比方说,职工多10%的企业,培训的平均小时数增多或减少了多少?)
第9题
其中,因为滞后支出变量,第一个可用年份(基年)是1993年。
(i)用混合OLS估计模型,并报告通常的标准误。为使得ai的期望值可以非零,你应该与年度虚拟变量一起包含一个截距项。支出变量的估计效应是什么?求OLS残差。
(ii)lunchit系数的符号在意料之中吗?解释系数的大小。你认为学区的贫穷率对考试通过率有很大的影响吗?
(iii)利用的回归计算AR(1)序列相关的一个检验。你应该在回归中使用1994-1998年的数据。验证存在很强的正序列相关,并讨论为什么。
(iv)现在用固定效应法估计方程。滞后的支出变量仍显著吗?
(v)你为什么认为在固定效应估计中,注册学生人数和午餐项目变量不是联合显著的?
(vi)定义支出的总(或长期)效应为的标准误。
第10题
(i)在含有一个内生解释变量、一个外生解释变量和一个外生变量的模型中,将y2的约简型教材(15.26)代入结构方程教材(15.22)。便得到y1的约简型为:
求以βj和πj表示的aj。
(ii)求以u1,u2和参数表示的约简型残差v1。
(iii)你如何一致地估计αj?
第11题
对(许多美国工人可用的)401(k)养老金计划的出现是否提高了净储蓄,吸引了大量研究兴趣。数据集401KSUBS.RAW包含了有关净金融资产(nettfa)、家庭收入(ic)、是否有资格参与401(k)计划的二值变量(e401k)和其他几个变量的信息。
(i)样本中有资格参与一个401(k)计划的家庭比例是多少?
(ii)估计一个用收入、年龄和性别解释401(k)资格的线性概率模型。包括收入和年龄的二次项,并以通常形式报告结论。
(iii)你认为401(k)资格独立于收入和年龄吗?性别呢?请解释。
(iv)求第(ii)部分中估计的线性概率模型的拟合值。有小于0或大于1的拟合值吗?
(v)利用第(iv)部分中的拟合值e401k1,定义e401k1在e401k≥0.5时取值1,并在2e401k<0.5时取值0。在9275个家庭中,预计有多少家庭有资格参与401(k)计划?
(vi)对于没有资格参加401(k)的5638个家庭,利用预测值e401k1,预测其中有多大比例没有401(k)?对于有资格参加401(k)的3637个家庭,其中有多大比例的家庭有401(k)?(如果你的计量经济软件具有“制表”命令更好。)
(vii)总正确预测比约为64.9%。给定第(vi)部分的答案,你认为这是模型好坏的一个完备描述吗?
(viii)在线性概率模型中增加一个解释变量pira。其他条件不变,若一个家庭有某人拥有个人退休金账户,一个家庭有资格参与401(k)计划的估计概率会提高多少?在10%的显著性水平上,它统计显著异于0吗?