下列数据序的变量中,不能称为解释变量的是()
A.反应变量
B.协变量
C.分类变量
D.指示变量
E.分组变量
A.反应变量
B.协变量
C.分类变量
D.指示变量
E.分组变量
第1题
文件CEOSAL2.RAW包含了177位首席执行官的数据,并可用来考察企业业绩对CEO薪水的影响。
(i)估计一个将年薪与企业销售量和市场价值相联系的模型。让这个模型对每个自变量的变化都具有常弹性。以方程的形式写出结论。
(ii)在第(i)部分的模型中增加profits。为什么这个变量不能以对数形式进入模型?你会说这些企业业绩变量解释了CEO薪水波动中的大部分吗?
(iii)在第(ii)部分的模型中增加ceoten。保持其他条件不变,延长一年CEO任期,估计的百分比回报是什么?
(iv)求出变量log(mktval)和prots之间的样本相关系数。这些变量高度相关吗?这对OLS估计量有什么影响?
第2题
利用FERTIL2.RAW中的数据。解释存活儿童数的一个简单模型是:
其中,解释变量是女性接受教育的年限,年龄(以年表示)及分别表示女性家是否有电和电视机的二元变量。
(i)用OLS估计该方程并用通常的形式报告结果。讨论变量eletric和tv的系数和统计显著性。
(ii)城市居民和非城市居民在生育率上有区别吗?请解释。
(ii)现在对城市居民和非城市居民分别估计方程(当然,解释变量要去掉urban)。除了截距以外,其他系数有明显区别吗?
(iV)允许城市居民和非城市居民截距项不同,在原假设下得到邹至庄统计量。你能得到什么结论?[提示:你在检验5个限制条件,SSR从第(ii)部分和第(iii)部分中很容易得到。]
第3题
利用APPLE.RAW中的数据。这些电话调查数据是为了得到(假想的)“环保”苹果需求。调查者向每个家庭都(随机地)介绍了正常苹果和环保苹果的一组价格,并询问他们愿意购买每种苹果的磅数。
(i)对于样本中的660个家庭,有多少家庭报告称在预定价格上不愿意购买环保苹果?
(ii)变量ecolbs看上去在严格正值上具有连续分布吗?你的回答对ecolbs托宾模型的适当性有何含义?
(iii)以ecoprc、regprc、famic和hhsize作为解释变量,估计一个托宾模型。哪些变量在1%的水平上显著。
(iv)faminc和hhsize联合显著吗?
(v)第(iii)部分中价格变量系数的符号与你的预期一致吗?请解释。
(vi)令β1和β2为ecoprc和regprc的系数,相对一个双侧备择假设,检验假设H0:-β1=β2。报告检验的p值。(如果你的回归软件不能很容易地计算这种检验,你可能还要参考教材4.4节
(vii)对样本中的所有观测求E(ecolbslx)的估计值[见方程(17.25)],称之为ecolbsi。最大和最小拟合值是多少?
(viii)计算ecolbs,和ecolbsi之相关系数的平方。
(ix)现在,利用第(iii)部分中同样的解释变量,估计ecolbs的一个线性模型。为什么OLS估计值比托宾估计值小那么多?从拟合优度来看,托宾模型比线性模型更好吗?
(x)评价如下命题:“由于托宾模型的R,如此之小,所以估计的价格效应可能是不一致的。”
第4题
数据集SMOKE.RAW包含美国成人个人随机样本在抽烟行为和其他变量方面的信息。变量cigs为(平均)每天抽烟的数量。你是否认为在美国这个总体中,cigs具有正态分布?试做解释。
第5题
利用AFFAIRS.RAW中的数据。
(i)给定的数据中有多少是女人?变量naffairs是一个已婚的人婚外情的次数(尽管大部分的数据是按照一定的区间分组的)。从来没有过婚外情的女人的比例是多大?次数最多的是多少?
(ii)用age,yrsmarr,kids,educ,vryrel,smeral,slghtrel和notrel作为变量,估计一个泊松模型,解释vryrel的系数并以最大似然标准误为基础讨论t值。
(iii)现在得到了当方差和均值与教材(17.35)相关的情况下的标准误,相比于泊松MLE模型下的t值,本题估计出的t值的解释能力如何?
第6题
使用CEOSAL2.RAW中的数据得出下表:
变量mktval为企业的市场价值,profmarg为利润占销售额的百分比,ceoten为其就任当前公司CEO的年数,而comten则是其在这个公司任职的总年
数。
(i)评论profiarg对CEO薪水的影响。
(ii)市场价值是否具有显著影响?试解释你的结论。
(iii)解释ceoten和comten的系数。这些变量是统计显著的吗?
(iv)你如何解释在其他条件不变的情况下,你在这个公司任职时间越长,你的薪水则越低?
第7题
401K.RAW中的数据是帕普克(Papke,1995)所分析数据的一个子集,帕普克是为了研究401(k)养老金计划的参与率和该计划的慷慨程度之间的关系。变量prate是有资格参与该计划的员工中拥有活动账户的百分比,也是我们要解释的变量。慷慨程度指标是计划的匹配率mrate。这个变量给出了员工每向这个账户存1美元,公司为该员工匹配的平均数量。例如,若mrate=0.50,则员工每投入1美元,公司就匹配50美分。
(i)求出该计划的样本中平均参与率和平均匹配率。
(ii)现在估计下面这个简单回归方程prate=β0+β1mrate报告你的结果以及样本容量和R。
(iii)解释你的方程中的截距。解释mrate的系数。
(iv)当mrate=3.5时,求出prate的预测值。这是一个合理的预测吗?解释这里出现的情况。
(v)prate的波动中,有多少是由mrate解释的?你认为,这是一个足够大的量吗?
第8题
使用CARD.RAW中的数据。
(i)我们在教材例15.4中所估计的方程可写成:
其中,其他解释变量在教材表15-1中列出。为使Ⅳ具有一致性,educ的Ⅳ,即muc4,必须与u不相关。nearc4是否会与误差项内的因素相关,例如无法观测的能力?请解释。
(ii)对于数据集中的男性子样本,可以利用1Q分数。做IQ对nearc4的回归以验证平均IQ分数是否因该男子在四年制大学附近长大而改变。你将得出什么结论?
(iii)现在,将IQ对nearc4、smsa66及1966年地域性虚拟变量reg662,···,reg669进行回归。排除了地域性虚拟变量之后,IQ是否与nearc4有关?如何使该答案与你在第(ii)部分中发现的结果相符合。
(iv)从第(ii)和(iii)部分中,对于在log(wage)方程中控制smsa66和1966年地域性虚拟变量的重要性,你将得出什么结论?
第9题
利用TWOYEAR.RAW中的数据。
(i)变量stotal是一项标准化测试变量,可用作无法观测的能力的代理变量。求stotal的样本均值和标准差。
(ii)做警察和univ对stotal的简单回归。两个大学教育变量都与stotal统计相关吗?请解释。
(iii)在教材方程(4.17)中增加stotal,并检验二年制大专和四年制大学教育具有相同回报的假设,备择假设是四年制大学的回报更高。你的结论与4.4节中的结论有何区别?
(iv)在第(iii)部分估计的方程中增加stotal2。测试分数变量的二次项有必要吗?
(v)在第(iii)部分的方程中增加stotal·警察和stotal·univ。这两项联合显著吗?
(vi)你通过使用stotal而控制能力变量的最终模型是什么?说明你的理由。
第10题
利用VOLAT.RAW中的数据。变量rsp500是标准普尔500股票指数的月回报,以年回报率表示。(既包括价格变动带来的收益,也包括分得的红利。)变量i3是三月期国债的收益率,pcip是工业生产的百分比变化,这些也都以年率表示。
(i)考虑方程你认为β1和β2应该有什么样的符号?
(ii)用OLS估计上述方程,用标准格式报告结果,并解释系数的符号和大小。
(iii)哪些变量是统计显著的?
(iv)你在第(iii)部分中的结论是否意味着从标准普尔500中获得的收益是可预测的?说明理由。
第11题
为了检验抵押贷款市场中的歧视,可使用一个线性概率模型:
(i)如果对少数民族存在歧视,并控制了适当的因素,那么,的符号是什么?
(ii)将qpxe对white做回归,并以通常的形式报告结果。解释white的系数。它是统计显著的吗?它实际上大吗?
(iii)作为控制因素,增加变量hrat,obrat,loanprc,unem,male,married,dep,sch,cosign,chist,pubrec,mortlatl,mortlat2和vr。white的系数会有什么变化?仍有对非白人存在歧视的证据吗?
(iv)现在容许种族效应与度量了其他债务占收入比例的变量(obrat)存在着交互作用。交互项显著吗?
(v)利用第(iv)部分的模型,当债务负担达到样本均值obrat=32时,作为白人对贷款许可的概率有多大的影响?构造这种影响的一个95%的置信区间。