本题利用WAGE1.RAW中的数据。(i)使用OLS估计方程(iv)exper取什么值时,工作经历的增加实际上会降
本题利用WAGE1.RAW中的数据。
(i)使用OLS估计方程
(iv)exper取什么值时,工作经历的增加实际上会降低预期的log(wage)。样本中有多少人具有比该取值更长的工作经历?
本题利用WAGE1.RAW中的数据。
(i)使用OLS估计方程
(iv)exper取什么值时,工作经历的增加实际上会降低预期的log(wage)。样本中有多少人具有比该取值更长的工作经历?
第1题
使用WAGE1.RAW中的数据。
(i)估计方程
保留残差并画出其直方图。
(ii)以log(wage)作为因变量重做第(i)部分。
(iii)你认为是水平值-水平值模型还是对数-水平值模型更接近于满足假定MLR.6?
第2题
本题利用MEAP93.RAW中的数据。
(i) 估计模型math10=β0+β1log(expend)+β2Inchprg+u,并按照通常的方式报告估计方程,包括样本容量和R2。斜率系数的符号与你的预期一致吗?请加以解释。
(ii)你如何理解第(i)部分中估计出来的截距?特别是,令两个解释变量都等于零说得过去吗?[提示:记住log(1)=0。]
(i)现在做math10对log(expend)的简单回归, 并将斜率系数与第(i)部分中得到的估计值进行比较。与第(i)部分中的结果相比,这里估计出来的支出效应是更大还是更小?
(iv)求山lexpend=log(expend)与Inchprg之间的相关系数。你认为其符号合理吗?
(v)利用第(iv)部分的结果来解释你在第(iii)部分中得到的结论。
第3题
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机练习C8。)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧备择假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告的双侧p值。
(iv)在第(ii)部分的回归中,log(income)和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个地区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?
第4题
本题使用JTRAIN.RAW中的数据。
(i)考虑简单回归模型
其中,scrap表示企业的废品率,grant表示是否得到工作培训津贴的一个虚拟变量。你能想到u中的无法观测因素可能会与grant相关的原因吗?
(ii)利用1988年的数据估计这个简单的回归模型。(你应该有54个观测。)得到工作培训津贴显著地降低了企业的废品率吗?
(iii)现在增加一个解释变量log(scrap87)。这将如何改变grant的估计影响?解释grant的系数。相对于单侧备择假设它在5%的显著性水平上统计显著吗?
(iv)相对双侧备择假设,检验log(scrapg)的参数为1的虚拟假设。报告检验的P值。
(v)利用异方差-稳健标准误,重复第(iii)步和第(iv)步,并简要讨论任何明显的差异。
第5题
利用AFFAIRS.RAW中的数据。
(i)给定的数据中有多少是女人?变量naffairs是一个已婚的人婚外情的次数(尽管大部分的数据是按照一定的区间分组的)。从来没有过婚外情的女人的比例是多大?次数最多的是多少?
(ii)用age,yrsmarr,kids,educ,vryrel,smeral,slghtrel和notrel作为变量,估计一个泊松模型,解释vryrel的系数并以最大似然标准误为基础讨论t值。
(iii)现在得到了当方差和均值与教材(17.35)相关的情况下的标准误,相比于泊松MLE模型下的t值,本题估计出的t值的解释能力如何?
第6题
本题使用WAGE2.RAW中的数据。一般地,保证如下所有回归都含有截距。
(i)将IQ对educ进行简单回归,并得到斜率系数
第7题
人口特征方面的数据。目的是想考察快餐店是否在黑人更集中的区域收取更高的价格。
(i)求出样本中prpblck和income的平均值及其标准差。prpblck和income的度量单位是什么?
(ii)考虑一个模型,用人口中黑人比例和收入中位数来解释苏打饮料的价格psoda:
用OLS估计这个模型并以方程的形式报告结果, 包括样本容量和R。(报告估计值时不要使用科学计数法。)解释prpblck的系数。你认为它在经济上算大吗?
(iii) 将第(ii)部分得到的估计值与psoda对prpblck进行简单回归得到的估计值进行比较。控制收入变量后,这种歧视效应是更大还是更小了?
(iv)收入价格弹性为常数的模型可能更加适合。报告如下模型的估计值:
(vi)求出1og(income)和prppov的相关系数。大致符合你的预期吗?
(vii)评价如下说法:“由于log(income)和prppov如此高度相关,所以它们不该进入同一个回归。”
第8题
本题要用到MLB1.RAW中的数据。
(i)从以下模型中去掉变量rbisyr。hrunsyr的统计显著性会如何变化?hrunsyr的系数大小又会如何变化?
(ii)在第(i)部分的模型中增加变量rusyr(每年垒得分),fldperc(防备率)和sbasesyr(每年盗垒数)。这些因素中,哪一个是个别显著的?
(ii)在第(ii)部分的模型中,检验bavg,fldperc和sbasesyr的联合显著性。
第9题
本题要用到MLB1.RAW中的数据。
(i)使用方程(4.31)中所估计的模型,并去掉变量rbisyr。hrunsyr的统计显著性会怎么样?hrunsyr的系数大小又会怎么样?
(ii)在第(i) 部分的模型中增加变量runsyr(每年垒得分),fldperc(防备率)和sbasesyr(每年盗垒数) 。这些因素中,哪一个是个别显著的?
(iii)在第(ii)部分的模型中, 检验bavg, fldperc和sbasesyr的联合显著性。
第10题
本题要用到HTV.RAW中的数据。
(i)考虑一个加入了父母受教育程度变量的工资方程
表述原假设:父亲与母亲的受教育程度对log(wage)具有相同影响。
(ii)估计第(i)部分中的模型,同时谈谈你对β,和队大小的看法。
(iii)在5%的显著性水平上,相对于双侧备择假设,通过构造一个95%的置信区间来检验第(i)部分中的原假设。你得到的结论是什么?
第11题
本题使用GPA2.RAW中的数据。
(i)考虑方程
其中,colgpa表示累积的大学GPA,hsize表示高中毕业年级以百人计的规模,hsperc表示在毕业年级中学术排名的百分位,sat表示SAT综合分数,female是一个二值变量,而athlete也是一个运动员取值1的二值变量。你对这个方程中的系数有何预期?哪些你没有把握?
(ii)估计第(i)部分中的方程,并以通常的形式报告结果。估计运动员和非运动员之间GPA的差异是多少?它是统计显著的吗?
(ii)从模型中去掉sat并重新估计这个方程。现在,作为运动员的估计影响是多大?讨论为什么这个估计值不同于第(ii)部分的结论。
(iv)在第(i)部分的模型中,容许作为运动员的影响会因性别不同而不同。检验如下原假设:在其他条件不变的情况下,女生是否是运动员没有差别。
(v)sat对colgpa的影响会因性别不同而不同吗?讲出你的根据。