第1题
A.应该每个实验只测试一个变量,如果一个实验测试多个变量(比如价格和颜色)就不知道是哪个变量对改进起了作用
B.每个实验可以测试多个变量,便于分析多个变量数据情况
C.没有必要进行A/Btest,浪费精力和消耗
D.A/Btest可以用来验证用户体验,广告效果等是否正常
第2题
A.流计算是消息驱动的,数据更新一般是定时更新
B.离线计算的数据更新以定期的批量更新为主
C.在线计算一般在用户发起请求时(比如查询)发生
D.流计算可以应用于实时数值统计、实时事件预警等领域
第4题
A.拒绝零假设
B.接受零假设
C.认为零假设正确
D.认为零假设错误
第6题
A.部门
B.种类
C.科学
D.行业
第7题
对(许多美国工人可用的)401(k)养老金计划的出现是否提高了净储蓄,吸引了大量研究兴趣。数据集401KSUBS.RAW包含了有关净金融资产(nettfa)、家庭收入(ic)、是否有资格参与401(k)计划的二值变量(e401k)和其他几个变量的信息。
(i)样本中有资格参与一个401(k)计划的家庭比例是多少?
(ii)估计一个用收入、年龄和性别解释401(k)资格的线性概率模型。包括收入和年龄的二次项,并以通常形式报告结论。
(iii)你认为401(k)资格独立于收入和年龄吗?性别呢?请解释。
(iv)求第(ii)部分中估计的线性概率模型的拟合值。有小于0或大于1的拟合值吗?
(v)利用第(iv)部分中的拟合值e401k1,定义e401k1在e401k≥0.5时取值1,并在2e401k<0.5时取值0。在9275个家庭中,预计有多少家庭有资格参与401(k)计划?
(vi)对于没有资格参加401(k)的5638个家庭,利用预测值e401k1,预测其中有多大比例没有401(k)?对于有资格参加401(k)的3637个家庭,其中有多大比例的家庭有401(k)?(如果你的计量经济软件具有“制表”命令更好。)
(vii)总正确预测比约为64.9%。给定第(vi)部分的答案,你认为这是模型好坏的一个完备描述吗?
(viii)在线性概率模型中增加一个解释变量pira。其他条件不变,若一个家庭有某人拥有个人退休金账户,一个家庭有资格参与401(k)计划的估计概率会提高多少?在10%的显著性水平上,它统计显著异于0吗?