第2题
A.使用聚类算法发现互联网中的不同群体,用于网络社区发现
B.使用分类对客户进行等级划分,从而实施不同的服务
C.使用关联规则发现大型数据集中间存在的关系,用于推荐搜索
D.使用离群点挖掘发现与大部分对象不同的对象,用于分析针对网络的秘密收集信息的攻击
E.使用人工查询公司网络故障信息,查找原因进行记录
第3题
(i)一个学区中学校的最多数量和最少数量是多少?每个学区的学校平均数量是多少?
(ii)利用混合OLS(即将所有1848个学校混合在一起),估计一个将lavgsal与bs,lenrol,lstaff和lunch相联系的模型:也参见第9章的计算机练习C11。bs的系数和标准误是多少?
(iii)求对学区内聚类相关(和异方差性)保持稳健的标准误。bs的t统计量有何变化?
(iv)去掉bs>0.5的四个观测,仍用混合OLS,求出βbs及其聚类稳健标准误。现在,薪水与福利之间的替代关系,有更多的证据吗?
(v)容许一个学区内的学校存在一个共同的学区效应,用固定效应法估计这个方程。再次去掉bs>0.5的四个观测,现在,你对薪水与福利之间的替代关系有何结论?
(vi)根据你在第(iv)部分和第(v)部分的估计值,讨论通过学区固定效应而容许教师的薪酬在不同学区系统变化的重要性。
第7题
A.利用深度学习算法从原始数据入手进行分析,借助算法理解数据中的模式
B.利用深度学习全面挖掘数据中的隐含信息
C.考虑聚类算法对工况进行聚类,并针对每一种工况条件进行分析
D.釆用模糊逻辑一类的人工智能算法将专家经验引入分析模型
第9题
A.无法被用来产生更易于解释的描述性模型
B.规则集的表达能力远不如决策树好
C.基于规则的分类器都对属性空间进行直线划分,并将类指派到每个划分
D.非常适合处理类分布不平衡的数据集
第10题
建立一个模型说明要用三级火箭发射人造卫星的道理。
(1)设卫星绕地球做匀速圆周运动,证明其速度为R为地球半径,r为卫星与地心距离,g为地球表面重力加速度,要把卫星送上离地面600km的轨道,火箭末速v应为多少?
(2)设火箭飞行中速度为v(t),质量为m(t),初速为0,初始质量m0,火箭喷出的气体相对于火箭的速度为u,忽略重力和阻力对火箭的影响。用动量守恒原理证明由此你认为要提高火箭的末速应采取什么措施。
(3)火箭质量包括3部分:有效载荷(卫星)mp,燃料mf;结构(外壳、燃料仓等)ms,其中ms在mf+ms中的比例记作λ,一般λ不小于10%。证明若mp=0(即火箭不带卫星),则燃料用完时火箭达到的最大速度为vm=-ulnλ。已知目前的u=3km/s,取λ=10%,求vm,这个结果说明什么?
(4)假设火箭燃料燃烧的同时,不断丢弃无用的结构部分,即结构质量与燃料质量以λ和1-λ的比例同时减少,用动量守恒原理证明问燃料用完时火箭末速为多少,与前面的结果有何不同?
(5)(4)是个理想化的模型,实际上只能用建造多级火箭的办法一段段地丢弃无用的结构部分。记mi为第i级火箭质量(燃料和结构),λmi为结构质量(λ对各级是一样的)。有效载荷仍用mp表示。当第1级的燃料用完时丢弃第1级的结构,同时第2级点火。再设燃烧级的初始质量与其负载质量之比保持不变,比例系数为k。证明3级火箭的末速计算要使v3=10.5km/s,发射1t重的卫星需要多重的火箭(u,λ用以前的数据)?若用2级或4级火箭,结果如何?由此得出使用3级火箭发射卫星的道理。
第11题
利用AFFAIRS.RAW中女性的数据。
(i)为affair估计一个线性概率模型,二元指示变量在女性至少有一次婚外恋时等于1,解释变量包括yrsmarr、age和educ。解释yrsmarr的系数。
(ii)在控制了yrsmarr后,age和educ对affuir还有影响吗?
(iii)在(i)中的模型里加入kids。解释它的系数并判断估计是否在统计上显著。
(iv)对于(iii)中的模型,除了kids仍在模型中以外,加入四个宗教虚拟变量。基础组包括那些声称自己反宗教的女性。对于那些非常信仰宗教的和反宗教的女性,报告自己有婚外恋的可能性是不是有差别?宗教信仰的影响有多大?
(v)对于那些有宗教信仰和无宗教信仰的女性,报告自己有婚外恋的可能性是不是有差别?宗教信仰的影响有多大?[提示:从(iv)中改变基础组很简单。]