财务作业代写

财务作业代写 1 数据和指标已经给出,其中Xn代表财务变量,Y代表高风险,企业名称前有*ST或ST的

  代表高风险企业,没有这些前缀的为正常企业;随机森林模型的目的是通过财务变量来预测企业是否是高风险的(即是否是ST或*ST)。

1 数据和指标已经给出,其中Xn代表财务变量,Y代表高风险,企业名称前有*ST或ST的

代表高风险企业,没有这些前缀的为正常企业;随机森林模型的目的是通过财务变量来预测企业是否是高风险的(即是否是ST或*ST)。

2 划分训练集和测试集,比例为3:1

3 指标筛选:a. 根据OOB误差率的不纯度平均减少值来度量特征重要性,并将指标按照

重要性来降序排列 财务作业代写

(麻烦呈现2个图并发给我

财务作业代写
财务作业代写

图1:横坐标为特征变量数目,纵坐标为OOB error

图2:横坐标为MeanDecreaseGini,纵坐标为特征变量)

4 参数寻优:a. 设定ntree,基于OOB的误差率选择最优mtry

(麻烦呈现1个图并发给我 图:横坐标为mtry的数目,纵坐标为Error rate)

  1. 进一步确定ntree的值 财务作业代写

(麻烦呈现1个图并发给我 图:横坐标为决策树数目,纵坐标为Error rate)

5 建立RF和CART两种模型,用训练集进行模型的训练,用测试集进行预测,然后计算各个模型的总错误率、第一类错误率、第二类错误率