

机器学习模型是否需要考虑变量共线性问题?
根据我自己做项目和写文章的经验来看,输入数据之间如果存在很强的共线性,通常会对传统的线性回归算法产生“毁灭级”的影响;对于一般的浅层机器学习算法,比如BPNN、SVM、随机森林(RF)、极限学习机(ELM)等,通常也会产生不可忽视的影响。 咱们首先统一思想,来明确一下变量之间多重共线性的含义: 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。以下图为例 对于某一个以农业为主的小…
根据我自己做项目和写文章的经验来看,输入数据之间如果存在很强的共线性,通常会对传统的线性回归算法产生“毁灭级”的影响;对于一般的浅层机器学习算法,比如BPNN、SVM、随机森林(RF)、极限学习机(ELM)等,通常也会产生不可忽视的影响。 咱们首先统一思想,来明确一下变量之间多重共线性的含义: 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。以下图为例 对于某一个以农业为主的小…