Data Preprocessing

  数据预处理是对原始数据进行变换,使其满足模型训练的要求。这里总结处一下数据预处理的一般操作,方便自己回顾。一般来说数据预处理包括几点: 缺失值处理 异常值处理 标准化处理 平滑处理 采样 数据不平衡的处理 [Read More]

用户画像

References 用户画像练手 用户画像技术 用户画像 用户画像 总文章 用户画像从0到100的构建思路

XGBoost

  XGBoost (eXtreme Gradient Boosting) 算法是在 CART 基础上对 Boosting 算法的一个改进,内部决策树采用回归树。由于 Boosting 算法在损失函数选择时有较大区别,例如选择平方损失函数,就是 Boosting Tree 的方式,每轮拟合残差。对于使用一般损失函数而言,可以采用 Gradient Boosting 的方式,根据梯度下降来拟合伪残差的近似值。 [Read More]