题意具体可参看,很明显是一个回归问题,经历下来发现数据的可挖掘性不是很大,总体来说大家的特征都差不多,关键是找到几个强特,有些特征合在一起使用效果并不是很理想,可以构造多套特征,特征之间有差异性,然后再融合,效果会好些。但总体来说此次赛题都是在拼数据、拼模型了。本博客主要学习了第二名的思路和代码,在此表示感谢,详情请参考最后链接。
[Read More]
Competitions Workflow Of Classification And Regression
分类和回归类型比赛的流程整理
为了方便以后快速上手,整理下流程,这里只针对分类和回归问题。
[Read More]
Ensemble Learning
集成学习
Table of Contents
[Read More]
Ranking Algorithms
排序算法
References
基于用户投票的排名算法(一):Delicious和Hacker News
深入理解推荐系统:排序
Normal Distribution
正态分布为什么常见?真正原因是中心极限定理(central limit theorem)。
[Read More]
Monte Carlo Method
蒙特卡洛算法
References