XGBoost(extreme Gradient Boosting)是近几年流行起来的一种分类算法,由Tianqi Chen最初开发的实现可扩展、便携、分布式梯度提升(gradient boosting)算法的一个库,可以下载安装并应用于C++、Python、R等语言,现在由很多协作者共同开发维护。XGBoost所应用的算法就是梯度提升决策树,既可以用于分类也可以用于回归问题中。XGBoost最大的特点在于,它能够自动利用CPU的多线程进行并行计算,同时在算法上加以改进,提高了精度。
XGBoost的安装也比较简单,以我的Mac本为例,从GitHub同步最新代码并进行编译:
git clone --recursive https://github.com/dmlc/xgboost cd xgboost cp make/minimum.mk ./config.mk make -j4
然后安装Python对应包:
cd python-package sudo python setup.py install
其他系统的安装请参考如下链接:
http://xgboost.readthedocs.io/en/latest/build.html