原始论文:XGBoost: A Scalable Tree Boosting System
摘要
Tree boosting 是一个高效的并且广泛应用的机器学习方法。在本文中,我们会介绍一个可扩展的端到端的 tree boosting 系统,它叫 XGBoost,它被数据科学家广泛地应用,并且在许多机器学习挑战取得了最好的结果。对于稀疏数据我们提出了稀疏性感知算法,以及加权分位数梗概用来近似树模型学习。更重要的是,我们提供了对缓存访问模式,数据压缩和分片的见解来建立一个可扩展的提升树系统。通过综合这些看法, XGBoost 只需要使用比现有系统少得多的资源就可以扩展出超过数十亿的实例。
关键词:大规模机器学习