XGBoost 在 Windows 10 和 Ubuntu 上的安装
关于什么是 XGBoost
,我在这里不再解释,如果有时间的话再写一篇文章来解释,在数据科学里非常有用。大家可以参考 Tianqi Chen 的论文 XGBoost: A Scalable Tree Boosting System ,本篇文章只是在 Windows 10 和 Ubuntu 上安装 XGBoost
的 Python 包的方法,Ubuntu 版本为 16.04 LTS,Python 版本均为 3.5,Anaconda。
Windows 10
官网
官网 介绍的方法是从 GitHub 编译安装,但是在我的机器上没有成功,pip
同样不成功。有兴趣的话可以参考官网和 2016 年的一篇文章
Installing XGBoost For Anaconda on Windows 来试试。
Unofficial Windows Binaries for Python Extension Packages
这个 是加州大学提供的一个非官方包列表,提供了很多 Python 包的 whl
文件下载,XGBoost
的在 这里,我自己下好了一份放在里 这里。根据你的环境下载对应的包,比如我的是 Python 3.5,Windows 10 64 位,那就选下面红框这个:
然后再命令行中使用下面的语句安装:
1 | pip install xgboost-0.6-cp35-cp35m-win_amd64.whl |
安装完成后使用 import xgboost
导入即可。导入完成后可能会有警告提示:
不过暂时不影响,这个问题已经在 GitHub 版本修复了,但是这个 whl
文件并不是最新的。
Ubuntu
pip
我在 Ubuntu 上使用 pip 方式安装成功,
1 | $ pip install xgboost |
安装后的版本为 0.6a2
。
编译安装
同样参照 官网 的安装方法:
1 | git clone --recursive https://github.com/dmlc/xgboost |
然后再进入 python-package
目录,使用 sudo python setup.py install
安装 Python 包。
Issues
#1 OSError: version 'GLIBCXX_3.4.20' not found
Ubuntu 下,在安装完成后用 import xgboost
导入的时候你可能遇到这样的问题:
右键在新标签页打开查看大图
这时你可以使用 conda
安装 libgcc
:
1 | conda install libgcc |
然后再导入问题就应该解决了。
其他问题可以参考 Installing XGBoost on Ubuntu 。