购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.5.3 科学计算、数据科学和机器学习软件包

本书的前半部分主要使用NumPy中的多维数组来存储和操作数据,偶尔会使用pandas。pandas是一个建立在NumPy之上的库,提供更加高级的额外数据操作工具,使处理表格数据更加方便。为了增强学习体验并可视化定量数据,本书使用可定制的Matplotlib库,这对于理解解决方案很有价值。

本书主要使用的机器学习库是Scikit-Learn(第3章至第11章)。在第12章中,将介绍用于深度学习的PyTorch库。

下面列出了本书使用的主要Python软件包及其版本号。请确保安装的软件包的版本号与这些版本号相同,以确保示例代码可以正确运行:

·NumPy 1.21.2;

·SciPy 1.7.0;

·Scikit-Learn 1.0;

·Matplotlib 3.4.3;

·pandas1.3.2。

安装完这些软件包后,可以在Python中导入软件包并访问其__version__属性,以确定已安装的版本正确,例如:

为方便起见,在本书的代码库(https://github.com/rasbt/machine-learning-book)中加入了python-environment-check.py脚本,这样可以通过执行此脚本检查Python版本和各种软件包的版本。

某些章节将需要额外的软件包,届时本书将提供有关软件包的安装信息。例如,在第12章需要安装PyTorch时,会提供PyTorch安装提示和说明,无须担心PyTorch软件包安装问题。

如果运行代码遇到错误,即使代码与本书中的代码完全相同,也建议首先检查所使用软件包的版本号,然后再花时间调试代码或联系程序开发者。有时,错误可能是由于一个软件包的新版本引入了向前不兼容的更改。

如果已经安装了Python和各种软件包,并不想将Python和各种软件包的版本号更改为本书使用的版本号,那么建议使用虚拟环境安装本书所使用的软件包。如果读者已经安装了Python但没有安装conda manager,那么可以使用venv库创建新的虚拟环境。例如,可以运行以下两个命令创建和激活虚拟环境:

请注意,每次打开新的终端时都需要激活虚拟环境。可以在https://docs.python.org/3/library/venv.html上找到更多关于venv库的信息。

如果在conda package manager中使用Anaconda,则可以按下述方式创建和激活虚拟环境: e3aqRaXhf/8T3X4TeOU1Q/2fUK1Z9V56mMCmBqihHhq80edROL+jmqGTF4oaJUAB

点击中间区域
呼出菜单
上一章
目录
下一章
×