对于有志从事机器学习和数据科学领域的读者,推荐安装Anaconda,它在数据科学领域有着非常显著的优势。
如果要了解Anaconda有什么突出的优点,我们可以在ChatGPT对话框中输入“Anaconda有什么优点”,它会给出如下答复。
ChatGPT Anaconda是一个开源的数据科学平台,它具有以下几个优点。
1.方便的环境管理:Anaconda提供了一个方便的环境管理工具,你可以在同一台计算机上创建多个环境,每个环境中安装不同版本的Python和各种数据科学库。这使不同项目之间的切换变得容易,也可以避免版本冲突的问题。
2.预装了常用的数据科学库:Anaconda自带很多常用的数据科学库,如NumPy、Pandas、Matplotlib、scikit-learn等,省去了安装和配置这些库的麻烦。
3.跨平台:Anaconda可以在多个操作系统上运行,包括Windows、Mac和Linux,这使开发和部署变得更加方便。
4.社区支持:Anaconda有一个活跃的社区,提供了各种教程、文档和支持,使初学者可以更容易地入门。
5.内置Jupyter Notebook:Anaconda内置了Jupyter Notebook,可以方便地进行数据分析和可视化,并将代码、注释和可视化结果整合在一个文档中。
总的来说,Anaconda是一个方便、易用、跨平台的数据科学平台,它提供了一系列常用的工具和库,可以帮助数据科学家和开发者更快地构建和部署数据科学应用。
上述这些Anaconda的优点,笔者深有体会。可以说在多年的实际工作中,Anaconda已经成为笔者最亲密的“战友”。相信读者在熟悉并习惯使用它之后,也会产生“爱不释手”的感觉。
接下来我们就下载并安装Anaconda。在ChatGPT对话框中输入“如何下载并安装Anaconda”,会得到以下答复。
ChatGPT以下是在Windows系统上下载和安装Anaconda的步骤。
1.在Anaconda官网上下载适合您系统的Anaconda安装包。
2.打开下载的Anaconda安装包。
3.在安装向导中,选择“Install”选项,然后单击“Next”。
4.阅读许可协议,如果同意,选择“I Agree”选项,然后单击“Next”。
5.选择安装位置,然后单击“Next”。
6.选择安装类型,默认为“Just Me”,然后单击“Next”。
7.如果您希望在环境变量中添加Anaconda路径,请勾选“Add Anaconda to my PATH environment variable”选项,然后单击“Install”。
8.等待安装程序完成安装,这可能需要几分钟时间。
9.安装完成后,选择“Next”选项。
10.选择“Register Anaconda as my default Python 3.9”选项,然后单击“Finish”。
安装完成后,您可以在开始菜单中找到Anaconda Navigator,通过它来启动Jupyter Notebook等工具。您也可以通过Anaconda Prompt启动Python环境。
ChatGPT给出的下载与安装的教程还是比较详细的,根据上述步骤,基本可以完成Anaconda的安装。
安装完成后,我们就要在Anaconda内置的Jupyter Notebook中编辑和运行Python代码了。初次使用的读者可以在ChatGPT对话框中提问“如何在Anaconda中使用Jupyter Notebook”,获得详细的指导,如下所示。
ChatGPT在Anaconda中使用Jupyter Notebook非常简单,按照以下步骤即可。
1.启动Anaconda Navigator。您可以在开始菜单中找到Anaconda Navigator,然后单击它来启动它。
2.在Anaconda Navigator中,单击“Launch”按钮下的“Jupyter Notebook”图标。
3.Jupyter Notebook将在默认浏览器中打开。如果浏览器未自动打开,请手动打开浏览器并访问网址。
4.在Jupyter Notebook主页中,单击“New”按钮,然后选择“Python 3”或其他支持的编程语言。
5.Jupyter Notebook将打开一个新的Notebook文档。您可以在该文档中编写代码、运行代码、添加注释和说明文本等。
6.在Notebook中编写完代码后,可以通过单击运行按钮或按Shift+Enter组合键来运行代码。
7.您可以在Notebook中添加Markdown单元格,以便添加说明文本、图片、链接等。
8.在完成Notebook后,您可以通过单击“File”选项卡下的“Save and Checkpoint”选项保存Notebook。
9.当您再次打开Jupyter Notebook时,您可以在主页中找到保存的Notebook,并继续编辑或运行它。
这就是在Anaconda中使用Jupyter Notebook的基本步骤。请注意,Jupyter Notebook支持许多其他的功能和插件,如绘图、数据可视化、多语言支持等。您可以通过自行搜索或参考Jupyter Notebook官方文档了解更多信息。
跟着ChatGPT给出的指导一步一步操作,会看到如图2-2所示的界面。
图2-2 新建的Jupyter Notebook
图2-2便是我们根据ChatGPT的指导,创建的空白Jupyter Notebook文件。框中的区域被称为一个“单元格”(Cell),我们可以在这个单元格中编辑Python代码,并使用“Shift+Enter”组合键运行代码。
下面我们就把之前ChatGPT给出的打开“wine.data”的示例代码粘贴到Jupyter Notebook中运行。在此建议大家对代码稍做修改,把最后一行的print函数去掉,修改后的代码如下。
运行代码会得到一个表格,如表2-1所示。
表2-1 Wine数据集的前5行记录
为了方便展示,表2-1省略了数据集中的部分特征,读者在自己的Notebook中会看到表头包含完整的特征字段。
如果读者得到了和表2-1类似的结果,说明数据成功读取,并且每个特征的名称也被添加到表头当中。接下来我们就可以使用这个数据集进行下一步的试验了。