购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4.3 使用Azure机器学习Notebook

在完成了Azure账户的注册和机器学习工作区的创建后,接下来我们将探讨如何使用Azure机器学习Notebook进行编程和实验。Azure AI Notebook提供了一种便捷的工具,允许用户在云端进行机器学习编程和实验。

4.3.1 启动工作室

首先,我们需要进入Azure机器学习工作。在Azure门户页面中单击“机器学习”服务,找到并进入之前创建的机器学习工作区。在工作区的概览页面中单击“启动工作室”按钮,如图4.15所示,工作室将会在新标签页中打开。

图4.15 启动工作室

进入工作室后将会看到一个名称为“Azure AI机器学习工作室”的界面,如图4.16所示。在左侧导航栏中找到并选择Notebooks选项,进入Notebook管理页面。

图4.16 AzureAI机器学习工作室

在Notebook管理页面中可以看到一些示例Notebook。为了帮助用户快速入门,Azure提供了一些预先配置好的Notebook示例。找到名称为“入门:训练和部署模型”的示例Notebook,单击“启动”按钮,将打开一个新的Notebook编辑器页面。

整个创建过程大约耗时25分钟,创建完成后会自动进入Notebook页面。

4.3.2 新建Notebook

打开示例Notebook后,需要创建一个计算实例来运行代码。单击页面中的“创建计算”按钮,如图4.17所示。

图4.17 创建计算实例

Azure提供了多种计算资源配置,如图4.18所示。用户可以根据自己的需求选择合适的算力配置。需要注意的是,不同的算力配置有不同的计费标准,请合理选择以控制成本。

在选择好计算资源配置后,单击“审阅+创建”按钮,Azure将开始创建计算实例。创建过程耗时几分钟,完成后可以在Notebook中使用这些计算资源。

接下来需要新建一个Jupyter Notebook文件。在左侧文件浏览器中右击一个文件夹,在弹出的快捷菜单中选择“新建文件”命令,输入文件名,如“test1.ipynb”,然后单击“审阅+创建”按钮,如图4.19所示。创建完成后,双击该文件以,编辑器中打开它。

图4.18 算力配置计费标准

图4.19 新建自己的.ipynb文件

4.3.3 在Notebook中执行简单的机器学习任务

首先,我们需要将本地的表格数据上传到Azure机器学习工作区中。本地数据文件名为data.csv,部分数据如表4.1所示。

表4.1 data.csv

这个数据集包含多个样本,每个样本有4个属性:年龄(age)、收入(income)、性别(gender)和目标变量(target),目标变量表示客户是否流失(1表示流失,0表示未流失)。

首先,打开Azure机器学习工作室。在左侧导航栏中找到并选择“数据”选项,在弹出的“数据”页面中单击顶部的“+创建”按钮,在弹出的“创建数据资产”页面中输入对应的名称和说明,如图4.20所示。

图4.20 创建数据集

单击“下一个”按钮,在弹出的“数据源”页面中选择“从本地文件上传”,然后单击“下一个”按钮。在弹出的“目标存储类型”页面中选择“Azure Blob存储”,如图4.21所示。

图4.21 选择“AzureBlob存储”方式

在“文件选择”页面中单击“浏览”按钮,选择本地的data.csv文件,检查无误后,单击“创建”按钮。上传完成后,data.csv文件将会出现在数据集列表中。

现在,可以在Notebook中加载该数据集并执行相应的机器学习任务了,具体步骤如下。

1.设置环境

首先确保已经安装了必要的Python包。你可能需要安装pandas、scikit-learn和azureml。可以在Notebook中运行以下命令安装这些包:

   !pip install pandas scikit-learn azureml-core
2.导入必要的库

接下来导入要使用的库:

   import pandas as pd
   from sklearn.model_selection import train_test_split
   from sklearn.linear_model import LogisticRegression
   from sklearn.metrics import accuracy_score
   from azureml.core import Workspace, Dataset
3.加载数据集

从Azure ML工作区中加载上传的data.csv数据集:

4.数据预处理

对数据进行一些基本的预处理,如将性别编码为数值。

   # 性别编码
   df['gender']=df['gender'].map({'M': 0, 'F': 1})

   # 查看数据
   print(df.head())
5.准备训练和测试数据

将数据集划分为特征( X )和目标变量( y ),并进一步分割为训练集和测试集。

6.训练机器学习模型

使用逻辑回归模型进行训练。

7.预测和评估

使用测试集进行预测并评估模型性能。

8.预测新数据

可以用训练好的模型对新数据进行预测,例如:

新数据预测结果正确。在上面的步骤中,我们演示了如何在Azure机器学习工作区中上传本地数据文件,并在Notebook中执行简单的机器学习任务。具体步骤包括:上传数据、安装必要的Python包、导入库、加载数据集、进行数据预处理、划分训练和测试数据集、训练机器学习模型、预测和评估模型性能以及对新数据进行预测。整个流程展示了从数据准备到模型训练和评估的完整过程。

除此之外,Azure AI工作室还提供了许多功能,可以进一步帮助用户执行机器学习和数据分析任务,这些功能如下:

自动化ML:提供自动化的机器学习模型训练和优化功能。

设计器:允许用户通过拖曳组件的方式构建和部署机器学习模型。

提示流:提供数据提示流的创建和管理功能。

跟踪:提供实验跟踪和管理功能。

数据:支持数据集的管理和浏览。

作业(Job):管理和监控机器学习作业。

组件:提供机器学习组件的管理功能。

管道:管理和执行机器学习管道。

环境:管理和配置计算环境。

模型:管理和部署机器学习模型。

服务终端:提供API服务终端的管理。

计算:管理计算资源。

正在监视:监控机器学习资源和任务。

数据标签:提供数据标签功能。

链接服务:管理链接服务。

以上功能为用户提供了丰富的工具和资源,帮助用户更高效地完成机器学习和数据分析任务。有兴趣的读者可以自行查阅资料,尝试使用这些功能来扩展和优化自己的机器学习项目。 krCulqkAU4S7ubV0T8hzfdI7l+9tqy4eQbMlKY9WUQESgOiibIfnI8cr8xTIzxwy

点击中间区域
呼出菜单
上一章
目录
下一章
×