购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1-6 免费云端环境开通

以上是本地的安装,接着再来谈谈云端环境的开通,几乎Google GCP、AWS、Azure都提供机器学习的开发环境,这里介绍免费的Google云端环境Colaboratory,要有Gmail账号才能使用,它具备以下特点。

(1)免安装,只须开通:常用的框架均已预安装,包括TensorFlow、PyTorch。

(2)免费的GPU:使用GPU进行深度学习的模型训练会快上许多倍,Colaboratory提供NVIDIA Tesla K80 GPU显卡,含12GB内存。

(3)使用限制:Colaboratory在使用时会实时开通Docker container,只能连续使用12小时,逾时的话虚拟环境会被回收,虚拟机内的所有程序、数据一律会消失,要特别注意。

开通步骤如下。

(1)使用Google Chrome浏览器,进入云端硬盘(Google drive)接口。

(2)建立一个目录,例如“0”,并切换至该目录。

(3)在屏幕中间右击,单击“更多”>“关联更多应用”。

(4)在搜寻栏输入Colaboratory,找到后单击该App,单击“Connect”按钮即可开通。

(5)开通后,即可开始使用。可新增一个名为“Colaboratory”的文件。

注意,Google Colaboratory会自动开启虚拟环境,建立一个空白的Jupyter Notebook文件,文件名为ipynb,几乎所有的云端环境及大数据平台Databricks都以Notebook为主要使用接口。

或者直接双击Notebook文件,也可自动开启虚拟环境,进行编辑与执行。本地的Notebook文件也可上传至云端硬盘,单击即可使用,完全不用转换,非常方便。

若要支持GPU可设定运行环境使用GPU或TPU,TPU为Google发明的NPU。

Colaboratory相关操作,可参考官网说明 [6]

本书所附的范例程序,一律为Notebook文件。Notebook可以使用Markdown语法来撰写美观的说明,包括数学公式,并且程序也可以分格,实现单独执行,便于讲解,相关的用法可以参考 Jupyter Notebook: An Introduction [7] rnCHXAJoo25tnqE3YF0/dmh05Lyztz/Qt/snlfbvO4/PsBXOYSxgubWa0l/3J/nG



第2章
神经网络原理

2-1 必备的数学与统计知识

现在每天几乎都会看到几则有关AI的新闻,介绍AI的各种研发成果,一般人也许会基于好奇想一窥究竟,了解背后运用的技术与原理,但会发现涉及一堆数学符号及统计公式,可能就会产生疑问:要从事AI系统开发,非要搞定数学、统计不可吗?答案是肯定的,我们都知道机器学习是从数据中学习到知识(Knowledge Discovery from Data, KDD),而算法就是从数据中提取出知识,它必须以数学及统计为理论基础,才能证明其解法具有公信力与精准度。然而数学/统计理论都有局限,只有在假设成立的情况下,算法才是有效的,因此,如果不了解算法各个假设,随意套用公式,就好像无视交通规则,在马路上任意飚车一样危险。

因此,对于深度学习而言,我们至少需要熟悉以下学科:

(1)线性代数(Linear Algebra);

(2)微积分(Calculus);

(3)统计与概率(Statistics and Probability);

(4)线性规划(Linear Programming)。

以神经网络权重求解的过程为例,四门学科就全部用上了,如下图所示。

图2.1 神经网络权重求解过程

(1)正向传导:由“线性代数”计算误差及损失函数。

(2)反向传导:通过“偏微分”计算梯度,同时,利用“线性规划”优化技巧寻找最优解。

(3)“统计”则串联整个环节,例如数据的探索与分析、损失函数定义、效能衡量指标,通通都基于统计的理论架构而成。

(4)深度学习的推论以“概率”为基础,预测目标值。

四项学科相互为用,贯穿整个求解过程,因此,要通晓深度学习的运作原理,并且正确选用各种算法,甚至能够修改或创新算法,都必须对其背后的数学和统计有一定的基础认识,以免误用或滥用。

相关的数理基础可参考拙作《深度学习全书:公式+推导+代码+TensorFlow全程案例》第2章的介绍,本书直接切入主题,针对张量(Tensor)运算进行较详尽的说明。 rnCHXAJoo25tnqE3YF0/dmh05Lyztz/Qt/snlfbvO4/PsBXOYSxgubWa0l/3J/nG

点击中间区域
呼出菜单
上一章
目录
下一章
×