机器学习、深度学习有三块基石:线性代数、概率与信息论、数值分析。线性代数在上章已介绍过,数值分析后续将介绍,本章讨论概率和信息论。概率是用于表示不确定性陈述的数学框架,即对事物不确定性的度量,而信息论主要研究信号或随机变量所包含的信息量。
在人工智能领域,概率法则告诉我们AI系统应该如何推理,从理论上分析我们提出的AI系统的行为。
计算机科学许多分支处理的对象都是完全确定的实体,但机器学习却大量使用概率。如果你了解机器学习的工作原理,或许会有更深的体会。因为机器学习大部分时候处理的都是不确定量或随机量。
概率论和信息论是众多学科的基础,也是机器学习、深度学习的重要基础。
如果你对概率论和信息论很熟悉了,可以跳过这章。如果你觉得本章内容还不够,希望了解更多,可以参考相关专业教材。本章主要内容包括:
·为何要学概率与信息论
·样本空间与随机变量
·概率分布
·边缘概率
·条件概率
·期望、方差及协方差
·贝叶斯定理
·信息论