1.【单选题】医疗影像分析运用了如下哪种人工智能技术?
A.计算机视觉
B.推荐系统
C.智能语言处理
D.语音识别
【解析】
选项A:计算机视觉技术使计算机能够理解和处理图像和视频数据。在医疗领域,计算机视觉可以用于分析医疗影像,如X光、MRI等,以辅助医生进行诊断。
选项B:推荐系统根据用户的历史行为和偏好来推荐内容。在医疗领域,推荐系统可以用于推荐治疗方案或药物,但与医疗影像分析关系不大。
选项C:智能语言处理技术使计算机能够理解和生成人类语言。在医疗领域,智能语言处理可以用于病历记录、患者咨询等场景,但与医疗影像分析关系不大。
选项D:语音识别技术使计算机能够识别和理解人类语音。在医疗领域,语音识别可以用于辅助医生记录病历或进行语音搜索,但与医疗影像分析关系不大。
【答案】 A
2.【单选题】以下不属于计算机视觉使用场景的是哪个选项?
A.语义分割
B.超分辨率重构
C.行为识别
D.知识图谱
【解析】
选项A:语义分割是指将图像中的每个像素分配到一个类别中的技术。它通常用于理解图像内容和场景。
选项B:超分辨率重构是指通过软件方法提高图像分辨率的技术。它通过算法补充原有低分辨率图像缺少的高频细节,使得原有低分辨率图像获得更高分辨率的显示效果。
选项C:行为识别专注于分析和识别视频序列中人类或其他动物的动作与活动。
选项D:知识图谱是一种将各种数据以图形形式表示,并揭示数据之间关系的技术,并非直接关联到图像处理。因此,不属于计算机视觉的使用场景。
【答案】 D
3.【单选题】某同学在模型训练中,为了保存训练过程中的网络模型和参数,进行了以下操作:1.通过CheckpointConfig设置每500步保存网络模型及参数,最多保存10个checkpoint文件;2.通过ModelCheckpoint实例化接口,同时定义保存路径和文件前缀;3.开始训练,并加载实例化后的接口。这种可以观察训练过程中网络内部状态和相关信息,并且在特定时期执行特定动作的操作,对应MindSpore以下哪一种能力?
A.回调函数
B.高效数据格式MindRecord
C.优化器
D.评价指标
【解析】
选项A:回调函数是MindSpore中用于在训练过程中执行特定操作(如保存模型、记录日志等)的函数。它允许开发者插入自定义的逻辑到训练循环中,实现对训练过程的精细控制。
选项B:高效数据格式MindRecord是MindSpore提供的一种高效的数据存储格式,用于提升数据处理的效率,特别是在大规模数据集上。它支持多种数据类型,并能有效地处理和存储大量数据。
选项C和选项D:优化器是在训练神经网络的过程中更新权重和偏差,以最小化损失函数的工具。MindSpore提供了多种优化器,如SGD、Adam等,以支持通过不同的评价指标(如准确率、召回率等)量化模型的性能。MindSpore提供了一套丰富的评价指标,帮助开发者评估和监控模型的表现。优化器和评价指标虽各有专长和应用场景,但对于保存网络模型和参数这一特定操作而言,二者都不属于直接相关的能力。
【答案】 A
4.【单选题】MindSpore提供高阶封装Model,可自动构建训练网络,以下哪一个Model的接口用于对输入数据进行推理?
A.train
B.eval
C.predict
D.fit
【解析】
选项A:train接口专门用于训练模型。它在整个训练集上执行模型的训练过程,通过多轮迭代优化模型参数以最小化损失函数。
选项B:eval接口用于在验证集上评估模型的性能。这个过程通常不涉及权重的更新,只是利用已有的模型参数来计算并输出各种评价指标。
选项C:predict接口用于对新输入的数据进行推理,即根据已训练好的模型参数生成预测结果。这一过程不涉及任何形式的参数更新或性能评估,仅关注将输入数据转换为输出预测。
选项D:fit接口将训练和评估过程结合在一起,使用户可以在同一个接口调用过程中完成模型的训练以及在测试集上的评估。
【答案】 C
5.【单选题】以下哪种算法相比其他3种差异最大?
A.KNN
B.SVM
C.逻辑回归
D.k-means
【解析】
选项A:KNN(k-Nearest Neighbor,k近邻)是一种基于实例的或局部逼近的监督学习算法。它通过查找训练集中最接近未知样本的 k 个实例来确定该未知样本的类别。
选项B:SVM(Support Vector Machine,支持向量机)是一种监督学习算法,主要用于解决分类问题,但它也可以用于解决回归问题。SVM试图找到数据点之间的最大可能间隔,这个间隔称为最大边距超平面。
选项C:逻辑回归是一种统计算法,尽管其名称中包含“回归”,但它实际上是一个分类技术,用于预测输出的离散值而不是连续值。
选项D:k-means是一种聚类算法,其基本思想是将样本分为 k 个类别,每个样本属于与其距离最近的类别。k-means的核心步骤是不断迭代更新类别的中心点,直到最终收敛。k-means的无监督特性,是它与其他3种监督学习算法(KNN、SVM 和逻辑回归)最根本的不同,此外k-means是一种聚类算法,KNN、SVM 和逻辑回归是分类算法。
【答案】 D
6.【单选题】关于均值滤波的说法,以下错误的是哪一个选项?
A.均值滤波指模板权重都为1的滤波器
B.均值滤波将像素的邻域最大值作为输出结果
C.均值滤波可以实现图像平滑的效果,可以去除噪声
D.均值滤波经常用于图像模糊化
【解析】
选项A:在均值滤波中,通常使用一个矩形或正方形的模板(也称为卷积核或滤波器),首先将其所有权重均设置为相同的值(通常是1),然后将该模板应用于图像上的每一个像素及其邻域,以计算新的像素值。
选项B:这一说法是错误的。均值滤波计算的是邻域内像素值的算术平均值,而不是最大值。计算最大值的操作通常与另一种类型的滤波器,即最大值滤波器相关,它可以计算局部区域内的最大值,通常用于图像增强而非图像平滑。
选项C:均值滤波可以实现图像平滑的效果,可以去除噪声。由于均值滤波通过取算数平均值来合并邻域内的像素值,因此它可以有效地减少图像中的随机噪声和尖锐的细节变化,从而实现图像平滑的效果。
选项D:均值滤波是实现图像模糊效果的一种常用方法。通过减少图像中的高频信息(如边缘和纹理),均值滤波可以帮助生成柔和且细节更少的图像版本,这在艺术效果创建或背景模糊等应用中非常有用。
【答案】B
7.【单选题】以下哪一项是反向传播算法的理论基础?
A.链式法则
B.计算图
C.代价函数
D.线性代数
【解析】
在神经网络的训练中,反向传播算法是一种核心技术。它基于链式法则,通过计算损失函数对每个权重的偏导数来实现权重的更新,进而优化网络的性能。
选项A:链式法则是微积分中的一个基本工具,它允许人们计算复合函数的导数。在神经网络中,由于各层之间的输出相互依赖,形成了一个复杂的“复合”关系,因此链式法则成为计算这种复合关系对应的复合函数的导数的有效手段。
选项B:计算图是一个描述数学运算的图形,它表示变量之间的操作和依赖关系,可以帮助人们可视化和组织网络中的运算过程。
选项C:代价函数(也称为损失函数)是衡量神经网络输出结果与真实目标之间差异的指标。它是优化的对象,即训练神经网络的目的是最小化代价函数。
选项D:线性代数是数学的一个分支,主要研究向量空间、线性映射以及它们的性质。在神经网络中,线性代数提供了处理大规模数据和复杂变换所需的数学工具。
【答案】 A
8.【单选题】对HSV空间的S分量进行处理可以实现图像饱和度的增强,饱和度的调整通常是在S原始值上乘一个修正系数。以下说法正确的是哪一个选项?
A.修正系数小于1,会增强饱和度,使图像的色彩更鲜明
B.修正系数大于1,会降低饱和度,使图像看起来比较平淡
C.修正系数小于1,会降低饱和度,使图像看起来比较平淡
D.修正系数的取值对于图像的饱和度没有影响
【解析】
选项A:当修正系数小于1时,S分量的值会减小,导致图像的饱和度降低。饱和度的降低会使图像中的色彩变得相对暗淡和接近灰色,色彩之间的对比变得模糊。这种效果适用于需要营造复古、怀旧或者柔和的视觉效果的场景。
选项B:当修正系数大于1时,S分量的值会增加,这意味着图像的饱和度将得到增强。饱和度的增强使得图像中的色彩变得更加鲜艳和丰富,色彩之间的对比也会更加明显。这种效果适用于需要强调图像中的色彩或者让图像看起来更加生动和吸引人的场景。
选项C:当修正系数小于1时,S分量的值会减小,导致图像的饱和度降低,进而使得图像看起来比较平淡。
选项D:修正系数的取值会直接影响图像的饱和度,不同的取值会产生不同的视觉效果。
【答案】 C
9.【单选题】当深度学习神经网络层数过深时,网络的性能反而会下降,这是由于什么问题造成的?
A.梯度消失
B.梯度爆炸
C.梯度剪枝
D.神经元死亡
【解析】
选项A:梯度消失导致网络较浅层的权重更新非常缓慢或几乎不更新,进而导致网络较浅层的学习缓慢,难以有效捕捉输入数据的特征,从而使整个网络的性能下降。
选项B:梯度爆炸主要表现为梯度过大,导致权重更新不稳定,与题目描述的网络性能下降不符。
选项C:梯度剪枝是一种防止梯度爆炸的技术,该技术通过限制梯度的大小来保证训练稳定性,并不直接导致网络性能下降。
选项D:神经元死亡会导致神经网络不再更新权重,这会造成梯度消失或梯度爆炸,而不是只有网络性能的下降。
【答案】 A
10.【单选题】以下哪个损失函数用于分类问题?
A.二次代价损失函数
B.均方误差损失函数
C.绝对值误差损失函数
D.交叉熵损失函数
【解析】
选项A:二次代价损失函数主要用于回归问题,通过最小化预测值与真实值的差的平方来优化模型。然而,在分类问题中,由于其对大误差的惩罚过重和对小误差的关注不足,通常不作为首选。
选项B:均方误差损失函数常用于回归问题,但理论上也可以用于概率预测的分类问题。它衡量的是预测概率与真实标签之间的欧氏距离。然而,其对误差的平方处理,使得模型在面对异常值时过于敏感。
选项C:绝对值误差损失函数同样更多地应用于回归问题,它通过计算预测值与真实值的差的绝对值来优化模型。在分类问题中,由于其不支持概率输出,因此应用范围较为有限。
选项D:交叉熵损失函数是分类问题中应用最广泛的损失函数之一。它基于模型预测概率与真实标签之间的差异进行优化,特别适合输出为概率的情况。交叉熵损失函数能够很好地衡量两个概率分布之间的差异,从而有效地指导模型学习到正确的分类边界。
【答案】 D
11.【多选题】ModelArts是面向开发者的一站式AI开发平台,以下关于ModelArts的描述中,正确的是哪些选项?
A.支持数据筛选、标注等数据处理,提供数据集版本管理,特别是深度学习的大数据集版本管理
B.自研的MoXing深度学习框架,更高效、更易用,大大提升训练速度
C.支持模型部署到多种生产环境,可部署为云端在线推理和批量推理,也可以直接部署到端和边
D.支持多种自动学习能力,通过“自动学习”训练模型,用户无须编写代码即可完成自动建模、一键部署
【解析】
题目中的这4个选项描述的都是ModelArts的特色功能。
选项A:数据治理支持数据筛选、标注等数据处理,提供数据集版本管理,特别是深度学习的大数据集版本管理,以便让训练结果可重现。
选项B:极“快”致“简”模型训练自研的MoXing深度学习框架,更高效、更易用,大大提升训练速度。
选项C:多场景部署支持模型部署到多种生产环境,可部署为云端在线推理和批量推理,也可以直接部署到端和边。
选项D:ModelArts支持多种自动学习能力,通过“自动学习”训练模型,用户无须编写代码即可完成自动建模、一键部署。AI Gallery预置常用算法和常用数据集,支持模型在企业内部共享或者公开共享。
【答案】 ABCD
12.【多选题】以下哪些选项是自然语言处理的应用?
A.机器翻译
B.自动文摘
C.舆情分析
D.风格迁移
【解析】
自然语言处理的应用包括机器翻译、自动文摘、舆情分析和情感分析等。
选项A:机器翻译是利用自然语言处理技术将一种自然语言自动转换成另一种自然语言的过程。这是自然语言处理领域中最为常见的应用之一,其应用实例包括谷歌翻译等在线翻译服务。
选项B:自动文摘指的是利用自然语言处理技术从一篇文章中自动提取关键信息,生成简洁的摘要。自动文摘在信息检索、新闻摘要以及内容推荐系统中被广泛地应用。
选项C:舆情分析是指通过关键词提取、文本聚类、主题挖掘等算法模型,挖掘突发事件、舆论导向,进行话题发现、趋势发现等。舆情分析需要多维度分析情绪、热点、趋势、传播途径等,使相关人员及时、全面地掌握舆情动态。
选项D:风格迁移不是自然语言处理的一个直接应用,但它可以借助自然语言处理中的文本生成等技术来实现。风格迁移更关注的是在保留原文内容的前提下改变其表达方式,使其符合特定的写作风格或者格式要求。
【答案】 ABC
13.【多选题】以下哪些选项为MindSpore中用于从checkpoint文件中加载模型权重的接口?
A.save_checkpoint
B.load_checkpoint
C.load_param_into_net
D.load
【解析】
选项A:save_checkpoint主要负责保存模型状态而不是加载模型权重。
选项B:load_checkpoint是MindSpore提供的一个专用API,用于从checkpoint文件中恢复模型的状态。这个接口能够加载模型的结构、权重以及优化器状态等信息。
选项C:load_param_into_net专门用于将checkpoint文件中的参数加载到现有的网络中。
选项D:load通常用于加载整个模型的配置和结构,而非加载模型权重。
【答案】 BC
14.【多选题】以下关于MindSpore特性的描述,正确的是哪些选项?
A.动静统一
B.仅适配Ascend硬件
C.分布式并行
D.全场景统一(MindIR)
【解析】
MindSpore的特性有动静统一、分布式并行、图算融合、全场景统一(MindIR)、三方硬件接入(可接入GPU系列芯片,亦可接入各类DSA芯片)等。选项B中仅适配Ascend硬件的描述是错误的。
【答案】 ACD
15.【多选题】华为云AI开发平台ModelArts的部署方式主要有哪些?
A.在线服务
B.批量服务
C.边缘服务
D.定制服务
【解析】
ModelArts当前支持如下几种部署方式:
● 在线服务——将AI应用部署为一个Web Service,并且提供在线的测试UI与监控功能;
● 批量服务——可对批量数据进行推理,完成数据推理后自动停止;
● 边缘服务——通过智能边缘平台,在边缘节点将AI应用部署为一个Web Service。
ModelArts当前还未推出定制服务,故选项D是错误的。
【答案】 ABC
16.【多选题】以下关于模型训练和测试过程中所产生的误差描述正确的有哪些选项?
A.训练误差由方差和偏差组成
B.模型偏差过大时可能会出现欠拟合现象
C.模型方差过大时可能会出现过拟合现象
D.随着模型复杂度的提升,测试误差一定会减小
【解析】
选项A:训练误差是模型在训练集上的误差。训练误差由方差、偏差和噪声这3个因素组成。
选项B:偏差过大意味着模型过于简单,无法捕捉数据中的真实关系,所以模型偏差过大就代表模型的学习效果不好,也就是欠拟合。欠拟合是指训练误差很大的现象。
选项C:方差过大意味着模型对训练数据中的噪声和异常值过于敏感,导致模型在训练集上表现良好而在测试集上表现不好。过拟合是指学得的模型的训练误差很小,而泛化能力较弱,即泛化误差较大的现象。
选项D:模型复杂度的提升会增强模型的拟合能力,但是在一定范围内减小了测试误差。当超出这个范围之后测试误差就会增大。在二维坐标系内,以模型复杂度为 x 轴、以测试误差为 y 轴,得到的图形大致为一个U形。在一定范围内,随着模型复杂度的提升,测量误差将减小;当模型复杂度超过这个范围时,测量误差将随模型复杂度的增加而增加。
【答案】 BC
17.【多选题】CANN(Compute Architecture for Neural Networks)是华为面向深度神经网络和昇腾处理器打造的芯片使能层,它主要包括哪些功能模块?
A.FusionEngine
B.CCE算子库
C.TBE(Tensor Boost Engine)
D.编译器
【解析】
CANN主要包括FusionEngine、CCE算子库、TBE以及编译器等功能模块。
选项A:FusionEngine是一个硬件抽象层,它使得不同硬件设备能够无缝协作,提供统一的计算资源视图。这一层的主要作用是管理和优化跨多个设备的计算任务,以实现更高效的资源利用和更强大的计算性能。
选项B:CCE算子库提供了大量的预定义和优化的算子,这些算子可以直接映射到昇腾处理器上的高效指令。通过使用这些算子,开发者能够轻松实现高性能的神经网络计算,而无须从头开始编写复杂的算法。
选项C:TBE是一个针对张量计算进行优化的引擎,它通过特定的优化技术,如算子融合和内存管理优化,来加速张量操作。TBE能够显著提升深度神经网络在训练和推理时的性能,特别是在处理大规模数据的情况下。
选项D:编译器负责将由高级语言编写的深度神经网络转换为昇腾处理器能够执行的代码。编译器不仅涉及代码的转换,还涉及对特定硬件的优化,确保转换的代码能够在昇腾处理器上高效执行。
【答案】 ABCD
18.【多选题】卷积神经网络的核心思想是什么?
A.权值共享
B.局部感知
C.全局感知
D.权值不变
【解析】
卷积神经网络(Convolution Neural Network,CNN)的核心思想在于利用卷积层的权值共享和局部感知特性自动提取特征,并通过池化层降低特征维度,提高计算效率。
选项A:正确。在卷积神经网络中,卷积核在对输入数据进行卷积操作时,其权值是共享的。这意味着同一个卷积核在不同的位置上进行卷积操作时使用的权值是相同的。权值共享降低了模型的复杂度,同时也降低了过拟合的风险,因为每个特征都被平等地对待,无论它出现在输入数据的哪个位置。
选项B:正确。卷积神经网络的卷积层通过卷积核(或滤波器)在输入数据上进行局部感知,即每个神经元只处理输入数据的一个局部区域。这种方式受到生物学的视觉感知机制,即人脑在处理视觉信息时会采用局部感知的方式的启发。局部感知有助于网络捕捉到数据的局部特征,如图像的边缘、纹理等。
选项C:错误。全局感知通常是指每个神经元都能感知到整个输入数据的特性,这与卷积神经网络的局部感知特性相反。卷积神经网络通过叠加多个卷积层和池化层来逐渐扩大神经元的感受野,但这种对全局信息的处理是建立在多层局部感知的基础上的。
选项D:错误。权值不变意味着在整个训练过程中权值不会发生变化,这显然与卷积神经网络的训练过程相矛盾。在卷积神经网络的训练过程中,权值是通过反向传播算法根据损失函数的梯度进行更新的。
【答案】 AB
19.【判断题】相比于卷积神经网络,循环神经网络更适合处理时序数据、对硬件(如GPU、NPU)的资源利用率更高,但参数量较多、容易过拟合和出现梯度消失问题,但两者都具备权值共享的特点。
【解析】
循环神经网络(Recurrent Neural Network,RNN)对显存带宽的要求更高,对硬件的资源利用率更低,卷积神经网络对硬件的资源利用率更高。
【答案】 错误
20.【判断题】在卷积神经网络中,卷积核要具备以下特点:形状为正方形、长度为奇数且步长大于等于1。
【解析】
卷积核的设计是影响卷积神经网络性能的关键因素之一。正确选择卷积核的形状、长度和步长对于提高模型的准确性和效率至关重要。在实践中,这些参数往往需要根据具体任务和数据集的特点进行调整和优化,并未对卷积核的形状、长度和步长进行强制要求。
【答案】 错误
21.【判断题】当前大模型(Foundation Model)的训练平台主要为GPU、NPU,且主要用于NLP、多模态等任务,华为盘古、ChatGPT、PaLM 2等都属于此类模型。
【解析】
该表述正确。
【答案】 正确
22.【判断题】当用于训练模型的标准不符合用于判断模型效率的标准时,可能会导致模型过拟合。
【解析】
过拟合通常发生在模型过于复杂、训练时间过长以及用于训练模型的标准不恰当的情况下,当用于训练模型的标准不符合用于判断模型效率的标准时,可能会导致模型过拟合。
【答案】 正确
23.【判断题】MindSpore中提供了数据处理的子模块dataset,用于加载数据集或进行数据增强操作。
【解析】
MindSpore的dataset提供了加载和处理各种通用数据集的API,如MNIST、CIFAR-10、CIFAR-100等。此外,用户还可以使用此模块加载自己的数据集或进行数据增强操作。
【答案】 正确
24.【判断题】深度学习框架的出现降低了AI入门的门槛,我们可以调用框架中已有的模型或算法进行模型训练,避免从头开始编写代码、重复造轮子。
【解析】
深度学习框架的出现不仅降低了AI入门的门槛,还极大地提高了模型训练的效率和可行性。通过调用框架中已有的模型或算法,开发者可以避免从头开始编写代码、重复造轮子,从而将更多的精力投入创新和优化工作。
【答案】 正确