购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.5 思考题

(1)简述BLEU分数的计算原理。BLEU主要通过对生成文本和参考文本的n-gram进行匹配来衡量相似度,结合代码解析sentence_bleu函数在BLEU分数计算中的作用,并说明如何利用smoothing_function对低频词进行平滑处理以提升评估稳定性。

(2)在计算ROUGE分数时,rouge1、rouge2和rougeL分别表示什么含义?使用rouge_scorer.RougeScorer计算这些分数时,如何通过分数的精确率、召回率和F1值来衡量生成文本和参考文本的覆盖度?

(3)困惑度作为模型评估指标的意义是什么?解释困惑度计算的基本过程,并说明如何通过torch.exp和torch.nn.functional.cross_entropy函数计算模型在生成任务中的困惑度。

(4)在模型评估中,如何利用交叉熵损失来计算困惑度?结合代码解析F.cross_entropy在模型训练和困惑度计算中的作用。困惑度的值越低意味着什么?

(5)在困惑度评估过程中,如何利用GPTPerplexityCalculator类来计算输入数据的困惑度?请描述该类在计算困惑度时的主要步骤,并结合代码示例说明如何将困惑度用于文本生成质量的衡量。

(6)学习率对模型训练的影响是什么?在本章的优化策略中,使用了哪种学习率调整方法?解释StepLR调度器的作用及其如何通过step_size和gamma参数逐步调整学习率。

(7)在微调过程中,如何确保学习率不会过高或过低,导致模型难以收敛或收敛速度过慢?解释如何使用学习率调度器逐步调整学习率,并结合代码示例说明如何将其应用到模型优化中。

(8)解释optimizer.zero_grad和optimizer.step在模型微调过程中的作用,如何通过清除梯度缓存和更新参数来确保模型在每一轮训练中的有效优化?

(9)在GPT模型微调过程中,如何设置合理的训练轮次?结合代码解析如何通过每轮输出困惑度来评估模型在训练中的收敛情况,轮次的增减会如何影响困惑度表现。

(10)如何在长文本生成任务中使用困惑度评估生成效果?请描述困惑度在长文本生成中可能出现的波动现象,并结合代码解析如何逐步评估长文本的困惑度。

(11)在构建简单的GPT模型时,如何利用nn.Embedding和nn.Linear构建词嵌入层和输出层?解释这些层在模型生成任务中的作用,并结合代码说明它们如何用于生成预测词分布。

(12)在模型训练和评估的过程中,如何通过合理设置优化器(如Adam)提高模型收敛效果?结合代码描述torch.optim.Adam的基本用法,并解释在训练过程中动态学习率调整对模型性能的优化效果。 HDJLKWmf/OSYbQARtX0EFVyc1j2FeH8T/BASfIgMubF+Ufo8Cd14UfWn8vGXvOgA

点击中间区域
呼出菜单
上一章
目录
下一章
×