购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.5 互动练习题

练习题1:Prompt设计策略

问题

在数据分析任务中,设计高效的Prompt是提升ChatGPT生成效果的关键。请根据以下任务需求,设计一个合适的数据分析Prompt。

任务需求

请根据以下电商销售数据(包括日期、产品ID、销售额、地区),分析不同地区的销售趋势,并生成适合的Python代码,要求输出每个地区的月度销售额折线图。

参考答案

Prompt:“我有一个包含电商销售数据的CSV文件,其中包含以下字段:日期、产品ID、销售额和地区。请为我生成一段Python代码,按照每个地区的月度销售额进行汇总,并使用折线图的形式展示每个地区的销售趋势。使用Pandas进行数据处理,使用Matplotlib或Seaborn进行数据可视化。”

解释

在这个Prompt中,明确了数据集的字段和数据格式,并指定了分析目标(即按地区和月度进行汇总),同时指出了使用的工具(Pandas和Matplotlib)。这种结构化的Prompt能够帮助ChatGPT理解用户需求,并生成符合要求的代码。

练习题2:ChatGPT的高级使用技巧——多轮交互策略的应用

问题

在一个多步骤的数据分析任务中,您有一个销售数据集(包括日期、产品ID、销售额和地区),希望分析以下问题。

(1)首先进行数据清洗,去除重复值,并处理缺失值。

(2)计算每个地区的年度总销售额,并按降序排列。

(3)将前3个销售额最高的地区用条形图进行可视化展示。

(4)最后,请生成分析报告,详细描述数据清洗步骤、主要销售趋势及商业建议。

请设计一个分步式Prompt策略,并分四轮交互逐步引导ChatGPT完成该任务。在每一轮的Prompt中请具体说明希望ChatGPT生成的代码或内容。

参考答案

分步式Prompt策略与多轮交互示例如下。

(1)第一轮:数据清洗

Prompt:“我有一个包含以下字段的销售数据集:日期、产品ID、销售额和地区。请生成一段Python代码,使用Pandas库来处理该数据集,去除所有重复值,并将缺失的销售额填充为0。生成的代码要包括数据的读取、清洗和输出前5行等操作。”

生成内容:ChatGPT将生成用于数据清洗的代码,包括读取CSV数据、去除重复值、填充缺失值,并显示处理后的前5行数据。

(2)第二轮:计算年度总销售额并排序

Prompt:“在上一步数据清洗的基础上,请按地区进行分组,计算每个地区的年度总销售额,并按降序排列。生成的代码要能够输出前5个销售额最高的地区。”

生成内容:ChatGPT会基于清洗后的数据集,使用groupby和sum函数计算每个地区的总销售额,并使用sort_values按降序排列。

(3)第三轮:可视化前3个销售额最高的地区

Prompt:“请使用Matplotlib库生成一个条形图,展示前3个销售额最高的地区及其年度总销售额。条形图中要显示每个地区的名称及相应的销售额。生成的代码要包括设置图表标题和轴标签。”

生成内容:ChatGPT会生成用于可视化的代码,包括设置条形图、标题、X轴和Y轴标签,以及数据标注的逻辑。

(4)第四轮:生成分析报告

Prompt:“基于以上生成的代码和结果,请撰写一份完整的分析报告。报告要包含以下内容。

①数据清洗的步骤和策略(如如何处理缺失值和重复值)。

②按地区进行分组和计算销售额的逻辑。

③可视化分析的主要发现(如哪些地区销售额最高)。

④最后,请提供基于数据分析结果的商业策略建议。”

生成内容:ChatGPT会生成一份完整的分析报告,包括数据清洗步骤、主要分析发现和商业建议。 OlQKzVPpGxfCX/kAd9w8/Y5zHGsFCL6Pq/k9rf0AcgnWr6i4+286TguEQ7/lBbgt

点击中间区域
呼出菜单
上一章
目录
下一章
×