



练习题1:Prompt设计策略
问题
在数据分析任务中,设计高效的Prompt是提升ChatGPT生成效果的关键。请根据以下任务需求,设计一个合适的数据分析Prompt。
任务需求
请根据以下电商销售数据(包括日期、产品ID、销售额、地区),分析不同地区的销售趋势,并生成适合的Python代码,要求输出每个地区的月度销售额折线图。
参考答案
Prompt:“我有一个包含电商销售数据的CSV文件,其中包含以下字段:日期、产品ID、销售额和地区。请为我生成一段Python代码,按照每个地区的月度销售额进行汇总,并使用折线图的形式展示每个地区的销售趋势。使用Pandas进行数据处理,使用Matplotlib或Seaborn进行数据可视化。”
解释
在这个Prompt中,明确了数据集的字段和数据格式,并指定了分析目标(即按地区和月度进行汇总),同时指出了使用的工具(Pandas和Matplotlib)。这种结构化的Prompt能够帮助ChatGPT理解用户需求,并生成符合要求的代码。
练习题2:ChatGPT的高级使用技巧——多轮交互策略的应用
问题
在一个多步骤的数据分析任务中,您有一个销售数据集(包括日期、产品ID、销售额和地区),希望分析以下问题。
(1)首先进行数据清洗,去除重复值,并处理缺失值。
(2)计算每个地区的年度总销售额,并按降序排列。
(3)将前3个销售额最高的地区用条形图进行可视化展示。
(4)最后,请生成分析报告,详细描述数据清洗步骤、主要销售趋势及商业建议。
请设计一个分步式Prompt策略,并分四轮交互逐步引导ChatGPT完成该任务。在每一轮的Prompt中请具体说明希望ChatGPT生成的代码或内容。
参考答案
分步式Prompt策略与多轮交互示例如下。
(1)第一轮:数据清洗
Prompt:“我有一个包含以下字段的销售数据集:日期、产品ID、销售额和地区。请生成一段Python代码,使用Pandas库来处理该数据集,去除所有重复值,并将缺失的销售额填充为0。生成的代码要包括数据的读取、清洗和输出前5行等操作。”
生成内容:ChatGPT将生成用于数据清洗的代码,包括读取CSV数据、去除重复值、填充缺失值,并显示处理后的前5行数据。
(2)第二轮:计算年度总销售额并排序
Prompt:“在上一步数据清洗的基础上,请按地区进行分组,计算每个地区的年度总销售额,并按降序排列。生成的代码要能够输出前5个销售额最高的地区。”
生成内容:ChatGPT会基于清洗后的数据集,使用groupby和sum函数计算每个地区的总销售额,并使用sort_values按降序排列。
(3)第三轮:可视化前3个销售额最高的地区
Prompt:“请使用Matplotlib库生成一个条形图,展示前3个销售额最高的地区及其年度总销售额。条形图中要显示每个地区的名称及相应的销售额。生成的代码要包括设置图表标题和轴标签。”
生成内容:ChatGPT会生成用于可视化的代码,包括设置条形图、标题、X轴和Y轴标签,以及数据标注的逻辑。
(4)第四轮:生成分析报告
Prompt:“基于以上生成的代码和结果,请撰写一份完整的分析报告。报告要包含以下内容。
①数据清洗的步骤和策略(如如何处理缺失值和重复值)。
②按地区进行分组和计算销售额的逻辑。
③可视化分析的主要发现(如哪些地区销售额最高)。
④最后,请提供基于数据分析结果的商业策略建议。”
生成内容:ChatGPT会生成一份完整的分析报告,包括数据清洗步骤、主要分析发现和商业建议。