ChatGPT玩转数据分析：从基础入门到项目实践最新章节_李朝成著

2.2　构建高质量Prompt的策略

构建高质量Prompt需要遵循一系列策略，以确保模型理解任务需求并生成高质量的输出。以下策略基于OpenAI官方建议的最佳实践，并结合数据分析的实际应用场景整理而成。

1．使用清晰和具体的语言

高质量的Prompt应使用清晰、简洁且具体的语言，避免模糊不清或过于广泛的指令。详细说明任务的各个方面，包括希望使用的工具、输入数据的类型、输出格式等。

示例如下。

模糊的Prompt：“请分析我的数据。”

清晰的Prompt：“请使用Python生成代码，读取一个包含日期、销售额和地区的CSV文件，去除所有缺失值，并生成按月汇总的销售额趋势图。”

2．尽量缩小任务范围

如果任务过于宽泛，ChatGPT可能会生成过于一般化或不符合预期的结果。通过缩小任务范围，Prompt可以更加精确地引导模型生成符合需求的内容。用户可以将任务通过拆分成多个子任务来完成。

示例如下。

宽泛的Prompt：“请生成Python代码处理销售数据。”

缩小任务范围的Prompt：“请生成Python代码，使用Pandas库读取CSV文件，去除重复值和缺失值，然后生成数据汇总表。”

3．提供足够的背景和上下文

让模型了解必要的背景信息或输入数据，能够帮助其更好地理解用户需求。例如，提供数据字段信息或业务场景描述可以提升生成内容的准确性。

示例如下。

没有背景信息的Prompt：“请生成销售数据分析代码。”

有背景信息的Prompt：“我有一个CSV文件，其中包含日期、产品ID、销售额和地区，请生成代码来分析各地区的销售趋势。”

4．指定输出格式

在Prompt中明确希望的输出格式，这可以包括代码、文本报告、表格等。通过指定输出格式，用户可以得到更符合需求的结果。

示例如下。

没有指定格式的Prompt：“请生成销售数据分析。”

指定格式的Prompt：“请生成一个Python代码，输出一个按月汇总销售额的折线图，并给图表添加标题和X轴、Y轴标签。”

5．提供例子

在某些任务中，提供一个期望输出的示例能够让模型更好地理解需求，并生成与示例风格一致的内容。

示例如下。

无示例Prompt：“请生成一份数据分析报告。”

有示例Prompt：“请生成一份数据分析报告，格式类似于以下内容：①数据清洗步骤；②数据描述性统计；③数据分析结论。”

6．考虑使用分步指令

对于复杂的任务，建议将其拆分为多个子任务，逐步引导模型生成结果。这样可以避免一次性输入过多信息导致模型无法理解或偏离目标。

示例如下。

一次性输入的Prompt：“请为我生成一个机器学习模型，用于预测销售额，并生成数据清洗、特征工程和模型训练的代码。”

分步输入的Prompt：

“请首先生成一个数据清洗的代码，包括处理缺失值和数据标准化。”

“现在请生成特征工程代码，提取日期和地区相关的特征。”

“最后请生成模型训练代码，并输出模型的准确率。”

7．使用上下文与多轮交互

通过上下文记忆功能，ChatGPT可以记住前几轮对话中的内容，并根据这些信息生成后续内容。因此，用户可以通过多轮交互逐步引导模型优化结果。

示例如下。

初始Prompt：“请生成一段用于数据清洗的Python代码，处理缺失值和重复值。”

第二轮交互：“在代码中加入日期字段的格式化步骤，并生成月度销售额汇总表。”

第三轮交互：“请将汇总表中的数据绘制为折线图，并为图表添加标题。”

通过多轮交互，用户可以逐步调整任务，优化生成的代码或分析内容。

8．尝试不同的Prompt风格

不同的Prompt风格可能会导致不同的生成效果。如果一种Prompt风格没有达到预期效果，尝试重新设计Prompt，调整其长度、细节或指令方式，可能会获得更好的结果。

示例如下。

原Prompt：“请分析销售数据。”

修改后的Prompt：“请生成Python代码，读取日期、销售额、地区字段的CSV文件，并生成按地区分组的销售额趋势图。”

9．多次迭代以优化Prompt

为了获得最理想的生成结果，通常需要经过多次迭代。用户可以在每次生成后通过反馈和调整Prompt的细节来不断优化生成的内容。

2.2 构建高质量Prompt的策略

1．使用清晰和具体的语言

2．尽量缩小任务范围

3．提供足够的背景和上下文

4．指定输出格式

5．提供例子

6．考虑使用分步指令

7．使用上下文与多轮交互

8．尝试不同的Prompt风格

9．多次迭代以优化Prompt

2.2　构建高质量Prompt的策略