ChatGPT最重要的应用场景之一是作为各个专业领域的AI助手。然而,在专业领域中,对于提示内容的要求更为严格和具体。本节将通过列举统计分析和Python编程这两个专业领域的例子,来说明在专业领域中提示内容的重要性。在这些领域中,准确和清晰的提示内容可以帮助ChatGPT更好地理解问题,并给出更具专业性和可靠性的回答。
通过Markdown标记语言编写了一份表格数据,然后要求ChatGPT计算出这份数据的统计学描述,提示内容如下。
提示的内容如下(使用GPT-4模型)。
请对以下的Markdown表格数据进行统计学描述,计算体重和血压的相关性。
在提示内容中只给出要分析的数据,没有明确地说明希望计算哪些统计量。以下是ChatGPT回复的部分内容,只展示了血压和体重的平均值和标准差,但计算结果有误。
ChatGPT的回答如下。
首先,我们将提供这7位体检者的血压和体重的基本统计信息。
血压(mmHg):
平均值:89.57
标准差:19.83
体重(KG):
平均值:65.57
标准差:6.69
……
为了尝试修正回答的错误,重新提交提示内容。其中用方括号引用的内容就是为了修改错误而添加的提示内容。
提示的内容如下(使用GPT-4模型)。
请对以下的Markdown表格数据统计平均数和标准差,[请一步一步计算,平均数和标准差的正确性很重要]。
基于新提示的内容,ChatGPT的回答如下。首先它按要求进行了分步计算,正确地计算了平均值,但是标准差还是计算有误。为了能得到全部正确的计算,可以让ChatGPT按详细的步骤计算,或是让其编写Python代码,然后自己执行Python代码。
ChatGPT的回答如下。
首先,我们计算血压和体重的平均值。
血压(mmHg):
(79 + 100 + 120 + 80 + 60 + 89 + 99) / 7 = 627 / 7 = 89.57
体重(KG):
(60.5 + 70.3 + 72.2 + 55.4 + 58.5 + 66.8 + 74.3) / 7 = 458 / 7 = 65.43
现在我们已经得到了平均值,接下来计算标准差。首先,计算每个数据与平均值的差值的平方,然后求和,最后除以数据量减1,得到方差。然后对方差开平方得到标准差。
血压(mmHg)方差:
[((79-89.57)^2 + (100-89.57)^2 + (120-89.57)^2 + (80-89.57)^2 + (60-89.57)^2 + (89-89.57)^2 + (99-89.57)^2) / 6] = 2457.14 / 6 = 409.52
血压(mmHg)标准差:
sqrt(409.52) = 20.24
……
通过2.4.1节例子发现ChatGPT并不擅长数据计算,可以让ChatGPT编写Python代码进行数据统计。
提示的内容如下(使用GPT-4模型)。
指令:使用Python Pandas包的describe函数统计Markdown表格数据
数据:
ChatGPT输出的Python代码如下,首先将Markdown表格数据转换为字典列表,然后将字典列表转换为Pandas DataFrame类型,最后使用Pandas包的describe函数统计数据。
ChatGPT的回答如下。
要使用Python Pandas包的describe函数统计Markdown表格数据,首先需要将Markdown表格数据转换为Pandas DataFrame。以下是一个示例。
执行上述的Python代码的结果如下,统计了数据集的行数、平均数、标准差、最大值/最小值、四分位数。这样就解决了ChatGPT不善于数据计算的问题。