GraphPad Prism图表可视化与统计数据分析（视频教学版）最新章节_雍杨著

1.4　“欢迎使用GraphPad Prism”对话框

启动GraphPad Prism后，用户界面会弹出“欢迎使用GraphPad Prism”对话框，如图1-8所示。Prism提供了8种数据表，通过该对话框可创建包含指定格式的数据表和图表的项目文件。

图1-8　“欢迎使用GraphPad Prism”对话框

1.4.1　XY表

XY表是一种每个点均由X和Y值定义的图表，此类数据通常适用于线性或非线性回归分析。

在“创建”选项组下默认选择XY选项，右侧的“XY表”选项会显示该类型下的数据表和图表的预览图。

在“数据表”下显示了两种创建数据表的方法。

1．输入或导入数据到新表

选择该选项，激活“选项”选项组，如图1-9所示，选择XY表中X和Y值的定义方法，该选项中定义的数据表为空白数据表。

图1-9　选择X和Y值的定义方法

1）X

在该选项下定义XY表中X值的定义方法（定义XY表时，必须选择X、Y的定义方法，默认Y值的定义方法选择为“为每个点输入一个Y值并绘图”）。

各选项说明如下。

（1）数值：选择该选项，直接创建包含X列、Y列的数据表，如图1-10所示。数据表中包含一个X列、多个Y列，Y列按照第A组、第B组进行定义，到结果Z，结果AA结束。X列、Y列下不包含任何子列。

图1-10　创建数值数据表

（2）要绘制水平误差条的包含误差值的数值：选择该选项，创建包含X列、Y列的数据表。其中，X列中包含X子列和“误差条”子列，如图1-11所示。

图1-11　创建误差值数据表

（3）日期：选择该选项，创建包含X列、Y列的数据表，如图1-12所示。其中，X列必须从当前日期计算日期数据。

图1-12　创建日期数据表

（4）经过的时间：选择该选项，创建包含X列、Y列的数据表，如图1-13所示。其中，X列为经过的日期数据。

图1-13　创建经过的日期数据表

2）Y

在该选项下定义XY表中Y值的定义方法（定义XY表时，默认X值的定义方法选择为“数值”）。

（1）为每个点输入一个Y值并绘图：选择该选项，直接创建包含X列、Y列的数据表。

（2）输入3个重复值在并排的子列中：选择该选项，直接创建包含X列、Y列的数据表。其中，Y列中包含3个子列（A:Y1、A:Y2、A:Y3），如图1-14所示。Y列下包含子列的个数可进行自定义设置。

图1-14　创建Y子列数据表

（3）输入并绘制已经在其他位置计算得出的误差值：选择该选项，直接创建包含X列、Y列的数据表。Y列中包含3个子列（平均值、标准差、N），如图1-15所示。在图1-9中的“输入”下拉列表中选择Y子列中显示的误差值类型：

●　平均值，标准差，N。

●　平均值，标准误，N。

●　平均值，%变异系数，N。

●　平均值与标准差。

●　平均值与标准误。

●　平均值与%变异系数。

●　平均值（或中位数），+/-误差。

●　平均值（或中位数），上限／下限。

图1-15　创建误差值Y子列数据表

2．从示例数据开始，根据教程进行操作

在该选项下，通过“选择教程数据集”选项组中的数据集模板定义XY表，如图1-16所示。选择Enzyme kinetics -Michaelis-Menten选项，单击“创建”按钮，创建遵循米氏（Michaelis-Menten）动力学模型的酶动力学XY数据表，如图1-17所示。

图1-16　“选择教程数据集”选项组

图1-17　酶动力学XY数据表

1.4.2　列数据表

在列数据表中，每列均定义一个数据组，这些组表示一个分组变量中的分类组。

在“创建”选项组下，默认选择“列”选项，在右侧选项中显示该类型下的数据表和图表的预览图，如图1-18所示。

图1-18　选择“列”选项

在“数据表”中有以下两种创建列数据表的方法。

1．将数据输入或导入到新表

通过“选项”选项组中的选项定义数据表。下面介绍“选项”选项组中的选项。

1）输入重复值，并堆叠到列中

选择该选项，创建多个数据组列（第A组，第B组，……，第Z组，第AA组），每列表示一个类别，如图1-19所示。

图1-19　创建多个数据组列

2）输入成对的或重复的测量数据-每个主题位于单独的一行

选择该选项，创建多个数据列（第A组、第B组），在最左侧添加“表格式：列”单元格，用于定义分组数据，如图1-20所示。例如重复数据的次数。

图1-20　创建重复的数据组列

3）输入并绘制已经在其他位置计算得出的误差值

选择该选项，直接创建包含子列（平均值、标准差、N）的数据组，如图1-21所示。通过“输入”下拉列表定义子列显示的数据类型。

图1-21　创建误差值数据组列

2．从示例数据开始，根据教程进行操作

在该选项下，通过“选择教程数据集”选项组中的数据集模板定义列数据表，如图1-22所示。选择ROC curve选项，单击“创建”按钮，创建ROC曲线列数据表，如图1-23所示，显示医院中的医学记录数据：Controls（正常标准值）和Patients（病人实际的检测值）。

图1-22　“选择教程数据集”选项组

图1-23　列数据表

1.4.3　分组数据表

分组数据表类似于列数据表，但设计用于两个分组变量。

在“创建”选项组下选择“分组”选项，在右侧选项中显示该类型下的数据表和图表的预览图，如图1-24所示。

图1-24　选择“分组”选项

在“数据表”中有以下两种创建分组数据表的方法。

1．将数据输入或导入到新表

通过“选项”选项组中的选项定义数据表。下面介绍“选项”选项组中的选项。

1）为每个点输入一个Y值并绘图

选择该选项，创建多个数据组列（第A组，第B组，……，第Z组，第AA组），每列表示一个类别，如图1-25所示。

图1-25　创建多个数据组列

2）输入2个重复值在并排的子列中

选择该选项，在数据列下创建两组子列（例如第A组下为A:1和A:2），用于定义分组数据，如图1-26所示。

图1-26　创建重复的子列

3）输入并绘制已经在其他位置计算得出的误差值

选择该选项，直接创建包含子列（平均值、标准差、N）的数据组，如图1-27所示。通过“输入”下拉列表定义子列显示的数据类型。

图1-27　创建误差值数据组列

2．从示例数据开始，根据教程进行操作

在该选项下，通过“选择教程数据集”选项组中的数据集模板定义分组数据表，如图1-28所示。选择Ordinary - two data sets选项，单击“创建”按钮，创建两组变量的数据表，如图1-29所示。一个分组变量的组（或级别）由行定义（Serum starved（血清缺乏）和Normal culture（正常培养））；另一个分组变量的组（级别）由列定义（Wild-type cells（野生型细胞）和GPP5 cell line（GPP5细胞系））。

图1-28　“选择教程数据集”选项组

图1-29　分组数据表

1.4.4　列联表

列联表类似于分组数据表，专为由两个分组变量描述的数据设计。它用于将属于由行和列定义的每个组的受试者（或观察结果）的实际数量以表格形式展示。

在“创建”选项组下，选择“列联”选项，在右侧的“列联表：每行定义一项治疗或暴露，每列定义一个结果，每个值指示对象或事件的精确计数”选项中显示该类型下的数据表和图表的预览图，如图1-30所示。

图1-30　选择“列联”选项

在“数据表”中有以下两种创建列联数据表的方法。

1．将数据输入或导入到新表

选择该选项，直接从空数据表开始定义，列数据从结果A开始定义，接着是结果B，……，结果Z，结果AA，如图1-31所示。

图1-31　创建空数据表

2．从示例数据开始，根据教程进行操作

在该选项下，通过“选择教程数据集”选项组中的数据集模板定义列联表，选择Chi-square test of prospective data (aspirin and MI)选项，单击“创建”按钮，创建两组变量的数据表，如图1-32所示。创建的数据表中提供两行两列数据，总共有4组：

●　Placebo（安慰剂）和Myocardial Infarction（心肌梗死）。

●　Aspirin（阿司匹林）和Myocardial Infarction（心肌梗死）。

●　Placebo（安慰剂）和No MI（没有心肌梗死）。

●　Aspirin（阿司匹林）和No MI（没有心肌梗死）。

图1-32　列联表

1.4.5　生存表

生存表用于使用Kaplan-Meier方法（简称KM法，也叫乘积极限法）进行生存分析。每行代表不同的受试者或个体。X列用于输入经过的生存时间，Y列用于输入单个分组变量的不同组的结局（事件或删失）。

在“创建”选项组下选择“生存”选项，在右侧的“生存表：每行列出对象的生存时间或删失时间”选项中显示该类型下的数据表和图表的预览图，如图1-33所示。

图1-33　选择“生存”选项

在“数据表”中有以下两种创建生存数据表的方法。

1．输入或导入数据到新表

通过“选项”选项组中的选项定义数据表。下面介绍“选项”选项组中的选项。

（1）以天数（或月数）为单位输入经过的时间：选择该选项，创建多个数据组列（第A组，第B组，……，第Z组，第AA组），每列表示一个类别，如图1-34所示。

（2）输入开始日期和结束日期：选择该选项，创建一个X列和多个Y数据组列，X列下包含两个子列（开始日期和结束日期），Y列从第A组开始定义，到第Z组，再到第AA组，如图1-35所示。

图1-34　创建多个天数数据组列

图1-35　创建包含子列的数据组列

2．从示例数据开始，根据教程进行操作

（1）在该选项下通过“选择教程数据集”选项组中的数据集模板定义生存表，如图1-36所示。

（2）选择Comparing two groups选项，单击“创建”按钮，创建不同的Days elapsed（生存天数）下Control（控制）和Treated（治疗）两组比较的数据表，如图1-37所示。

图1-36　“选择教程数据集”选项组

图1-37　生存表

1.4.6　整体分解表

在实际生活中，经常遇到一个问题：每个数值占总数的比例为多少？为了解决这个问题，引入了整体分解表，这种表格经常用于制作饼形图来分析比例问题。

在“创建”选项组下选择“整体分解”选项，在右侧的“整体分解表：每行定义一个互斥的类别”选项中显示该类型下的数据表和图表的预览图，如图1-38所示。

在“数据表”中有以下两种创建整体分解数据表的方法。

图1-38　选择“整体分解”选项

1．输入或导入数据到新表

选择该选项，直接从空数据表开始定义，列数据从A开始定义，依次到B~Z，最终到AA，如图1-39所示。

图1-39　创建空数据表

2．从示例数据开始，根据教程进行操作

（1）在该选项下，通过“选择教程数据集”选项组中的数据集模板定义列联表，如图1-40所示。

（2）选择Distribution of student grades (compute fractions of total)选项，单击“创建”按钮，创建学生成绩分布的数据表，如图1-41所示。其中，学生成绩分为A、B、C、D、E五个等级，并且分别显示不同等级下的学生人数。

图1-40　“选择教程数据集”选项组

图1-41　整体分解表

1.4.7　多变量表

多变量数据表的排列方式与大多数统计程序组织数据的格式一致。每一行代表一个不同的观察结果或“病例”（实验、动物等），每一列则代表一个不同的变量。

在“创建”选项组下选择“多变量”选项，相应地，在右侧窗体的“多个变量表：每列代表一个不同的变量。每行代表一个不同的个体或实验单位。”区域中显示该类型下的数据表和图表的预览图，如图1-42所示。

图1-42　选择“多变量”选项

在上图右侧窗体的“数据表”区域中有以下两种创建多变量数据表的方法。

1．输入或导入数据到新表

选择该选项，直接从空数据表开始定义，列数据从变量A开始定义，依次从变量B到变量Z，最终到变量AA，如图1-43所示。

2．从示例数据开始，根据教程进行操作

（1）在该选项下，通过“选择教程数据集”选项组中的数据集模板定义列联表，如图1-44所示。

图1-43　创建空数据表

图1-44　“选择教程数据集”选项组

（2）选择Multiple linear regression (text variables)选项，单击“创建”按钮，创建多元线性回归的数据表，如图1-45所示。创建的数据表中包含糖尿病临床试验数据，其中，每行代表一名被研究者，列数据包含变量A~变量J的数据，这是被研究者的身体检测数据。

（3）变量表中的变量可识别连续变量、分类变量或标号变量，而分类变量和标号变量的值可作为文本输入。图1-45中的变量F表示Sex（性别），数据包括Female（女性）和Male（男性），Prism无须对分类数据进行编码，不再需要输入0和1，可以直接对这些分类变量进行编码。

图1-45　多变量表

1.4.8　嵌套表

嵌套表是某些行的集合，在主表中表现为一列。对于主表中的每条记录，嵌套表可以包含多行数据。当存在两级嵌套或层次关系时，使用嵌套表。

在本例中，比较两种教学方法。两种教学方法分别在3个独立教室中使用，每间教室中有3~6名学生。数据表中的值代表每间教室中个别学生的测量分数。每间教室仅使用一种教学方法，因此认为房间变量“嵌套”在教学方法变量中。

在“创建”选项组下选择“嵌套”选项，在右侧的“嵌套数据表：当每项治疗均在实验重复项中进行检验，并且每个实验重复项进行了多次评估（技术重复）时，分层或嵌套就是一种数据设计”选项中显示该类型下的数据表和图表的预览图，如图1-46所示。

图1-46　选择“嵌套”选项

在“数据表”中有以下两种创建嵌套表的方法。

1．输入或导入数据到新表

选择该选项，直接从空数据表开始定义，列数据从A开始定义，到B，…，Z，最终到AA，如图1-47所示。

图1-47　创建空数据表

2．从示例数据开始，根据教程进行操作

（1）在该选项下，通过“选择教程数据集”选项组中的数据集模板定义嵌套表，如图1-48所示。

（2）选择Nested one-way ANOVA选项，单击“创建”按钮，创建嵌套单因素方差分析的数据表，如图1-49所示。

图1-48　“选择教程数据集”选项组

图1-49　嵌套表

1.4 “欢迎使用GraphPad Prism”对话框

1.4.1 XY表

1．输入或导入数据到新表

1）X

2）Y

2．从示例数据开始，根据教程进行操作

1.4.2 列数据表

1．将数据输入或导入到新表

1）输入重复值，并堆叠到列中

2）输入成对的或重复的测量数据-每个主题位于单独的一行

3）输入并绘制已经在其他位置计算得出的误差值

2．从示例数据开始，根据教程进行操作

1.4.3 分组数据表

1．将数据输入或导入到新表

1）为每个点输入一个Y值并绘图

2）输入2个重复值在并排的子列中

3）输入并绘制已经在其他位置计算得出的误差值

2．从示例数据开始，根据教程进行操作

1.4.4 列联表

1．将数据输入或导入到新表

2．从示例数据开始，根据教程进行操作

1.4.5 生存表

1．输入或导入数据到新表

2．从示例数据开始，根据教程进行操作

1.4.6 整体分解表

1．输入或导入数据到新表

2．从示例数据开始，根据教程进行操作

1.4.7 多变量表

1．输入或导入数据到新表

2．从示例数据开始，根据教程进行操作

1.4.8 嵌套表

1．输入或导入数据到新表

2．从示例数据开始，根据教程进行操作

1.4　“欢迎使用GraphPad Prism”对话框

1.4.1　XY表

1.4.2　列数据表

1.4.3　分组数据表

1.4.4　列联表

1.4.5　生存表

1.4.6　整体分解表

1.4.7　多变量表

1.4.8　嵌套表