启动GraphPad Prism后,用户界面会弹出“欢迎使用GraphPad Prism”对话框,如图1-8所示。Prism提供了8种数据表,通过该对话框可创建包含指定格式的数据表和图表的项目文件。
图1-8 “欢迎使用GraphPad Prism”对话框
XY表是一种每个点均由X和Y值定义的图表,此类数据通常适用于线性或非线性回归分析。
在“创建”选项组下默认选择XY选项,右侧的“XY表”选项会显示该类型下的数据表和图表的预览图。
在“数据表”下显示了两种创建数据表的方法。
选择该选项,激活“选项”选项组,如图1-9所示,选择XY表中X和Y值的定义方法,该选项中定义的数据表为空白数据表。
图1-9 选择X和Y值的定义方法
在该选项下定义XY表中X值的定义方法(定义XY表时,必须选择X、Y的定义方法,默认Y值的定义方法选择为“为每个点输入一个Y值并绘图”)。
各选项说明如下。
(1)数值:选择该选项,直接创建包含X列、Y列的数据表,如图1-10所示。数据表中包含一个X列、多个Y列,Y列按照第A组、第B组进行定义,到结果Z,结果AA结束。X列、Y列下不包含任何子列。
图1-10 创建数值数据表
(2)要绘制水平误差条的包含误差值的数值:选择该选项,创建包含X列、Y列的数据表。其中,X列中包含X子列和“误差条”子列,如图1-11所示。
图1-11 创建误差值数据表
(3)日期:选择该选项,创建包含X列、Y列的数据表,如图1-12所示。其中,X列必须从当前日期计算日期数据。
图1-12 创建日期数据表
(4)经过的时间:选择该选项,创建包含X列、Y列的数据表,如图1-13所示。其中,X列为经过的日期数据。
图1-13 创建经过的日期数据表
在该选项下定义XY表中Y值的定义方法(定义XY表时,默认X值的定义方法选择为“数值”)。
(1)为每个点输入一个Y值并绘图:选择该选项,直接创建包含X列、Y列的数据表。
(2)输入3个重复值在并排的子列中:选择该选项,直接创建包含X列、Y列的数据表。其中,Y列中包含3个子列(A:Y1、A:Y2、A:Y3),如图1-14所示。Y列下包含子列的个数可进行自定义设置。
图1-14 创建Y子列数据表
(3)输入并绘制已经在其他位置计算得出的误差值:选择该选项,直接创建包含X列、Y列的数据表。Y列中包含3个子列(平均值、标准差、N),如图1-15所示。在图1-9中的“输入”下拉列表中选择Y子列中显示的误差值类型:
● 平均值,标准差,N。
● 平均值,标准误,N。
● 平均值,%变异系数,N。
● 平均值与标准差。
● 平均值与标准误。
● 平均值与%变异系数。
● 平均值(或中位数),+/-误差。
● 平均值(或中位数),上限/下限。
图1-15 创建误差值Y子列数据表
在该选项下,通过“选择教程数据集”选项组中的数据集模板定义XY表,如图1-16所示。选择Enzyme kinetics -Michaelis-Menten选项,单击“创建”按钮,创建遵循米氏(Michaelis-Menten)动力学模型的酶动力学XY数据表,如图1-17所示。
图1-16 “选择教程数据集”选项组
图1-17 酶动力学XY数据表
在列数据表中,每列均定义一个数据组,这些组表示一个分组变量中的分类组。
在“创建”选项组下,默认选择“列”选项,在右侧选项中显示该类型下的数据表和图表的预览图,如图1-18所示。
图1-18 选择“列”选项
在“数据表”中有以下两种创建列数据表的方法。
通过“选项”选项组中的选项定义数据表。下面介绍“选项”选项组中的选项。
选择该选项,创建多个数据组列(第A组,第B组,……,第Z组,第AA组),每列表示一个类别,如图1-19所示。
图1-19 创建多个数据组列
选择该选项,创建多个数据列(第A组、第B组),在最左侧添加“表格式:列”单元格,用于定义分组数据,如图1-20所示。例如重复数据的次数。
图1-20 创建重复的数据组列
选择该选项,直接创建包含子列(平均值、标准差、N)的数据组,如图1-21所示。通过“输入”下拉列表定义子列显示的数据类型。
图1-21 创建误差值数据组列
在该选项下,通过“选择教程数据集”选项组中的数据集模板定义列数据表,如图1-22所示。选择ROC curve选项,单击“创建”按钮,创建ROC曲线列数据表,如图1-23所示,显示医院中的医学记录数据:Controls(正常标准值)和Patients(病人实际的检测值)。
图1-22 “选择教程数据集”选项组
图1-23 列数据表
分组数据表类似于列数据表,但设计用于两个分组变量。
在“创建”选项组下选择“分组”选项,在右侧选项中显示该类型下的数据表和图表的预览图,如图1-24所示。
图1-24 选择“分组”选项
在“数据表”中有以下两种创建分组数据表的方法。
通过“选项”选项组中的选项定义数据表。下面介绍“选项”选项组中的选项。
选择该选项,创建多个数据组列(第A组,第B组,……,第Z组,第AA组),每列表示一个类别,如图1-25所示。
图1-25 创建多个数据组列
选择该选项,在数据列下创建两组子列(例如第A组下为A:1和A:2),用于定义分组数据,如图1-26所示。
图1-26 创建重复的子列
选择该选项,直接创建包含子列(平均值、标准差、N)的数据组,如图1-27所示。通过“输入”下拉列表定义子列显示的数据类型。
图1-27 创建误差值数据组列
在该选项下,通过“选择教程数据集”选项组中的数据集模板定义分组数据表,如图1-28所示。选择Ordinary - two data sets选项,单击“创建”按钮,创建两组变量的数据表,如图1-29所示。一个分组变量的组(或级别)由行定义(Serum starved(血清缺乏)和Normal culture(正常培养));另一个分组变量的组(级别)由列定义(Wild-type cells(野生型细胞)和GPP5 cell line(GPP5细胞系))。
图1-28 “选择教程数据集”选项组
图1-29 分组数据表
列联表类似于分组数据表,专为由两个分组变量描述的数据设计。它用于将属于由行和列定义的每个组的受试者(或观察结果)的实际数量以表格形式展示。
在“创建”选项组下,选择“列联”选项,在右侧的“列联表:每行定义一项治疗或暴露,每列定义一个结果,每个值指示对象或事件的精确计数”选项中显示该类型下的数据表和图表的预览图,如图1-30所示。
图1-30 选择“列联”选项
在“数据表”中有以下两种创建列联数据表的方法。
选择该选项,直接从空数据表开始定义,列数据从结果A开始定义,接着是结果B,……,结果Z,结果AA,如图1-31所示。
图1-31 创建空数据表
在该选项下,通过“选择教程数据集”选项组中的数据集模板定义列联表,选择Chi-square test of prospective data (aspirin and MI)选项,单击“创建”按钮,创建两组变量的数据表,如图1-32所示。创建的数据表中提供两行两列数据,总共有4组:
● Placebo(安慰剂)和Myocardial Infarction(心肌梗死)。
● Aspirin(阿司匹林)和Myocardial Infarction(心肌梗死)。
● Placebo(安慰剂)和No MI(没有心肌梗死)。
● Aspirin(阿司匹林)和No MI(没有心肌梗死)。
图1-32 列联表
生存表用于使用Kaplan-Meier方法(简称KM法,也叫乘积极限法)进行生存分析。每行代表不同的受试者或个体。X列用于输入经过的生存时间,Y列用于输入单个分组变量的不同组的结局(事件或删失)。
在“创建”选项组下选择“生存”选项,在右侧的“生存表:每行列出对象的生存时间或删失时间”选项中显示该类型下的数据表和图表的预览图,如图1-33所示。
图1-33 选择“生存”选项
在“数据表”中有以下两种创建生存数据表的方法。
通过“选项”选项组中的选项定义数据表。下面介绍“选项”选项组中的选项。
(1)以天数(或月数)为单位输入经过的时间:选择该选项,创建多个数据组列(第A组,第B组,……,第Z组,第AA组),每列表示一个类别,如图1-34所示。
(2)输入开始日期和结束日期:选择该选项,创建一个X列和多个Y数据组列,X列下包含两个子列(开始日期和结束日期),Y列从第A组开始定义,到第Z组,再到第AA组,如图1-35所示。
图1-34 创建多个天数数据组列
图1-35 创建包含子列的数据组列
(1)在该选项下通过“选择教程数据集”选项组中的数据集模板定义生存表,如图1-36所示。
(2)选择Comparing two groups选项,单击“创建”按钮,创建不同的Days elapsed(生存天数)下Control(控制)和Treated(治疗)两组比较的数据表,如图1-37所示。
图1-36 “选择教程数据集”选项组
图1-37 生存表
在实际生活中,经常遇到一个问题:每个数值占总数的比例为多少?为了解决这个问题,引入了整体分解表,这种表格经常用于制作饼形图来分析比例问题。
在“创建”选项组下选择“整体分解”选项,在右侧的“整体分解表:每行定义一个互斥的类别”选项中显示该类型下的数据表和图表的预览图,如图1-38所示。
在“数据表”中有以下两种创建整体分解数据表的方法。
图1-38 选择“整体分解”选项
选择该选项,直接从空数据表开始定义,列数据从A开始定义,依次到B~Z,最终到AA,如图1-39所示。
图1-39 创建空数据表
(1)在该选项下,通过“选择教程数据集”选项组中的数据集模板定义列联表,如图1-40所示。
(2)选择Distribution of student grades (compute fractions of total)选项,单击“创建”按钮,创建学生成绩分布的数据表,如图1-41所示。其中,学生成绩分为A、B、C、D、E五个等级,并且分别显示不同等级下的学生人数。
图1-40 “选择教程数据集”选项组
图1-41 整体分解表
多变量数据表的排列方式与大多数统计程序组织数据的格式一致。每一行代表一个不同的观察结果或“病例”(实验、动物等),每一列则代表一个不同的变量。
在“创建”选项组下选择“多变量”选项,相应地,在右侧窗体的“多个变量表:每列代表一个不同的变量。每行代表一个不同的个体或实验单位。”区域中显示该类型下的数据表和图表的预览图,如图1-42所示。
图1-42 选择“多变量”选项
在上图右侧窗体的“数据表”区域中有以下两种创建多变量数据表的方法。
选择该选项,直接从空数据表开始定义,列数据从变量A开始定义,依次从变量B到变量Z,最终到变量AA,如图1-43所示。
(1)在该选项下,通过“选择教程数据集”选项组中的数据集模板定义列联表,如图1-44所示。
图1-43 创建空数据表
图1-44 “选择教程数据集”选项组
(2)选择Multiple linear regression (text variables)选项,单击“创建”按钮,创建多元线性回归的数据表,如图1-45所示。创建的数据表中包含糖尿病临床试验数据,其中,每行代表一名被研究者,列数据包含变量A~变量J的数据,这是被研究者的身体检测数据。
(3)变量表中的变量可识别连续变量、分类变量或标号变量,而分类变量和标号变量的值可作为文本输入。图1-45中的变量F表示Sex(性别),数据包括Female(女性)和Male(男性),Prism无须对分类数据进行编码,不再需要输入0和1,可以直接对这些分类变量进行编码。
图1-45 多变量表
嵌套表是某些行的集合,在主表中表现为一列。对于主表中的每条记录,嵌套表可以包含多行数据。当存在两级嵌套或层次关系时,使用嵌套表。
在本例中,比较两种教学方法。两种教学方法分别在3个独立教室中使用,每间教室中有3~6名学生。数据表中的值代表每间教室中个别学生的测量分数。每间教室仅使用一种教学方法,因此认为房间变量“嵌套”在教学方法变量中。
在“创建”选项组下选择“嵌套”选项,在右侧的“嵌套数据表:当每项治疗均在实验重复项中进行检验,并且每个实验重复项进行了多次评估(技术重复)时,分层或嵌套就是一种数据设计”选项中显示该类型下的数据表和图表的预览图,如图1-46所示。
图1-46 选择“嵌套”选项
在“数据表”中有以下两种创建嵌套表的方法。
选择该选项,直接从空数据表开始定义,列数据从A开始定义,到B,…,Z,最终到AA,如图1-47所示。
图1-47 创建空数据表
(1)在该选项下,通过“选择教程数据集”选项组中的数据集模板定义嵌套表,如图1-48所示。
(2)选择Nested one-way ANOVA选项,单击“创建”按钮,创建嵌套单因素方差分析的数据表,如图1-49所示。
图1-48 “选择教程数据集”选项组
图1-49 嵌套表