从形式上看,曲线标绘图与散点图的区别就是一条线来代替散点标志,这样做可以更加清晰直观地看出数据走势,但无法观察到每个散点的准确定位。从用途上看,曲线标绘图常用于时间序列分析的数据预处理,用来观察变量随时间的变化趋势。此外,曲线标绘图可以同时反映多个变量随时间的变化情况,所以曲线标绘图的应用范围还是非常广泛的。
【例2.3】 某足球教练准备执教一支新球队,在执教前对拟执教球队的过往赛季进球数据进行了搜集整理,如表2.4所示。试通过绘制曲线标绘图来分析研究该球队的进球情况变化趋势以及对队内第1射手(进球最多的队员)的依赖度。
表2.4 拟执教球队的过往赛季进球数据
在用Stata进行分析之前,我们要把数据录入Stata中。本例中有3个变量,分别是年份、总进球数和第1射手进球数。我们把年份变量设定为year,把总进球数变量设定为total,把第1射手进球数变量设定为first,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作在第1章中已详细讲述过了。录入完成后数据如图2.12所示。
图2.12 案例2.3的数据
先保存数据,然后开始展开分析,步骤如下:
进入Stata 16.0,打开相关数据文件,弹出主界面。
在主界面的Command文本框中输入命令:
graph twoway line total first year
设置完毕后,按回车键,等待输出结果。
上述操作完成后,Stata 16.0将弹出如图2.13所示的曲线标绘图。
图2.13 曲线标绘图1
通过观察曲线图,可以比较轻松地看出本支球队的进球情况。我们发现,该球队的进球状态虽有所起伏却变化不大,但是队内第1射手的进球状态是在波动中上升的,这可能是原来的射手逐渐成熟、成长起来,能力得到提升,也有可能是引进了更加优秀的球员所致。从整体上看,这支球队并没有完全依赖第1射手进球,但是它的依赖度自2005年以来是有所上升的。
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。Stata 16.0的强大之处在于,它提供了更加复杂的命令格式以满足用户更加个性化的需求。
1.延伸1:给图形增加标题、给坐标轴增加数值标签并设定间距、显示坐标轴的刻度
例如,我们要给图形增加标题的名称“案例2.3结果”,对X轴添加数值标签,取值为1997~2012,间距为2,对Y轴添加数值标签,取值为0~80,间距为10,对X轴添加刻度,间距为1,操作命令就应该相应地修改为:
graph twoway line total first year,title("案例 2.3结果") xlabel(1997(2)2012) ylabel(0(10)80) xtick(1997(1)2012)
在命令窗口输入命令并按回车键进行确认,结果如图2.14所示。
2.延伸2:改变变量默认标签
例如,我们要在延伸1的基础上使总进球数和第1射手进球数这两个变量的标签直接以汉字显示,从而更加清晰直观,操作命令就应该相应地修改为:
graph twoway line total first year,title("案例 2.3结果") xlabel(1997(2)2012) ylabel(0(10)80) xtick(1997(1)2012) legend(label(1 "总进球数") label(2 "第1射手进 球数"))
在命令窗口输入命令并按回车键进行确认,结果如图2.15所示。
图2.14 曲线标绘图2
图2.15 曲线标绘图3
3.延伸3:改变线条的样式
例如,我们要在延伸2的基础上进行改进,使第1射手进球数的曲线变为虚线,操作命令就应该相应地修改为:
graph twoway line total first year,title("案例 2.3结果") xlabel(1997(2)2012) ylabel(0(10)80) xtick(1997(1)2012) legend(label(1 "总进球数") label(2 "第1射手进 球数")) clpattern(solid dash)
在命令窗口输入命令并按回车键进行确认,结果如图2.16所示。
图2.16 曲线标绘图4
在上述命令中,solid代表实线,对应的是第1个因变量total;dash代表虚线,对应的是第2个因变量first。线条样式与其对应的命令缩写如表2.5所示。
表2.5 线条样式与命令缩写