网站分析实战：如何以数据驱动决策，提升网站价值（全彩）最新章节_王彦平著

2.2　网站分析中的基础指标

指标是网站分析的基础，用来记录和衡量访问者在网站中的各种行为。我们经常挂在嘴边的流量就是一个网站指标，它用来衡量网站获得的访问量。除此之外我们还会用到很多指标，这些指标包括基本指标、复合指标、自定义指标等。下面来看一下网站分析中最常用的几个基本指标。

2.2.1　网站分析中的骨灰级指标

1．骨灰级指标一：IP地址

你的网站今天有多少IP？IP的数量曾经是每个网站都关心的指标。在早期的网站统计工具中，IP可以表示网站流量，也可以表示网站的访问者数量，图2-11所示的就是一个典型的IP地址数据报告。很多新接触Google Analytics的朋友几乎都会问这几个问题：GA中有IP的概念吗？访问次数是IP吗？绝对唯一访问者是通过IP计算的吗？网站的流量是每日网站的IP地址数量吗？

图2-11　IP地址报告

在Google Analytics中也有IP地址的概念，但是这里的IP既不是访问次数，也不是绝对唯一访问者。同时，IP也不能表示网站的流量。在Google Analytics的报告中，使用Cookie来记录网站获得的访问次数、辨别绝对访问者的身份。IP地址只有一个作用，就是获取访问者的地理位置信息，并生成访问者报告下的“地图覆盖图”报告。

Tips

IP地址曾经是很多网站用来统计网站流量和访问者数量的指标，但相对于Cookie来说，统计IP地址衡量网站的流量指标已经不准确了。根据ComScore的调查报告，美国家庭中的电脑平均每个月有10.5个不同的IP地址。使用IP地址追踪会将这些用户记录为10个不同的唯一访问者。在中国使用ADSL上网的家庭用户也会存在这种情况。

图2-12　IP地址与Cookie记录数据对比

如图2-12所示，IP地址和Cookie在记录访问者访问网站时都有一定的局限性，由于各种技术原因和访问者的浏览器使用习惯，导致通过这两种方式提供的数据并不是100%准确。表2-6对比了在不同场景中IP地址追踪和Cookie追踪方式的差异。

表2-6　不同场景下IP地址与Cookie对比

相对来说使用第一方Cookie来辨别访问者身份比使用IP地址更加准确，但Cookie也有自己的问题，比如访问者或第三方工具清除Cookie，访问者更换电脑或浏览器上网，页面JS文件失败等。在Omniture和Webtrends中可以根据需求选择使用IP地址或是Cookie来识别访问者身份，并可以设置优先级。Google Analytics默认使用第一方Cookie来识别访问者身份。

Google Analytics如何获取IP地址

Google虽然不使用IP地址来识别访问者身份，但会追踪每个访问者的IP地址信息。这个过程是在Google的服务器端完成的，所以在Google Analytics的返回数据中我们看不到这个信息。当JS文件收集完追踪信息向Google服务器请求1像素图片时，Google服务器会记录这个请求的IP地址，并将随后返回的数据与IP地址进行匹配并生产一条日志文件。

例：Google Analytics中的一条日志文件

IP地址在Google Analytics中的作用

返回Google的访问者IP地址信息只有一个作用，就是用来识别访问者的地理位置信息。Google将访问者的IP地址与自由IP库的地理位置信息进行对比，确定访问者的地理位置信息，并最终生产“地图覆盖图”报告，如图2-13所示。

图2-13　Google Analytics地理位置报告

Google Analytics为何不提供IP信息

Google Analytics为什么不提供IP信息，而是只提供地理位置信息？因为追踪访问者的IP地址违背Google的隐私政策。通过访问者的IP地址可以定位更小的区域或每台电脑，图2-14显示了不同国家的IP地址精度报告。

图2-14　不同国家IP地址精度报告

当这些信息与访问者账户、网站调研信息和其他追踪到的信息匹配后我们可以了解到每个人的网站访问偏好，而这与Google的隐私政策是不符的。所以Google将IP地址汇总并只显示到市/县级，这样可以很好地保护用户隐私。

2．骨灰级指标二：浏览量PageView和唯一身份浏览量Unique PageView

PV和UPV都是基于页面的指标，如图2-15所示。PV的全称是PageView，中文是浏览量；UPV的全称是Unique PageView，中文是唯一身份浏览量。

图2-15　浏览量和唯一身份浏览量报告

指标的定义

“浏览量”在Google Analytics中的定义是这样的：指由浏览器加载的网页综合情况。

每次执行跟踪代码时，Google Analytics均可记录浏览量。可以是由浏览器加载且含跟踪代码的 HTML或类似网页，或在分析报告中为模拟浏览量而创建的UrchinTracker事件。

“浏览量”的通俗解释就是页面被加载的总次数。每一次页面被成功加载，就会被算作一次综合浏览量（PV）。比如：有人来到你的网站，浏览了页面A，然后浏览了页面B，然后再一次回到了页面A，然后离开网站，那么这次访问的浏览量总数就是3。而如果这个人打开页面后又点击了刷新或是重新加载，就会被算作另一次浏览量。

“唯一身份浏览量”在Google Analytics中的定义是：汇总由同一用户在同一会话期间生成的浏览量。唯一身份浏览量表示该页被浏览（一次或多次）期间的会话次数。

唯一身份浏览量的定义比较复杂，我的理解是指页面所受到来自同一个用户在同一session中的访问次数。当页面受到同一用户在同一session的访问时算作一次“唯一身份浏览量”，当这个用户在另一session中访问了这个页面，或另外一个用户访问了这个页面时，将被算作另一次“唯一身份浏览量”。简单地说，这个指标的计算只取决于一个因素：是不是属于同一session。如果不是，就被记录为一次新的“唯一身份浏览量”。Session是指用户的一次访问过程，时间由_utmb cookie的生存期决定，默认值是30分钟。

指标的计算方法

“浏览量”就是追踪代码被加载次数的总和，通过cookie_utmb中的值获得。而“唯一身份浏览量”是指网站各个页面上用户Session的总和。

可能对指标产生影响的因素

★ 影响因素1：GA追踪代码在页面中的位置

通常我们将Google Analytics的追踪代码安装在页面的最底端</body>处，而如果用户没有完全加载页面就离开的话，这个页面的访问将不被记录，即追踪代码没有被执行。

★ 影响因素2：GA追踪代码中Session的设置

Google Analytics中一个Session默认是30分钟，如果修改了这个值，“唯一身份综合浏览量”将会受到影响。

2.2.2　网站分析中的基础级指标

1．基础级指标一：访问次数Visits

指标的定义

“访问次数”的定义是：网站的所有访问者发起的具体会话次数。

通俗的解释就是，在一定时间范围内，网站的所有“访问者”对网站访问的总次数，即访问者人数*每个访问者的访问次数。

指标的计算方法

访问次数也是通过计算Google Analytics设置用户电脑上的cookie_utma获得的。

如图2-16所示，在Content后面的六组数字中，最后一组的数字就是用来计算用户访问次数的，这里的31就表示一共访问了31次。

图2-16　通过utma cookie记录访问次数

图2-17　通过utma cookie辨别新访用户

测试一下，如果删除了这个cookie并再次访问网站看看图2-17产生了什么变化：

此时Content的最后一组数字变成了1，说明是第一次访问，并且第二组和第三组数字也和原来不同了，说明变成了一个新用户。

可能产生影响的因素

影响因素：Cookie的因素

用户删除Cookie会影响访问次数的计算。

修改cookie utmb的生存周期会影响访问次数的计算。

2．基础级指标二：绝对唯一访问者Visitor

指标的定义

“绝对唯一访问者”在Google Analytics中的定义是：在指定时段内不重复（仅计数一次）的访问者人数。唯一身份访问者人数用Cookie确定。

通俗的解释就是：在你选择的报告日期范围内每个访问者只被计算一次。如果在选定的日期范围内访问者A来过网站5次，访问者B只来过网站一次，那么就有2个“绝对唯一访问者人数”。

指标的计算方法

“绝对唯一访问者”数量是通过计算Google Analytics设置用户电脑上的Cookie（_utma）获得的。

通常，Google Analytics会在用户第一次访问网站时在用户的电脑上设置Cookie，其中的_ utma用来辨别绝对唯一访问者身份和访问次数等信息。

图2-18　通过_utma cookie辨别唯一身份访问者

如图2-18所示，Content后面共有6组数字。其中的第2组数字和第3组数字构成了一个唯一访问者标识（第2组数字是Google Analytics随机生成的唯一ID，第3组数字是用户第一次访问时生成的时间戳），Google Analytics依靠这两组数据来区分和计算“绝对唯一访问者”。

可能产生影响的因素

★ 影响因素1：JavaScript被禁用

如果访问者的浏览器禁用了JavaScript，Google Analytics的代码无法工作，也就不能识别这个用户了。

★ 影响因素2：Cookie的因素

如果Cookie被用户删除，当他再次访问网站时，会获得一个新的_utma cookie，里面包含一个新的“绝对唯一访问者”ID。这样一来，一个用户就被记录了两次。

Cookie的设置基于浏览器，当同一个用户先后使用Firefox和Internet Explorer两个浏览器访问时，会被识别成两个不用的“绝对唯一访问者”；如果两个用户使用同一个浏览器访问同一网站时，他们会被记录为一个“绝对唯一访问者”。

★ 影响因素3：图片因素

这个因素并不常见，有些浏览器允许用户停用由当前网页之外的网域所请求的图片。用户启动这个功能后将会阻止数据发送至Google Analytics。

★ 影响因素4：时间因素

“绝对唯一访问者”的数量会根据你选择的时间范围而发生变化。为了避免产生错误数据，必须一次选定数据的时间范围，否则有可能产生重复的“绝对唯一访问者”。

3．基础级指标三：网站停留时间Time on site和页面停留时间Time on page

“页面停留时间”和“网站停留时间”是Google Analytics中的一对时间指标，分别用来记录用户在网站或网页上的停留时间，这样就可以根据用户停留的时间长短来衡量网站或页面的表现。

指标的定义

页面停留时间：显示访问者在某个特定网页或某组网页上所花费的时间。

网站停留时间：访问者在网站上花费的时间。

指标的计算方法

页面停留时间：Google Analytics是通过被访问网页的时间戳来计算页面停留时间的。简单地说，就是通过用户访问后一网页的初始时间减去用户访问前一网页的初始时间。

图2-19　页面停留时间计算方法

如图2-19所示，假设用户访问网页A，然后访问了网页B，之后离开了网站。用网页B的时间戳减去网页A的时间戳就可以计算出网页A的停留时间。

用户访问网页A的时间：9:30:05

用户访问网页B的时间：9:30:15

用户在页面A的停留时间是10秒

图2-20　通过_utma cookie计算时间指标

图2-20显示了Google Analytics如何通过cookie_utma来获得用户访问页面的时间戳。其中的第3、第4、第5这三组数字就是时间戳，这些数字是以秒为单位的。第3组数字表示初次访问的时间，第4组数字表示上一次访问的开始时间，第5组数字表示当前访问的开始时间。Google Analytics在这里获得访问页面的时间戳并用来计算出页面停留时间。

网站停留时间：就是用户访问网站的时间。Google Analytics通过_utmb和_utmc两个Cookie来计算网站停留时间。_utmb的生存期是30分钟，_utmc是临时Cookie，随着浏览器关闭而消失。当这两个Cookie中的任意一个消失后，Google Analytics就判断是一次访问（session）结束，并用后面的时间减去访问开始的时间来计算网站停留时间。

可能产生影响的因素

★ 影响因素1：计算方法

页面停留时间：

页面停留时间是依靠后面页面的时间戳减去前面页面的时间戳获得的，但必须在两个页面的追踪代码都被执行后才能完成计算。

假设一种情况：

用户访问网页A的时间：9:30:05

用户访问网页B的时间：9:30:15

用户在9:30:30关闭B页面。

那么：

用户在页面A的停留时间是10秒

用户在页面B的停留时间将是0秒（而不是15秒）

因为用户访问完页面B后没有继续访问，而是离开了。这就没有后续的时间戳用来计算B页面的停留时间了。这种情况在Google Analytics中是广泛存在的，因为用户的每次访问都会有最后一个页面（退出页），而最后一个页面的停留时间是无法计算出来的，这就导致了页面停留时间指标的不准确。

注意点！

访问者在最后页面的停留时间超过30分钟也会造成最后页面停留时间无法计算的情况。

网站停留时间：

Google Analytics是通过一次访问的开始和结束时间来判断用户在网站的停留时间的，再具体一点，是通过_utmb和_utmc两个Cookie来判断访问结束时间的，但这两个Cookie不一样的工作方式也会对网站停留时间造成影响。

_utmc会在用户关闭浏览器时一起消失，这个是没有问题的。而_utmb的生存期是30分钟，就是说即使用户停止了访问，但只要没有关闭浏览器就要需要等待30分钟才能记录为访问结束，而在这30分钟里，用户可能已经离开了。

★ 影响因素2：跳出访问

跳出访问是指用户只浏览了一个页面就离开了。这种访问同样因为没有后续页面的时间戳而无法计算出页面停留时间。Google Analytics在计算平均页面停留时间时不会包含跳出访问，而在计算平均网站停留时间时会包含跳出访问。

2.2.3　网站分析中的复合级指标

1．复合级指标一：跳出率Bounce Rate和退出率 Exit Rate

跳出Bounces和退出Exits在Google Analytics中是一对比较相似的指标，都可以用来表示离开网站的访问者数量，但两个指标的计算方法和针对的页面及用户是完全不同的。如图2-21所示，跳出针对的是访问者来到网站后访问的第一个页面，即访问者的登录页面（Landing Page）。并且访问者跳出的动作只有在这个页面上才会出现（从第二个页面开始算做退出），而退出在网站的所有页面上都可以出现，只要访问者离开网站，就算一次退出，而他最后访问的那个页面就是退出页面。所以，网站上的每个页面都有可能成为访问者的退出页面。

图2-21　跳出率和退出率

跳出率是指在某个范围内跳出的值与总访问次数的百分比。退出率是指在某个范围内跳出的值与综合浏览量的百分比。这个范围可以是单一页面、某一组页面或是一个频道，也可以是一个关键词、一个流量来源、或是一个城市，一个日期等。但在整个网站范围内只有跳出率的概念，而没有退出率的概念，因为所有的访问者最终都会离开网站。

指标的定义

跳出： 指单页访问或访问者的次数，即在一次访问中访问者进入网站后只访问了一个页面就离开的数量。

退出： 指访问者离开网站的次数，通常是基于某个范围的。

跳出率： 指某一范围内单页访问次数或访问者与总访问次数的百分比。

退出率： 指某一范围内退出的访问者与综合访问量的百分比。

Tips

如果访问者在访问中只浏览了一个页面就离开网站，那么这既算一次跳出，也算一次退出。而对于这次访问该页面的跳出率和退出率都是100%。

指标的计算方法

跳出： 访问者只访问一个页面后离开网站被记录为一次跳出。

跳出率： 某一范围内跳出的数量/同一范围内总访问量*100%。

退出： 访问者离开网站被记录为一次退出。

退出率： 某一范围内退出的数量/同一范围内综合访问量*100%。

如图2-22所示，通过上面的报告数据可以验证Google对跳出率和退出率的计算方法。

图2-22　Google Analytics中的内容页面报告

最受欢迎页面总访问次数（Visits）342，综合浏览量（PV）1487，跳出（Bounces）154，退出（Exits）342。

在最受欢迎的一组页面范围内：

跳出率45.03%=跳出154/总访问次数342*100%（0.45029）

退出率23.00%=退出342/综合浏览量1487*100%（0.22999）

而在单一页面（首页）范围内，计算方法也是一样的。

指标的意义

跳出率可以被用来衡量流量和页面质量，高跳出率表示访问者对登录页面（Landing Page）不感兴趣，没有继续访问更深入的页面，或者是登录页面设计存在问题，与目标用户不匹配。跳出率可以通过调整广告渠道、优化登录页面内容来降低。

退出率因页面不同意义也不同。每个页面都有可能成为退出页面，但如果是网站关键流程中的页面退出率高，就说明该页面出现了问题。比如，在网站的注册流程中，如果是完善信息页面退出率高，就需要检查这个页面了。

如图2-23所示，跳出和退出不仅基于页面和内容，同样也可以基于流量来源、地区、时间以及访问者类别。通过跳出和退出可以比较网站不同来源、不同数据、不同地区或不同类别访问者的数据。

图2-23　按来源维度细分的跳出率和退出率指标

可能产生影响的因素

影响因素：GATC二次报告数据

任何触发Google追踪代码二次报告数据的行为都可能影响跳出率（Google默认在访问者访问页面时只报告一次数据），比如：

★ 访问者虽然只访问了一个页面就离开了，但在访问中刷新了页面；

★ 对追踪代码进行了定制，比如增加了鼠标事件追踪或时间追踪，这些都会在一定条件下触发Google追踪代码二次报告数据，进而影响跳出率的计算；

★ 框架页面：Google为了准确追踪框架页面需要在两个页面内分别加入追踪代码，这就意味着访问者虽然只打开了一个页面，但实际上Google的追踪代码已经报告了两次数据。

2．复合级指标二：访问时长和访问深度

访问时长和访问深度在Google Analytics中是两个不太起眼的指标，但它能让我们从不同的角度洞察网站的停留时间和综合浏览量在每次访问中的分布，避免我们陷入平均数的误区。通过访问时长报告可以查看是否有几次访问大幅提升了“平均网站停留时间”，还是网站上的大多数访问都有较长的平均停留时间；通过访问深度报告可以查看是否有几次访问大幅提升了每次访问的“平均综合浏览量”，还是大多数网站访问次数都查看了大量的网页。

指标的定义（访问时长）

访问时长是在选定的时间范围内，不同时长的访问次数在网站获得的所有访问次数中的分布情况。

访问时长报告分为三部分，即访问持续时间、这一时段的访问次数和占所有访问的百分比。报告按我们选定时间范围内每次访问持续的时间，将网站获得的所有访问次数进行细分，并计算每个时间访问的访问次数在网站总访问次数中所占的比率，如图2-24所示。

图2-24　Google Analytics中的访问时长报告

指标的定义（访问深度）

访问深度：在选定的时间范围内，不同浏览量的访问次数在网站获得的所有访问次数中的分布情况。

访问深度报告也分为三部分：访问综合浏览量、达到此浏览量的访问的次数、占所有访问的百分比。报告按我们选定的时间范围内每次访问的综合浏览量将网站获得的所有访问次数进行细分，并计算每个综合浏览量级别内的访问次数在网站总访问次数中所占的比率，如图2-25所示。

图2-25　Google Analytics中的访问深度报告

指标计算方法

举个例子来说明访问时长和访问深度指标的计算方法。

访问者A在2月10日访问网站1次，浏览2个页面，共停留8秒。

访问者B在2月11日访问网站1次，浏览3个页面，共停留35秒。

访问者B在2月12日访问网站1次，浏览1个页面，共停留15秒。

访问者C在2月13日访问网站1次，浏览5个页面，共停留62秒。

访问者C在2月13日再次访问网站1次，浏览3个页面，共停留17秒。

先看一下2月10日—2月13日网站的总体情况：访问次数5，综合浏览量14。表2-7和表2-8分别显示了访问者的访问时长和访问深度。

表2-7　访问者访问时长计算表

表2-8　访问者访问深度计算表

指标的意义

访问时长： 访问时长是访问质量的一个衡量指标。较长的访问时长表明访问者与您的网站进行了较为广泛的互动。通过访问时长报告可以直观地查看整个访问的分布情况，而不仅是所有访问次数的“平均网站停留时间”。

访问深度： 访问深度是访问质量的一个衡量指标。每次访问具有较高的综合浏览量数目表示访问者在您的网站上进行了广泛的互动。通过访问深度报告可以直观地查看整个访问的分布情况，而不仅仅是平均每次访问综合浏览量。

可能产生影响的因素

★ 影响因素1：访问时长

这里访问时长的计算方法也是依靠Google的_utmb和_utmc两个Cookie。所以如果访问者让浏览器窗口保持打开状态而实际上没有查看或使用您的网站，则会造成虚假的“平均网站停留时间”。

★ 影响因素2：访问深度

访问深度中的网页浏览次数是指综合浏览量。即使是刷新页面，或者退回上一页面也会被记录为一次新的网页浏览。所以这里的访问深度并不代表同方向无重复的页面浏览量。

2.2 网站分析中的基础指标

2.2.1 网站分析中的骨灰级指标

2.2.2 网站分析中的基础级指标

2.2.3 网站分析中的复合级指标

2.2　网站分析中的基础指标

2.2.1　网站分析中的骨灰级指标

2.2.2　网站分析中的基础级指标

2.2.3　网站分析中的复合级指标