千人千面从字面意思理解就是对一千个人有一千个面,这个面也称为用户画像,用户画像就像一幅画像一样通过对颜色、线条、人物等的描述来构成画像,在用户画像里面称为标签。用户标签是构成用户画像的核心因素,是将用户在产品/平台上面所产生的业务数据、行为数据、日志数据等进行分析提炼后生成具有差异性特征的词条。例如用户在某产品上在某个时间点在某个场景下做了某个行为,将这些信息进行提炼形成对业务有用的输入,从而变成一个个标签。
用户标签可以有很多种存在形式,可以是用户的自然属性,可以是对用户交易、资产数据的统计指标,也可以是基于某些规则总结出的一些分层。无论是哪种形式都是对用户的某个维度特征进行描述与刻画,让使用者能快速获取信息。好的标签需要具备如下4点特征:①原子性,即用户标签是用户画像特征刻画的最细粒度;②可复用性,标签可以被多次使用,而非一次性标签;③可度量性,标签值和价值可被度量和计算;④可组合性,标签可被自由组合以生成组合标签。
标签有多种分类方式。按更新频率来分可分为静态标签、动态标签,例如“性别”这个标签,一般来讲是不会随着时间而变动的,所以它属于静态标签,而“最近一次访问时间”会随着每次用户的登录而更新,也就是动态标签;按开发方式分可分为事实标签、规则标签、预测标签,这一种分类方式是从技术开发角度区分的。事实标签是从底层数据表中取出原始数据,进行简单的加、减、乘、除运算而得到的标签,例如“最近一次登录距今天数”这个标签,它反映基本事实。规则标签则是进行了业务定义后的标签,例如“流失用户”这个标签,基于业务认知,可以将“最近一次登录距今天数”大于30天的用户定义为流失用户,不同公司会有自己的定义方式。预测标签是需要利用算法分析预测才可以得到的标签,例如电商产品常通过用户的下单行为去猜测用户的性别,通常算法类标签涉及复杂的逻辑与权重,开发难度大,在所有标签中占比不高。按生成规则分可分为单一标签、复合标签,一般来讲,上述的统计类标签可以说是单一标签,而规则类和算法类标签就是需要多个单一标签组合而成的复合标签;从层级上分可分为一级标签、二级标签、三级标签等,同样,层级也是为了业务理解更加有序才产生的,例如一级标签是大类,按具体行业和业务可以分为人口属性、行为属性、营销属性、商业属性等。二级标签可以具体下分,例如商业属性下二级标签可以分为优惠券,三级标签分为优惠券-敏感度高/中/低用户。当然,如果业务逻辑复杂,则可能还会有四级标签。
一般的中大型公司或多或少已经建设了自己的标签,但实际使用效果却差强人意,很难驱动业务产生价值。互联网行业搭建统一的用户标签体系要解决的常见痛点:标签口径不一致。用户画像、精准营销平台人群圈选、算法特征都涉及用户标签,各个系统存在标签同义不同值、同值不同义的问题。举个例子,互金信贷行业的通过率就有至少三种不同的统计口径,风控部门是以授信通过或者审核通过为准,财务部门以放款为准等。不同部门因侧重点不一样而导致对这个指标的定义不一样。企业建设统一的标签平台规范口径也是数据中台的重要内容。标签指标重复建设,用户标签分散,重复建设,难以统一管理。形成了局部数据孤岛,存在重复建设问题。例如和标签生产相关的团队就有好几个:数据团队模型开发人员要做自己的模型变量标签,存在多个模型工程师重复建设同一标签而产生大量同质的标签表,数据分析团队归纳业务需求总结出来的标签,例如用户生命周期标签,若分析团队位于不同部门,则重复建设情况更为严重,再加上技术开发人员做的营销平台、消息系统、优惠券平台等需要打常规的用户标签来选人等。标签生产周期长,互联网公司的标签生产流程大致如下:业务提标签需求→数据对接人(一般是数据PM或者分析师)收集转化→提交给数据开发(离线开发与实时开发)→数据开发按业务逻辑清洗数据,导入平台系统→后台开发做成数据服务统一对外输出标签。
一般如果没有做标签上线流程的配置化,则此时还需要前端开发介入,整个流程耗时长,从平均需求产生到上线耗时一周甚至更长时间,有些国有企业由于指标涉及部门多、决策流程长,生产常规运营标签耗时竟然可以达到1个月,这样的生产流程根本无法满足业务快速发展的需求。业务运营靠经验,手工操作流程多且周期长,在缺乏统一标签平台或者没有精准圈人平台之前就会导致效率低下。以信贷行业为例,一般运营人员做活动的流程如下。活动前:运营提选人需求→分析师提数→风控人员按规则过滤用户→运营手动分组并将名单导入营销系统→选择触达方式(消息/优惠券等)和触达周期(一次性/周期性/实时等)→触达用户;活动后:运营将名单再次交给分析师→分析师将数据提交给运营→运营分析活动效果。
这里存在很多拍脑袋决策的节点,例如运营圈人规则看不到人群数量,容易出现圈定人群样本量过少而无法进行营销活动;运营在看不到人群画像和分布的情况下,手动盲目对人群进行分组AB实验,容易导致AB实验结论不可靠。活动效果分析没有横向和纵向对比,无法客观得出活动到底做得怎样。当然这里面还存在诸多手工操作的地方和维护困难的地方,例如每次圈人过风控规则,圈人后手工导入营销系统,手动将名单交给分析师做效果分析等。
基于以上种种痛点,建设一个统一可用的用户标签体系就显得极为关键了,建设标签体系的核心原则是从业务中来,到业务中去,以终为始,怎么用来倒推怎么设计,脱离业务去设计的标签缺少实际的落地场景,这些都是无用的标签,实际上这是很多公司数据部门容易犯的错,数据部门想要从数据层面去驱动业务,基于自身过往从业经验,拍脑袋梳理和设计了上百个标签,却发现业务根本不买单。数据部门价值体现的最佳方式就是融入业务团队,知道业务的来龙去脉和痛点。一套正确的数据分析梳理业务的顺序是:明确商业目的→梳理业务流程→收集业务痛点→汇集整理标签,最后才是开发标签反哺业务。
设计标签可以归纳为以下三种方法:①方法一,基于业务主流程来设计标签,以信贷行业为例,梳理后信贷业务主流程为激活→注册→登录→认证→申请进件→风控→放款→还款→逾期催收。以激活到注册流程为例,为精准化识别用户渠道及后续做渠道成本结构优化,这个环节可能需要的标签是注册渠道、获客渠道、渠道类型、结算类型、获客成本、注册设备等。再以申请进件到风控流程为例,结合流程中常见的业务场景,可能需要的标签:首次/最近一次申请时间、产品、额度、是否通过,总申请次数、金额,拒绝次数、放弃次数,通过类型(人工、系统自动)等;②方法二,基于业务场景来设计标签,以典型运营场景为例,信贷业务主要靠老户复贷挣钱,促老户复贷是经常会做的一个运营活动,思考活动运营的3个要素(活动对象、在什么场景、执行什么策略),这时需要的标签可能是用户类型(新老户)、最近一次成功还款时间、金额、最近一次借款产品、产品偏好、优惠券敏感度、响应度、额度敏感度、响应度等;③方法三:基于北极星指标自顶向下设计标签,一般公司每年会基于大的战略方向制定公司整体的北极星指标(指引业务发展的指标),然后基于整体业务指标自顶向下拆分到各业务部门,各业务部门再根据运营策略拆解成更细的指标。