购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
企业大数据体系建设

一、“真假”大数据

流量是过去互联网时代商业模式的内核。一切互联网商业模式和思维,本质上都是争夺用户,争夺流量。而互联网和移动互联网催生的大数据时代到底有多少大数据是真实可信的呢?

曾经在知名电商平台上搜索“刷流量”等关键词,可以轻易找到报价 1 ~ 5 元/万次播放量的刷量产品。比如:腾讯、乐视 2 元 1 万次;搜狐 5 元 1 万次;优酷 8 元 1 万次;爱奇艺 20 元 1 万次。从刷量产品的报价上,可以大致估计各平台对刷量行为的打击力度,其中以优酷和爱奇艺最为严格。不过,现在淘宝已经将所有刷量产品的关键词屏蔽(图 2.10)。

图2.10 刷量产品的报价明细

假的流量并不表示对方是真正的目标客户,而是被黑客操纵的“僵尸粉”。对于想获取真正目标客户的企业主来说,虚高流量产生的大笔广告费没有任何效果。企业并不能从这样的流量数据中获得任何有价值的用户信息,也无法转化成商品销售收入,这是大数据时代实现广告精准营销推送的一大障碍。

网络不正当竞争的典型手法—“刷单”

尽管通过“刷单”获得的流量是假流量,并不具有实际意义和价值,也很难转化为有效订单,但企业在最初进入某平台时,为了获取客户的信任从而促成第一笔订单的达成,往往自愿选择通过“刷单”、虚假评论等方式提高店铺“人气”。

市场是由供需关系决定的,“需求”催生“生产”。一大批以“刷单”为生的团伙活跃于互联网世界。2021 年 7 月,国家市场监督管理总局曝光了 10 多起互联网虚假宣传不正当竞争的典型案例,其中包含三种不同类型的“刷单”方式。

方式一:利用“网红”虚假评论等方式“刷单炒信”。

大众点评网 2003 年成立于上海,是中国最大的生活服务电商平台,也是全球最早建立的第三方消费者评价网站。大众点评网为用户提供商户信息、消费点评及优惠活动等信息服务。2015 年,大众点评网与美团网宣布合并成立新公司“美团大众点评”。据悉,2019 年,大众点评网日活跃用户已达到 1317 万,入驻商家更是不计其数。

消费者在大众点评网上可以通过商户的各项评分以及真实消费评价迅速筛选自己喜爱的店铺。特别是打算到外地旅游或出差时,可以提前通过大众点评网的当地推荐与排名以及榜单来选择商户,以防“踩雷”。有很多年轻人喜欢在大众点评网上寻找新开的“网红店铺”,与朋友专门前往“打卡”。

当消费者变得依赖大众点评网的帮助时,结果往往大失所望。很多店铺通过“刷单”人群组织网站上的“大V”到店吃“霸王餐”后,发布图文并茂的好评吸引“粉丝”和消费者前往。好评数量越多、写评论的账号等级越高,商户获得的分数也越高,不管在店铺星级和店铺排名上,都能取得更好的成绩。大众店铺的评分标准还受到店铺“粉丝数”“浏览量”“点赞量”等因素的影响,而这些数据对于刷单人群来说都是“小菜一碟”。这种人为刷单+机器刷单的行为已经严重影响到了平台的生态健康,误导消费者的选择,破坏了市场的公平竞争(图 2.11)。

图2.11 大众点评网发布“清风行动”信息

方式二:利用科技手段,伪造虚假订单与评论。

伴随直播带货热潮的席卷,直播电商无疑是时下最火热的新消费场景。图文等传统信息流广告,已经不足以吸引消费者的眼光,带货短视频与直播电商等新的推送方式,快速占据用户内心,抖音和快手的日活跃数量都已破亿。随之而来的,是越来越多的明星、“网红”瞧中这块大蛋糕。

淘宝 2020 年的数据显示,参与直播带货的商家数量同比增长了 220%,其中还包含300 多位明星、400 多位企业家。2020 年,天猫“双十一”成交额同比增长 85%,薇娅直播间观看人次达到 8200 万,销售额超过 11 亿元。2020 年,“双十一”期间,淘宝直播成交额达 1 亿元的直播间高达 28 个。

流量成为主播与品牌方之间博弈的筹码。谁拥有更多的流量,谁就拥有更大的话语权。但事实真的如此吗?电商直播中的观看量、粉丝量、销售量全都能造假。不少品牌方都表示,很多主播看似粉丝多,直播间观看量多,但成交量寥寥无几,甚至有一些品牌方还出现了货卖出去后遭遇大规模退单的惨状。

数据显示,中国已有上千家大大小小的刷单平台,产业人员规模高达 900 多万。虚假流量已经渗透到各个平台。刷单公司利用平台的漏洞,通过一台电脑,就可模拟出平台与服务器之间的通信,相当于电脑上下载了很多个平台APP,虚构了很多个不同的用户进入直播间,形成一个批量操作系统,电脑可同时操控多达 20000 台手机。在线观看、点赞、评论互动,都可以通过系统自动完成(图 2.12)。

图2.12 国家出台相关政策

方式三:组织员工、亲友等熟人“刷单炒信”。

电商平台上极为普遍的一类刷单行为就是组织企业员工及自己的亲友刷单。他们在平台上下单,店铺实际并不发货,待商品查收后,撰写虚假好评,再通过其他渠道,将商品购买费用退还给他人,另外再支付额外的刷单佣金。

【案例分析】 “刷单人群”和互联网平台之间既有斗争,也有合作,即使这种合作是不能见光的潜规则。有时候互联网公司会故意留下漏洞,就是为了增加注册量和业务量,因为每个公司内部都有两股势力在博弈:有时运营人员和高管,也需要给领导呈报“漂亮的数据”;有时候是高层和风险投资人,他们需要向投资人证明业务增长超出预期,以提高公司的估值。互联网公司会主动找到“刷客”,让他们帮忙完成一定的注册量。这些刷出来的客户和流量数据,全是没有价值的垃圾数据,给大数据的采集和清洗工作带来了极大的困难,影响大数据的整体质量,从而影响营销的精准程度。

在互联网平台和“刷单人群”的反欺诈斗争中,精准营销的实现与大数据的质量息息相关。那么企业的营销费用带来了多少真正的流量?精准营销的转化率到底有多大?要提升企业大数据的质量,这需要企业建立自身的大数据管理系统,整合内部和外部的数据,同时与专业的“黑产”情报公司合作,获取手机“黑号”识别服务,从自身的企业大数据中剔除虚假数据。

二、企业的大数据建设

大数据精准营销要解决的首要问题是数据整合汇聚。企业目前运用大数据实现精准营销的一个重要挑战是数据的碎片化,即内部的管理信息系统各自为政。

(一)连接企业内部的数据孤岛

企业内部的管理信息系统和生产设备产生的运营数据都可以算作企业内部的大数据。管理信息系统的数据包括CRM的用户数据、传统的ERP数据、库存数据等;生产设备产生的数据包括呼叫记录、工业设备传感器信息、设备日志等。传统企业的内部数据所面临的最大问题是数据孤岛的问题。

数据孤岛是指企业内部的管理信息系统各自为政,各个部门之间的数据无法共享,因此每条业务线的数据库像孤岛一样不兼容,不能为企业的运营和决策提供实质性的帮助。数据孤岛主要有以下两种:

(1)逻辑性数据孤岛——公司内部各业务部门各自定义数据内容和结构,没有统一的数据标准,限制了跨部门的数据合作。

(2)物理性数据孤岛——数据在不同部门间独立存储,独立维护,彼此间相互孤立。

因此,许多公司内部的数据都是碎片化的信息,难以挖掘价值。面对这些静态、孤立的“原始”信息数据,企业信息部门只有将这些孤立且不兼容的数据库连接共享、统一数据标准,才能够进一步去分析和挖掘大数据的内在价值。

(二)寻求企业外部的大数据

社交和互联网数据就是企业外部的大数据,通常情况下属于结构化数据的内部数据占比为 20%,而外部的非结构化数据占比为 80%。企业的很多外部数据大部分都被BAT三家数据平台包揽,这三家互联网公司的数据质量都很高。从数据挖掘来看,腾讯和百度的大数据价值更大,但阿里的数据更容易变现。下面我们简单介绍一下这三家平台的数据特征(表 2.2)。

表2.2 企业外部大数据的特征

(三)企业内部和外部的大数据集成

数据孤岛的存在导致很多企业对数据的利用程度很低,只有财务经理会简单分析财务数据和报表,撰写财务报告给领导层汇报公司的整体经营情况,缺乏企业内部数据的管理和规划,缺少专业的数据挖掘人才。为此,需要打通企业内部的数据孤岛,实现企业内部数据的有效管理,整合企业外部的大数据资源,加快企业内外部的数据融合,保障数据安全,实现企业大数据的集成管理。阿里巴巴是怎么从一家电子商务平台向大数据科技公司转变的?

阿里巴巴作为一家大数据科技公司,在大数据的应用上已经取得了不少成果。它自己研发的互联网架构和软件、数据应用成就了“‘双十一’购物狂欢节”。在充分保证数据安全的前提下,深度应用了人工智能、机器学习、虚拟现实、云计算、移动互联网等技术,让电商平台能够精准地满足商家和消费者的需求。2017 年的“双十一”,天猫的销售额高达 1628 亿元,全天订单数达到 8.12 亿,支付宝的支付峰值已经达到 25.6 万笔/秒。大数据是阿里巴巴的底层基础,大数据也帮助阿里巴巴建造了世界上最大的零售平台。淘宝网大约有 30 亿个网店,10 亿件在线商品信息,平均每天数以千万计的订单和上千万次的用户搜索请求,而淘宝的网页浏览和商品搜索可以做到在 20.8 毫秒内响应。

阿里的数据工程师每天要处理百万级规模的离线数据。如何建设高效的数据模型和体系,避免重复建设,保证数据的规范性?如何做好数据质量保障?如何保证数据服务的稳定,保证其性能?如何设计有效的数据产品以服务于网店商家和公司内部员工?——企业应如何构建自己的大数据体系?

2013 年,阿里巴巴成立了大数据委员会,成员包括底层数据负责人、支付宝商业智能负责人、无线商业智能负责人和一名数据科学家。数据委员会主要以统筹和协调的方式来指导各个部门形成合力,实现从大数据管理到大数据应用的转变(表 2.3)。

表2.3 阿里巴巴的大数据建设之路

表2.3(续)

三、大数据库分析与挖掘

为了让数据发挥价值,企业应对大数据进行深入的挖掘和分析。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的真实数据中提取人们不知道的但又是潜在有用的信息和知识的过程。利用大数据的力量,我们可以直接得到答案,打破常规的逻辑思维定式,直接识别出用户的需求偏好(图 2.13)。

图2.13 医疗大数据的分析与挖掘

数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、建模分析处理,从中提取辅助商业决策的关键性数据。按企业既定业务目标,对大量的企业数据进行分析,揭示隐藏的、未知的或验证已知的规律。比如阿里巴巴针对消费者购物行为进行研究,并进行商品的个性化推荐(图 2.14)。

图2.14 大数据分析和挖掘的一般流程

目前数据挖掘方法主要有两类:一种是机器学习,如神经网络、决策树等;另一种是数理统计,如回归分析(多元回归)、判别分析(贝叶斯判别)、聚类分析(动态聚类)等。传统的大数据建模分析结果晦涩难懂,所以应当利用大数据可视化技术将复杂的大数据分析结果图像化,借助人脑的视觉思维能力,指导大数据分析和挖掘的方向,揭示出大量数据中隐含的规律和发展趋势,提高大数据的预测能力以实现精准营销。 /+Zdb3wkCzgxiZM29JDh2png//8UoLdFVsQb7vBdB6jpZzIy41/cmFRVUJmbtMwx

点击中间区域
呼出菜单
上一章
目录
下一章
×