购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

什么是大数据

阿里小贷针对众多的贷款申请者建立了一个“草根”征信系统。全国4 200万小微企业中,超过800万家在阿里巴巴平台上进行买卖,支付宝沉淀了庞大的后台数据,这个“草根”征信系统因此极富价值,可以为信贷业务提供强大支持。有电子商务资深专家表示:“阿里巴巴不但掌握网商的资金流动数据,还了解它们的整个运营细节,包括企业订单数量、销售增长、仓储周转以及投诉情况等,这让阿里巴巴比任何一个金融机构都更了解小微企业客户。”

到底什么叫大数据呢?大数据就是人类社会的各种行为进行数字化后产生的海量数据集,基于大数据的各种分析,可以寻找人类社会的规律。

最早提出“大数据”概念的机构是全球知名咨询公司麦肯锡。麦肯锡在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素,人们对海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。

麦肯锡的报告发布后,大数据迅速成为计算机行业争相传诵的热门概念,也引起了金融界的高度关注。随着互联网技术的不断发展,数据本身是资产,这一点在业界已经形成共识。如果说云计算为数据资产提供了保管、访问的场所和渠道,那么如何盘活数据资产,使其为国家治理、企业决策乃至个人生活服务,则是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。

我们平时的消费,比如买房子、买车,到商场买东西,很多是刷卡,刷卡之后就有消费记录;我们的资产,比如房产、工资等也有记录。根据这些记录可以判断出两个东西:第一是有没有还款能力,第二是有没有还款意愿。贷款业务中最根本的就这两个东西。有一句话叫“银行是晴天送伞、雨天收伞的机构,嫌贫爱富的”。为什么银行那么喜欢富人:第一富人有还款能力,第二他有还款意愿。

淘宝有一套完整的信用体系,淘宝商家可以从最低的一钻做到皇冠、金冠,这些高等级的商家就是信用比较好的借款人。这些商家是有还款意愿的,因为只要有一次不还款,信用等级就会被降,甚至会有店被封的后果,花了三五年才做到的规模,有必要为贪淘宝这一点钱不还款吗?还款意愿来自于投入,这是经济学中的一个最基本的原理:投入得越多,就越不会背叛。

店家如果在淘宝上做了多年,有了足够的信誉度,不值得为贪这一点点钱放弃信用,所以这就解决了道德风险问题。第二个问题还要看有没有还款能力,淘宝上几乎所有的交易都通过支付宝进行。我缺钱要贷款,但是货都卖出去了,客户的钱都已经打到支付宝里,只是还没到账,这时候淘宝后台数据一检索发现原来你是有钱的,只是短期缺钱,可以暂时放给你。所以阿里小贷的信用分析是基于大数据的。

大数据挖掘技术

淘宝的后台数据库中有淘宝所有的交易记录,做信用分析的时候用到数据挖掘技术。大数据是产业界的一个名词,实际上在学术界这门学科存在了很多年,叫做数据挖掘。下面我们用一个案例说明数据挖掘的原理。

数据挖掘的历史上有一个很有趣的关于啤酒和尿布的故事。说的是美国一个大商场,通过数据挖掘发现美国的男人在买啤酒的同时也会买尿布,大家觉得很奇怪,因为按正常的理解,买啤酒之后应该买面包或者买零食啊,为什么会买尿布呢?后来商家跟踪分析发现原来美国男人是被老婆差来买尿布的,买完尿布之后,他就顺手拎一瓶啤酒回家。

然后商家就调整把啤酒跟尿布摆在一块儿,这样使得有潜在消费意愿的客户被激发产生真实消费,啤酒的销售量提升了不少。现在很多超市里面商品之间的互相搭配都是有数据分析做支撑的,通过数据分析发现消费之间有促进作用,这就是数据挖掘在超市中的应用。

这种数据挖掘技术叫做频繁模式。频繁模式主要考虑两个因素:一是这样的行为是不是会经常发生;二是这些行为之间成功的概率是多少。以上述啤酒和尿布为例,如果整个商场的交易中该现象只有万分之一,就没有意义,若到了5%就有意义了。第二个因素是说啤酒和尿布之间有多大的关联度,比如有 90%的男人买了尿布之后会买啤酒,这就有意义;如果只有20%的男人买了尿布之后买啤酒,这样就没有意义。综上,频繁模式的两个最关键指标是出现的频率和关联的概率。这个东西怎么用于阿里小贷的信用分析呢?

第一,好的公司、好的商家一般都会有一些共同的特征,就像我们平时说的,屌丝有屌丝的气息,高富帅有高富帅的气息,这些完全可以通过数据分析得出。比如好的公司的交易量会比较大,客服应答的速度很快,商品的上架、下架的周转率高,后台数据分析发现这些特征后,就可以知道这是一家好店,可以给它放贷。

第二,一些恶意客户的生意不好了,准备把店卖掉,在此之前贷一笔钱,然后跑路。恶意客户做这种事情前肯定会有一些蛛丝马迹,比如他会把货品大量清仓,或者用淘宝旺旺聊转让店铺的事,即会出现一个频繁模式,根据后台数据分析可以判断出这个客户可能会有问题。一旦出现这种情况,可以将其列入黑名单,或者将其贷款额度降低。骗子的骗术一般有着共性,人工一个个地看肯定来不及,但是利用计算机能够识别出。这是阿里小贷最核心的技术,是它为什么敢做信用贷款的原因,因为有大数据做支撑。

马云一直在说未来阿里最关键的东西就是大数据。没有大数据做支撑,就没有18%的收益率,其他的诸如余额宝、资产证券化之类的都没有意义,大数据是阿里金融的基石。 r+Jk3ArwgNqGbyax2ArMhUZDSJ+wTua8VuS2DFl6w5wv6Gb/jQDmkuqaKHYTD4Tm

点击中间区域
呼出菜单
上一章
目录
下一章
×