BI要求运行速度快且容易扩展,为达到此性能,一个BI解决方案必须要有很多方法。为了有较快的速度,传统的商业智能平台需要将数据复制到BI系统中的专有格式中。如此,公司的分析人员,并不是在做数据分析,而是在数据间来回重组,从一种格式换到另一种格式。这样的结果就是,一个知识渊博的分析专员把他 80%的时间花在了移动和格式化数据上,而真正分析数据的时间却只占20%。
在Tableau中,用户访问数据只需指向数据源,确定要用的数据表和它们之间的关系,然后单击OK按钮进行连接就可以了。
Tableau顺应人的本能用可视化的方式处理数据,所以一个巨大的优势就是: 速度 。通过拖放的方式就可改变分析内容,单击一下突出显示,即可识别趋势。再单击一下就可以添加一个过滤器。你可以不停地变换角度来分析数据,直到你能深刻地理解数据为止。
如图3-2-1所示,将你的数据导入 Tableau 的高性能数据引擎,你将以惊人的速度处理你的数据。只需单击鼠标,无需任何编程,就可以完成对数据的分析。Tableau可以将几百万条数据,在你思考的瞬间就转变为你所想要的答案。Tableau 独特的Architecture-aware内存使用方式意味着,在较少的硬件上可以处理更多的数据。
图3-2-1 Tableau数据引擎
Tableau的可视化方法意味着用户思考的并不是如何来使用软件,而是在思考他们的问题和数据。极速BI是基于新一代的拖放可视化界面,速度快、容易使用,几乎任何一个用户都可以进行大范围的查询(验证用户界面最好的方法就是获取一个可用的试用版本,并实际使用一下)。
所以,在针对海量数据设计BI战略时,请考虑以下因素。
(1)充分利用当前商品硬件实现响应数百万行数据的即时查询
仅仅是使用普通笔记本电脑的最高级别内存层次结构和将所有数据到变成内存数据,数据库就能表现出性能优势。一个商业智能解决方案应能充分利用最新硬件和完整内存层次结构的性能,来帮助用户工作得更快,即使数据源缓慢也应如此。
(2)不能把可分析数据的大小限制在可用内存范围内
第一代“内存”的解决方案使得计算快很多,但代价是把可分析数据的大小限制在了可用内存范围内。极速Tableau代表着下一代内存解决方案:通过在不同时间使用不同层级的内存,使得客户可以充分利用每台PC的计算能力,而不用将可分析数据大小限制在内存许可的范围内。
(3)对于聚合或者汇总的查询量和预先计算没有要求
极速BI真正支持即时大型数据集查询,也就是说客户不用再预先决定采用哪种测量来聚合或查询了,只需要加载内存中的数据然后就可进行即时分析。