首先,我们探讨为什么在那么多可选的可视化工具中选择Power BI作为可视化工具?截至2021年,微软已经连续14年被加德纳(Gartner)定位为年分析和商业智能平台魔力象限的领导者,且在过去连续三年位于全象限“状元”位置,图2.1.1为2021年加德纳发布的结果,Power BI作为一款新的BI工具,助力微软获此殊荣可谓功不可没。
图2.1.1
如表2.1.1所示,虽然对比R、Python这些可视化分析工具,Power BI仍然属于“小众”,但其增长趋势不可忽视。如果你还没有听说过Power BI,那么可以暂时将其理解为一个升级版的Excel工具,尽管这样的类比不太准确。世界上不存在十全十美的工具,笔者针对目前几款可视化分析主流工具,对其主要特性做出了评估,见表2.1.1(得分越高越优秀)。对比Excel,Power BI的交互性与生态集成更完备。对比Tableau,Power BI的费用与生态集成更有优势。对比Python、R,Power BI在低代码与交互性方面都有明显优势。从综合得分角度而言,Power BI算得上是一款非常接地气的可视化工具,你越了解Power BI,那么你越会对Power BI的可视化功能赞不绝口。
表2.1.1
Power BI是由一系列的组件和工具组成的,分别为Power BI Desktop(桌面应用)、Power BI Service(在线应用)与Power BI Mobile(移动应用),见图2.1.2。
图2.1.2
若将Power BI Desktop用作可视化设计工具,则可视化效果为所见即所得。设计完成的报表可发布至Power BI Service中,你可以在该应用中设计报表分享形式与权限设置。你也可以通过移动设备端访问Power BI移动应用中的内容,见图2.1.3。
图2.1.3
Power BI Desktop为免费桌面应用,Power BI Service为云端SaaS服务,用户注册后可自动获得Free许可,也可付费获得Pro许可(发布与分享用),Power BI Mobile为免费手机应用。本书的可视化内容将大部分使用Power BI Desktop作为演示工具,图2.1.4为Power BI Desktop开发示例。
图2.1.4
虽然Power BI在数据可视化分析方面十分强大,但它也不是万能的。例如,Power BI本身并非是编程工具,并不适合处理作业型任务,在这方面Python是更佳的选择。在处理非结构化数据方面,Power BI的灵活性不如Excel。例如图2.1.5是Excel表格中常见的表达方式,但Power BI却不善于处理这类的布局,“剩余”本身不属于消费类别,只因为阅读习惯,我们在将这类数据归为非结构化数据。因此,在Power BI中,需要进行一系列的复杂转换才能实现这样的效果。
图2.1.5
在开发Power BI报表时,业务甲方人员往往会因为不了解Power BI的特性,倾向于用Excel方式思考Power BI方案,而你越能理解甲方的最终目的,就越能明白如何向正确的方向去引导思路。有时即使Power BI能实现同样的计算逻辑,只不过可视化的样式有所不同,用户还是会觉得难以接受,维持原有的Excel风格。在这种情况下,建议采用Analyse In Excel功能,直接读取Power BI在线数据集,再进行透视表的创建,当然这样意味放弃着一些Power BI主要功能,你应提供利害比较供甲方有关人员参考。
总之,作为数据可视化专家,你的价值在于正确地理解需求并尝试用最适合的方式去实现需求,你应该有自信地提出自己的专业意见。如果你之前并没有这种尝试,则便会感觉走出了舒适区。但随着项目的推移,你会发现逃避尝试的成本会越来越高,因为错误的期望会导致错误的结果。
可视化内容是指对数据可视化可行性分析的过程。人们也许会认为业务甲方提出的需求都是合理的,所有可视化内容由受众决定,而你只是负责去实现需求即可,但这样的结论过于将问题简单化。实际上,作为数据可视化专业知识背景的你,不仅只是忠实地履行甲方的需求,而更应该帮助甲方去以更合适的方式去实现可视化。