购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 Python是数据科学“大势所趋”

日常生活中丰富多彩的活动以各种形式被当作数据来收集整合。数据已经渗透到当今每一个行业和业务职能领域,并且正以一种难以想象的惊人速度不断膨胀。无可否认,在日新月异的现代社会,“大数据”时代已经悄然来临。由于数据在多个行业和学科领域中的高度渗透,并且在不同专业领域的数据研究中表现出高度融合的趋势,大数据已经成为包含计算机科学和统计学在内的多个学科领域的新研究方向。同时,由于在大数据方面的研究尚且存在诸多误区,人们迫切地需要对“大数据”时代的新现象、理论、方法、技术、工具和实践进行系统地研究。因而,“数据科学”应运而生。

为了全面了解数据科学的行业状况,2017年KaggIe(互联网上最著名的数据科学竞赛平台之一)首次进行了全行业调查。在超过16000名从业者的详尽答卷中,我们可以一窥目前业内的发展趋势。这些调查数据表明,在众多数据科学和机器学习的分析工具中,Python是数据科学家们最常用的语言,如图1-1-1所示。

图1-1-1 数据科学家们常用语言排名

Python是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。在使用中,Python主要具有以下优势。

(1)设计严格:可读性非常强、易于维护,并且受到大量用户的喜爱。

(2)库很丰富:能够广泛应用于各种问题的处理场景,并且可以节省编写底层代码的时间。

(3)免费开源:具有高度可移植属性,在各平台上都能顺利工作。

(4)可扩展性:能够调用C/C++的代码以实现快速运行或对算法的加密。

(5)可嵌入性:能够被集成到C/C++中,从而给程序用户提供脚本功能。

由于Python以“优雅”“明确”“简单”为设计哲学,阅读一个良好的Python程序就感觉像是在读英语一样,因此Python程序看上去简单易懂,对初学者非常友好。可见,使用Python作为数据科学的入门工具是非常不错的选择。图1-1-2展示了部分数据科学家认为应该选择的数据科学入门语言排名,Python以绝对优势占据第一。

图1-1-2 部分数据科学家认为应该选择的数据科学入门语言排名

看到这里,你心动了吗?是否想学习Python,好一展拳脚,“毕竟人生苦短,你需要Python”。在此还需要认识到一点,数据科学家的工作不是简单地使用某一种语言,而是在数据科学环境中,利用自己的数据思维来实现数据科学的实践。在进行Python的学习之前,最紧要的事情是构建能够让数据科学家轻松工作的数据科学环境。在这个环境中,可以轻松使用各种数据科学的工具,甚至畅游其中“无法自拔”。下面介绍Anaconda数据科学套件。 NJo7B+wQX0c/cfSqhCONG6uvYvlQprmCynlFdlpI5N0p/sWTAI/c80atbj0Qlojt

点击中间区域
呼出菜单
上一章
目录
下一章
×