购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第1章
开启Python之旅

1.1 Python快速入门

1.1.1 Python进化史

Python由是荷兰人Guido van Rossum于1989年12月开发的一门解释型、面向对象、动态数据类型的高级编程语言,第1版发布于1991年。Python可应用于众多领域,例如Web开发、大数据处理、人工智能、自动化运维、爬虫、游戏开发、图像处理等。Python是目前最热门的编程语言之一。

Python具备可读性强、简洁、面向对象编程、免费和开源、丰富的库等众多优点,因而涌现了类似NumPy、Pandas、Seaborn、Matplotlib、Scikit-learn、BeautifulSoup、Flask、Django、OpenCV、openpyxl、xlwings等大量优秀的第三方库,其中Pandas在数据处理与分析方面功能十分强大与灵活,可以将其理解为Python中的Excel。

Python自发布以来,经历了1.x版本、2.x版本、3.x版本,本书所采用的是3.x版本。

1.1.2 搭建编程环境

Python是一门跨平台高级编程语言,它能运行在不同的操作系统中(例如Linux、macOS、Windows)。用户可以从Python官网(www.python.org)下载安装包,选择与现有操作系统对应的位数(例如Windows 11 64位)及最新的Python版本,然后单击下载链接。在下载完成之后,在系统上进行安装;在安装完成后,Python会自动安装一个IDLE(Python自带的交互式集成开发环境),用户可以在IDLE中进行代码编写。

但是这种安装比较复杂,在环境变量设置及在调试过程中对新手不够友好,所以本书不推荐使用此集成开发环境。本书所推荐的是Anaconda集成开发环境(IDE),Anaconda具有跨平台、包管理、环境管理的特点,很适合新手快速进行环境部署。

1.2 Anaconda下载与安装

1.2.1 下载Anaconda

从Anaconda官网可以下载Anaconda:

(1)打开浏览器并输入https://www.anaconda.com/,进入Anaconda官网。

(2)单击页面中的Download按钮,如图1-1所示。

图1-1 下载Anaconda(1)

(3)完成下载。下载需要一点时间才能完成,取决于你的网速,如图1-2所示。

图1-2 下载Anaconda(2)

1.2.2 安装Anaconda

单击已下载的Anaconda安装包,单击Next按钮,开始安装,如图1-3所示。

单击I Agree按钮,如图1-4所示。

此步骤可以不采用系统的推荐方式,而采用管理员权限来安装,选择All Users,单击Next按钮,如图1-5所示。

选择程序默认的安装目录或指定的安装目录,单击Next按钮,如图1-6所示。

系统默认的推荐项是Register Anaconda3 as the system Python 3.9,把Anaconda注册为系统的默认Python环境,如图1-7所示。

图1-3 安装Anaconda(1)

图1-4 安装Anaconda(2)

图1-5 安装Anaconda(3)

图1-6 安装Anaconda(4)

图1-7 安装Anaconda(5)

单击Install按钮进行安装。由于安装所需空间较大,所以安装需要一些时间,时间的长短取决于计算机配置,需要耐心等待,完成后如图1-8所示。

图1-8 安装Anaconda(6)

单击Next按钮,进入的界面如图1-9所示。

图1-9 安装Anaconda(7)

单击Next按钮,进入的界面如图1-10所示。取消复选框内的勾选,单击Finish按钮,完成安装。

图1-10 安装Anaconda(8)

1.2.3 使用Anaconda

完成以上Anaconda安装后,通过Windows左下角的“开始”菜单栏查看并使用Anaconda,如图1-11所示。

图1-11 使用Anaconda(1)

在Anaconda中,进入IDE的方式有两种。一种是通过菜单栏中的图标或Anaconda Navigator方式;另一种是通过Anaconda Prompt方式。二者的区别在于:相同的需求,不同的实现方式。通过菜单栏图标或Anaconda Navigator是以图形化方式进入,Prompt是通过输入相关命令行的方式进行。

以运行Jupyter Notebook为例。在菜单栏中选择Jupyter Notebook或Anaconda Navigator进入其主界面,然后单击Jupyter Notebook下方的Launch按钮,进入Jupyter Notebook,如图1-12所示。

图1-12 使用Anaconda(2)

也可以在Anaconda PowerShell Prompt或Anaconda Prompt中输入jupyter notebook进入其主界面。Anaconda PowerShell Prompt与Anaconda Prompt的区别在于PowerShell支持的命令更多。输入提示符jupyter notebook,如图1-13和图1-14所示。

图1-13 使用Anaconda(3)

图1-14 使用Anaconda(4)

单击Anaconda Navigator中的Launch按钮或在输入prompt提示符命令语句后按Enter键,进入Jupyter Notebook主界面,如图1-15所示。

图1-15 使用Anaconda(5)

如果准备采用的是Spyder,则同样可以采用Navigator或Prompt两种方式,其启动操作步骤与Jupyter Notebook相同。本书第1~7章采用的Jupyter Notebook进行演示,第8~11章采用的是Spyder进行数据分析,当然这些代码同样可以在Jupyter Notebook进行。Jupyter Notebook文件的后缀为.ipynb,Spyder文件的后缀为.py。在Jupyter Notebook中,可通过File→Download as→Python(.py)将.ipynb格式转存为.py格式。

以Prompt方式启动Spyder为例,输入提示符spyder,如图1-16所示。

图1-16 使用Anaconda(6)

1.3 Jupyter Notebook

Jupyter脱胎于IPython(Interactive Python,交互式Python),是Julia、Python及R语言的组合,Jupyter不仅支持Python,目前它所能支持运行的编程语言已达40多种。Jupyter具备“所见即所得,语法高亮、Tab补全,支持Markdown、数学公式编写,允许导出为HTML和PDF”等优点。

1.3.1 操作界面

1.新建笔记本

在Jupyter Notebook主界面的右上角,选择New→Python 3(ipykernel),用于新建Notebook(笔记本),如图1-17所示。

新建的Notebook(笔记本)如图1-18所示。

图1-17 新建笔记本(1)

图1-18 新建笔记本(2)

图1-18中,Untitled1是Notebook的名称,可以通过双击后进行更改。

2.界面构成

Notebook的界面主要由标题栏、菜单栏、工具栏、单元格组成,如图1-19所示。

3.菜单栏

菜单栏由File、Edit、View、Insert、Cell、Kernel、Widgets、Help这9个菜单组成。File菜单主要用于文件的保存与新建,Edit菜单主要用于编辑单元格,View菜单主要用于标题栏、工具栏、单元格相关项的显示与隐藏,Insert主要用于插入单元格,Cell主要用于运行代码单元格,Kernel主要用于运行Python代码,Widgets主要用于增强交互功能,Help主要用于帮助文档的链接。

图1-19 Jupyter Notebook界面说明

4.工具栏

Jupyter Notebook中常用工具栏及说明,如图1-20所示。

图1-20 Jupyter Notebook中常用工具栏及说明

5.代码单元格

Notebook文档是由一系列单元(Cell)构成的,主要有两种形式的单元。

(1)代码单元。用于编写代码,按Shift+Enter键运行代码,其结果显示在本单元下方。

(2)序列标志。In[]:这样的序列标记,方便人们查看代码的执行次序。

1.3.2 Code运行模式

Jupyter Notebook命令运行模式(代码模式)的4种特征:绿色边框、闪动的光标、代码(下拉菜单)、铅笔图标,如图1-21所示。

图1-21 Jupyter Notebook命令运行模式(1)

在代码单元格输入以下代码:

    import numpy as np
    import pandas as pd

单击工具栏“运行”按钮或按住Shift+Enter键,单元格左侧的[]会先变为[∗]再变为[<num>]。[]:表示运行前,[∗]:表示运行中,[<num>]:表示已运行结束,<num>代表的是运行结束后当前单元格[]所显示的数字。运行后如图1-22所示。

图1-22 Jupyter Notebook命令运行模式(2)

[∗]运行后会产生3种可能的结果:

(1)报错,会出现一串提示。

(2)运行正常,但无法看到结果。

(3)运行正常,可以看到运行结果。

报错举例:print(1+"2"),如图1-23所示。

图1-23 Jupyter Notebook报错提示

如果有对变量进行赋值的代码,运行结束后,意味着变量已被存入内存,则此变量可以在后面直接调用。这是Jupyter强于其他解释器的地方,示例代码如下:

    a = 3
    b = 2+a
    b

结果为5,如图1-24所示。

图1-24 Jupyter Notebook的运行结果

如果需要重新运行Notebook中的所有代码,则可单击工具栏的双三角形(►►)或通过菜单工具栏Kernel→Restart & run all,在弹出的确认对话框中,单击“重启并运行所有代码块”按钮,如图1-25所示。

注意: 后续第1~7章的代码都是以Jupyter Notebook演示为主,其中In[]:单元格内,代表的是代码的输入,Out[]:代表的是代码的输出。若采用Spyder或PyCharm等编译代码,则在所有显示输出的部分,可能需要在外面套上print()才可以得到Jupyter Notebook中显示的结果。

图1-25 重启并运行Jupyter Notebook的所有代码块

1.3.3 Markdown模式

单击下拉菜单,选择Markdown。Markdown模式的几个特征如图1-26所示。

图1-26 Markdown模式(1)

Markdown单元支持对文本进行编辑。采用Markdown的语法规范,可以设置文本格式、插入链接、图片及数学公式。同样使用Shift+Enter运行Markdown单元来显示格式化的文本。在单元格外面单击,进入蓝框,然后按下M键;或者在工具栏菜单中选择Markdown。在单元格输入print(1+2),对比前后的效果,如图1-27所示。

图1-27 Markdown模式(2)

在Markdown模式下,文本字符串末尾的空格会影响显示的结果,如图1-28所示。

图1-28 Markdown模式(3)

1.3.4 常用快捷键

在Markdown模式下,按下H键,查看所有快捷键,如图1-29所示。

图1-29 常用快捷键

Jupyter Notebook常用快捷键见表1-1。

表1-1 Jupyter Notebook常用快捷键

1.3.5 常用魔法命令

%,%%,称为魔术关键字(Magic Keywords),是用于控制Notebook的特殊命令。以下是Jupyter Notebook中较常用的几个魔法命令。

(1)%timeit:获取代码的运行时间。

(2)%ls:获取当前目录下所有的文件内容。

(3)%matplotlib inline:在文档中嵌入Matplotlib生成的图形。注意:如果用了这个魔法函数,则可以在代码中省略plt.show()。

(4)%run:运行“.py”格式的Python文件。

(5)%load:用外部脚本替换当前单元格。

(6)%pwd:获取当前目录。 /229ZN++pOm9wta87h3LXjVm8i2pW8vReoVxaJfWhNC+QRjp/ECTx5euNMJGNaK9

点击中间区域
呼出菜单
上一章
目录
下一章
×