



第一步,设置实体消解环境。本书使用Python和JupyterLab IDE。
首先,你需要在计算机上安装Python。如果你还没有安装Python,可以从Python官方网站下载(http://www.python.org)
。
Add Python to PATH
如果是首次安装Python,请确保勾选“Add Python to PATH”选项,这样就可以从命令行运行Python。
为了下载随书附带的源代码,最好使用Git。关于Git的安装指南,可以参考GitHub网站。
安装好Git后,就可以将本书附带的GitHub仓库复制到你的计算机上。在选择好的目录下,运行如下命令:
当前目录下,将创建名为 HandsOnEntityResolution 的子目录。
Python虚拟环境
建议读者使用Python虚拟环境完成书中的示例。这样就能使用必要的Python包,且不会干扰其他项目。在Git创建的 HandsOnEntity-Resolution 目录中,使用以下命令创建新环境:
运行以下命令激活虚拟环境:
激活虚拟环境后,命令提示符前会显示环境名前缀:
使用以下命令退出虚拟环境:
接着,切换到项目路径:
为了搭建JupyterLab代码环境以及所需的包,我们使用Python安装包中的包管理器pip。可以使用以下命令检查pip的版本:
然后用以下命令从 requirements.txt 文件安装本书所需的包:
接下来,为Notebook配置与虚拟环境关联的Python内核,以便使用:
然后,使用以下命令启动JupyterLab:
Jupyter简单易用,关于如何使用Jupyter的说明可参考文档 https://docs.jupyter.org/en/latest 。