购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

任务1.2
配置Kettle运行环境

任务描述

Kettle是一款纯Java编写的开源ETL工具,需要在Java运行环境下才能正常使用。此外,由于Kettle本身并不具有数据存储系统,所以需要配合MySQL数据库才能够更好地存储相关资源与数据。为了成功启动Kettle工具,需要配置完整的Kettle运行环境,下载Java JDK工具包、MySQL安装包和Kettle工具包,并按照步骤进行安装。

任务分析

(1)安装Java JDK工具包。

(2)配置Java环境变量。

(3)安装MySQL数据库。

(4)安装Kettle和配置运行环境。

(5)启动Kettle工具。

1.2.1 安装JDK

JDK是Java的开发编译环境,JDK包含了很多类库,即Jar包,还有JRE(Java运行环境)、JVM(Java虚拟机)。JDK是Java语言开发的基础工具包,是Java程序运行的基础,也是各种IDE开发环境的基础。

1.下载并安装JDK工具包

在JDK官网下载JDK。考虑到适用性和稳定性,建议读者下载最新的版本。本书使用的JDK安装包版本是jdk-8u221-windows-x64.exe。

JDK下载完成后,双击下载的EXE文件,开始安装JDK。有关JDK的安装过程,可以参考有关JDK安装操作指南。安装时,可以修改安装JDK的目录,如“D:\jdk1.8.0_221”。

2.设置环境变量

安装好JDK后,开始配置Java的环境变量。环境变量的作用是让操作系统知道执行程序和执行程序的位置,方便运行执行程序。由于Windows操作系统版本不同,所以环境变量的设置略有不同。以Windows 7为例,双击桌面上的【计算机】图标,在弹出的【计算机】对话框中,依次单击【系统属性】→【环境变量】,即可开始配置。

(1)新建并设置JAVA_HOME环境变量。将JAVA_HOME设置为Java JDK的安装路径,如图1-1所示。

图1-1 设置JAVA_HOME环境变量

(2)修改Path环境变量。Path环境变量中记录的是如.exe等可执行文件的路径。对于可执行文件,系统先在当前路径中去找,如果没有找到,再去Path环境变量中查找。修改Path环境变量的方法是将值“;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;”添加至当前Path环境变量值的后面,如图1-2所示。

(3)设置CLASSPATH环境变量。CLASSPATH环境变量的作用是保证Java的class文件可以在任意目录下运行,若Java JDK的版本在1.7以上,则不需要设置CLASSPATH环境变量。CLASSPATH环境变量的设置方法是将CLASSPATH环境变量设置为“;%JAVA_HOME%\bin;%JAVA_HOME %\lib\dt.jar;%JAVA_HOME%\lib\tools.jar”,如图1-3所示。

图1-2 修改Path环境变量

图1-3 设置CLASSPATH环境变量

成功安装Java JDK并设置环境变量后,在命令行状态下,输入java-version,将会显示出Java的版本号等信息,表示成功安装Java JDK工具包,如图1-4所示。

图1-4 成功安装Java JDK工具包信息

1.2.2 安装MySQL数据库

MySQL是最流行的关系型数据库之一,所使用的SQL语言是访问数据库的最常用标准化语言。由于MySQL的体量小、速度快、总体拥有成本低,尤其是开放源码的特点,所以一般计算机开发者和中小企业开发都选择MySQL数据库作为开发项目的数据库。

1.下载MySQL数据库安装包并安装

在MySQL官网下载MySQL数据库安装包。MySQL数据库有多个版本,当前(2020年2月)最新为8.0.19版本,如图1-5所示。由于MySQL 8.x的版本加密方式和其他一些用法与MySQL 5.x有所不同,所以比较成熟、使用较多的是5.5、5.6或5.7版本,读者可根据自己的实际情况下载有关版本。MySQL数据库的安装软件有安装包和解压包两种方式,建议下载安装包,如mysql-8.0.19-winx64.msi安装包。

图1-5 MySQL数据库下载网址和页面

MySQL数据库安装包下载完成后,双击下载的安装包文件即可开始安装,有关MySQL数据库的安装过程可参考有关MySQL数据库安装操作指南。在安装过程中,由于数据库需要存储数据,所以建议不要安装在C盘上,而是安装在其他盘上,并且需要设置好MySQL数据库的用户和密码,如将用户和密码分别设为“root”和“123”。

2.MySQL启动

安装好MySQL数据库后,系统自动在Windows开始菜单中建立MySQL数据库菜单,本书中有关数据库实例使用的是MySQL 5.5数据库。MySQL 5.5数据库在Windows开始菜单中的显示如图1-6所示。

图1-6 MySQL数据库菜单

单击图1-6所示的【MySQL 5.5 Command Line Client】选项,弹出MySQL数据库的命令行客户端,如图1-7所示,表示MySQL数据库已成功安装,此时可以创建数据库、输入有关SQL命令进行有关数据库的操作。

图1-7 MySQL命令行客户端

由于在命令行客户端中,需要键盘输入有关SQL命令,才能进行数据库操作,建议读者下载并安装一个图形界面的数据库管理工具,如Navicat。Navicat是一个连接多种数据库的管理工具,可以连接MySQL、Oracle、PostgreSQL、SQLite、SQL Server和MariaDB等数据库,方便管理不同类型的数据库。Navicat容易学习,使用简单,具有完备的图形用户界面(GUI),可以安全、简便地创建、组织、访问和共享有关数据库。

1.2.3 配置Kettle

配置Kettle包括安装Kettle,配置与数据库连接的Jar包,启动Kettle等。

1.安装Kettle软件

Kettle软件的安装过程分为下载安装Kettle工具软件和下载MySQL数据库连接Java包两部分内容,具体如下。

(1)下载和安装Kettle工具软件

在Kettle官方网站搜索Kettle工具包的下载链接,单击链接即可打开网页下载。当前(2020年5月)最新的Kettle工具包为pdi-ce-9.0.0.0-423.zip,读者也可以下载之前的版本。

Kettle工具包是一个ZIP压缩包,因为Kettle工具是绿色软件,无须安装,所以下载完成后,使用解压软件,将Kettle工具解压到计算机的文件夹下即可。对于Kettle工具包的解压路径,同样建议不要解压至操作系统所在的C盘上,例如,可将Kettle工具包解压至D盘,Kettle的文件夹为“D:\data-integration”。

(2)下载MySQL数据库连接Java包

下载MySQL数据库连接mysql-connector-java-5.1.47.jar包。下载完成后,将其复制至Kettle解压安装的路径下的lib文件夹下,例如,将该Jar包复制至“D:\data-integration\lib”文件夹下。

2.启动Kettle软件

在Kettle解压安装的文件夹中,选择并双击Spoon.bat批处理文件,如图1-8所示,即可启动Kettle软件。

图1-8 启动Kettle软件 Ot9oWrDU22ThjHVJ8CRTWArje1ZvFi+XXFs+Zxrh8e5UeglkRvuxV6YypN+NFsQC

点击中间区域
呼出菜单
上一章
目录
下一章
×