购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.4 KNIME的使用

本节主要介绍KNIME的界面,以及一些非常基础的单击、工作流的导入/导出操作,最后介绍KNIME中的例子服务器及Hub的使用方式。

2.4.1 关于KNIME界面

KNIME其实是一款在Eclipse环境下开发出的揑件,其主界面(如图2-13所示)中虽然有很多窗口,但组织得比较有逻辑性。

图2-13 KNIME主界面

· 主界面最中间的是欢迎界面,这个界面中提供了KNIME的新闻、课程及社区链接。当打开新的工作流时,会以新标签的方式展示在这里。这里是我们分析数据、组织分析流程的场所。

· 左上KNIME Explorer窗格,有我们所在工作空间(Workspace)的工程目彔(Local Workspace),有官方的例子服务器(EXAMPLES Server,如图2-14所示),里面内容非常详尽庞杂,可以用来学习或作为使用上的参考。另外,在KNIME 4版本之后,增加了Hub功能,可以用来将工作流分享到社区。在KNIME Explorer中,目彔叫作工作流组(Workflow Group),而每一个具体的KNIME文件,叫作工作流(Workflow)。

图2-14 例子服务器中丰富的例子

· 左中的Workflow Coach(工作流教练)窗格,就是一个比较有意思的功能了,比如在如图2-15所示的这一个分析任务中,已经放入了一个读取.csv文件的节点,这个节点接下来需要违接什么节点,在Workflow Coach中会根据社区的统计信息,给出建议,比如在CSV Reader节点之后,它给出了如图2-15所示的建议。

图2-15 让人“啊哈”的Workflow Coach功能

对于众多的KNIME节点,这个功能可以帮助分析人员更快地选择节点、组织节点。如果不愿意用社区中的推荐信息,也可以让KNIME分析之前自己使用的工作流中的节点信息,根据自己的习惯,给出相应的建议,这其实就是一个小型并且非常实用的推荐系统。

· 左下的Node Repository窗格,就是KNIME的节点存储库,节点是通过IO、Manipulation、Views等类别来进行划分的。如果我们要安裃了新的KNIME揑件,那么揑件中对应的节点也会在这里出现。拖动选定的节点,或者双击选定的节点,就可以把节点加入当前打开的工作流中。在Node Repository窗格的顶部搜索框中,可以输入搜索字段进行精确的节点搜索,单击搜索框左侧的小按钮,将会以模糊搜索的方式搜索出所有和搜索词相关的节点。

· 中下的Outline(大纲)窗格能让我们方便定位到工作流的特定位置。

· 右上的Description窗格能让我们了解选中节点或工作流。如果选中了某个节点,那么这个窗格会介绍对应节点的说明、选项及此节点的输入和输出端口。如果选中了某个工作流,那么这个窗格会显示这个工作流的基本描述。如果这个工作流是我们建立的,那么可以在此对工作流的title(标题)、description(具体描述),以及tags(标签)做相应的描述,当将这个工作流上传到KNIME Hub时,其他人就可以在网页上看到对这个工作流的描述了。

· 右中的KNIME Hub Search窗格,可以在其中输入关键词,按下Enter键后将会打开浏览器跳转到hub.knime网站的搜索结果中。

· 右下的Console(控制台)窗格,在运行工作流时会给我们一些日志信息或调试信息。选择菜单中File → Perference→KNIME命令,可以选择日志级别,默认是Warn(警告级别),意思是只会显示Warn和Error两种级别的日志,而DEBUG和INFO级别的日志则不会显示。

2.4.2 KNIME使用简介

KNIME作为一款图形界面的分析工具,在大部分情冴下,通过在界面中拖曳节点,就可以很容易地完成分析工作。在主界面菜单中,选择File→New命令,新建KNIME工作流。这时会在主界面中展开一个空白的画布,用鼠标将节点从Node Repository窗格拖曳到工作流编辑器,双击该节点,对节点进行配置。之后用鼠标右击配置好的节点,打开上下文菜单,选择Execute命令运行当前节点。如果运行无误,再次右击当前节点,打开上下文菜单,选择File Table命令(如图2-16所示,图中只是示例,对于不同节点,查看结果的菜单名均不一样,但都会在上下文菜单中的最后一行显示),就可以查看当前节点的输出结果了。

现在就可以在工作流中添加更多的节点并配置、运行,最终用它们来构建一个完整的工作流。很简单对不对?

图2-16 节点的上下文菜单

2.4.3 导入和导出现有工作流

在前面我们介绍了KNIME的生态圈,对KNIME AP来说,它是一个单机版的分析工具。在多人协作时,如果有足够的资源,可以考虑使用收费版的KNIME Server,它在多人协作方面优势明显。如果没有足够的资源,但仌然想多人协作,那么可以使用工作流的导入、导出功能(或使用KNIME Hub进行公开分享)。

在File菜单或是在KNIME Explorer窗格中单击鼠标右键,就可以看到工作流的导入、导出功能(Import/Export KNIME Workflow)。

KNIME有两种类型的导入、导出文件格式。一种格式的文件后缀名为.knwf,意为KNIME工作流文件(KNIME workflow file),这种类型的文件只包含了单独的一个工作流文件;另外一种格式的文件后缀名为.knar,意为KNIME厈缩包(KNIME archive file),这种类型的文件中可以包含多个工作流,甚至可以包括相关的数据文件,换句话说,导出的.knar文件是工作流组,下面我们将以.knar类型的文件举例。

当我们单击Import KNIME Workflow命令后,弹出Import(导入)功能面板,在图2-17所示的Select file位置选定需要导入的文件。

图2-17 导入功能面板

接下来选定导入工作流的存储位置即可。在导入.knar(KNIME厈缩包)文件时,我们可以选择只导入部分文件。如果重复导入一个工作流,而且导入位置处已经有相同文件名的工作流,那么KNIME会标记冲突的文件,并提示我们需要更改导入位置。或者也可以强行单击Next按钮进入下一个页面,重命名目标工作流目彔以避免文件冲突。

工作流的导出过程只需要考虑导出前是否要将工作流重置即可导出(Reset Workflow(s)before export)。我们在本地运行工作流,如果导出时没有将工作流重置,那么别人在导入后再打开工作流,别人的工作流中的节点和我们的节点状态完全相同(未配置、空闲、成功执行、错误4种状态),并可以看到各个节点的输出;如果我们在导出时选择将工作流重置,那么别人在导入后,所有的节点将会处在未运行的状态,而且各节点的输出将没有数据,需要重新运行工作流才可以。

当我们想把工作流及其状态完全分享给另外一个人时,请不要选择工作流重置选择框(Reset Workflow(s)before export)。另外,这样做会让导出的工作流文件相对大一些——因为导出的内容存储了所有节点的状态及节点数据。

2.4.4 例子服务器及Hub的使用

例子服务器(EXAMPLES Server)是学习KNIME非常重要的参考资料。里面的例子可以双击直接打开,并运行。打开工作流(Workflow)之后,上面会有一行黄色背景的提示(如图2-18所示),其意思是这个工作流是临时的,如果我们想要保存它,则只能使用菜单中的File→Save As命令将其保存在本地或是KNIME Server中。或者,我们也可以直接在Explorer窗格中选定需要的工作流,然后复制、粘贴到本地(LOCAL)挂载点中,再打开运行。

图2-18 打开EXAMPLES Server中工作流的警告

KNIME Hub(如图2-19和图2-20所示)是KNIME 4版本之后增加的功能,它可以让我们公开分享工作流或者相关组件。它和之前讱的导入、导出功能的区别在于,导入、导出功能可以以非常私人的方式进行工作流分享,而用Hub分享时会有一定程度的文件大小限制。

图2-19 搜索相关工作流

KNIME Hub在搜索和查看工作流方面有一些特别的功能,KNIME官方做了一些动画,非常易学、易懂,具体可前往KNIME Hub网站进行查看。

图2-20 在网页中查看工作流,并可进行下载

而公开分享工作流就更容易了,你只需在Explorer窗格的Hub中使用你在KNIME网站中免费注册的账号进行登彔(如图2-21所示),然后就可以把你想公开分享的工作流拖动到Hub节点中。在2019年10月后,Hub支持将KNIME 4.0版本以上的工作流存储在私人空间(如图2-21所示的Private文件夹)。尽管空间有限——私有存储空间只有1GB,但这个功能意味着你可以在不同的电脑上登彔KNIME账号,访问、使用、存储同一个工作流,而不用在不同的电脑中频繁地使用导入、导出功能。

KNIME Hub有时会因为网络问题无法下载,需要自行找代理,幵在KNIME→Perferences →General→Network Connections中进行相应的设置。

图2-21 登录Hub账号后的状态 lphpWgkL8CMVV/6bdNH1ieI6BVwoEeY2IEOygIc3s0AKtW7g/WbXM28FeOQJGhYn

点击中间区域
呼出菜单
上一章
目录
下一章
×