如果数据源是文本文件,不论是CSV格式,还是其他格式,都可以使用Tableau连接并提取数据。
CSV格式文本文件,是各列以逗号分隔的文本文件。这种文件可以直接被当作数据库来处理,因此在数据连接和处理分析时很简单。
图3-15所示是“员工信息.csv”CSV文本文件,保存了员工的基本的信息,以逗号分隔各列数据。现在要利用Tableau对这个文本文件数据进行分析。
打开Tableau,选择左侧“连接”下的“文本文件”选项,如图3-16所示。
图3-15 “员工信息.csv”CSV文本文件
图3-16 “文本文件”选项
然后在文件夹中选择该文本文件,如图3-17所示。
图3-17 选择要连接的文本文件
单击“打开”按钮,得到如图3-18所示的结果。
图3-18 导入的文本文件数据
但是,这个结果是不对的,因为第一行本来是标题,结果被默认成了行数据,因此需要进行处理。方法是,单击顶部“员工信息.csv”表右边的下拉箭头(或者右击“员工信息.csv”表),展开菜单列表,选择“字段名称位于第一行中”选项,如图3-19所示。
图3-19 选择“字段名称位于第一行中”选项
这样,就得到了真正的表格标题,如图3-20所示。
图3-20 显示真正的标题
很多情况下,文本文件并不是CSV格式的,而是以其他符号分隔的,例如空格,制表符,竖线,等等,此时,可以很方便地连接获取数据。
图3-21所示是一个“员工信息.txt”文本文件,保存了员工的基本信息,并以竖线分隔各列数据。现在要利用Tableau对这个文本文件数据进行分析。
图3-21 以竖线分隔的“员工信息.txt”文本文件
打开Tableau,执行“文本文件”菜单命令,选择该文本文件,得到如图3-22所示的结果。默认情况下,Tableau认为文本文件的字段分隔符是逗号,而此文本文件的字段分隔符是垂直线,因此Tableau认为其是一列。
图3-22 连接的竖线分隔的文本文件数据
单击顶部“员工信息.txt”表右边的下拉箭头,或右击该表,展开命令列表,选择“文本文件属性”选项,如图3-23所示。
图3-23 选择“文本文件属性”选项
打开文本文件属性对话框,如图3-24所示,其中可以设置“字段分隔符”“文本限定符”“区域设置”等。
图3-24 文本文件属性对话框
在“字段分隔符”列表中选择“垂直条”选项,如图3-25所示。
图3-25 选择“垂直条”分隔符
然后关闭对话框,得到正确的数据表,如图3-26所示。
图3-26 得到的正确数据表
在“字段分隔符”列表中,可以根据实际情况选择相应的分隔符,或者使用自定义分隔符,以正确处理文本文件数据。