3.2 数据类型
Tableau支持字符串、日期/日期时间、数字和布尔数据类型。这些数据类型会以正确的方式自动进行处理。如果创建自己的计算字段,就需要注意如何在公式中使用和组合不同的数据类型,如不能将字符串与数字相加。此外,许多在定义计算时可供使用的函数仅适用于特定数据类型,如DATEPART()函数只能接受日期/日期时间数据类型作为参数。
3.2.1 主要的数据类型
图3-6 Tableau Desktop主要数据类型的图标
数据源中的所有字段都具有一种数据类型。数据类型反映了该字段中存储信息的种类,如整数、日期和字符串。字段的数据类型在“数据”窗格中由图标标识。Tableau Desktop主要数据类型的图标如图3-6所示。
下面介绍Tableau支持的数据类型。
1. 字符串(STRING)
字符串是由零个或更多字符组成的序列。例如,"Wisconsin""ID-44400"和"Tom Sawyer"都是字符串,字符串通过单引号或双引号进行识别。引号字符本身可以重复包含在字符串中,如"O''Hanrahan"。
2. 日期/日期时间(DATE/DATETIME)
日期或日期时间,如“January 23,1972”或“January 23,1972 12:32:00 AM”。如果要将以长型格式编写的日期解释为日期/日期时间,就要在两端放置#符号。例如,“January 23,1972”被视为字符串数据类型,而#January 23,1972#被视为日期/日期时间数据类型。
3. 数值型
Tableau中的数值可以为整数或浮点数。对于浮点数,聚合的结果可能并非总是完全符合预期。例如,可能发现SUM函数返回值为-1.42e-14,求和结果正好为0,出现这种情况的原因是数字以二进制格式存储,有时会以极高的精度级别舍入。
4. 布尔型(BOOLEAN)
包含TRUE或FALSE值的字段,当结果未知时会出现未知值。例如,表达式7>Null会生成未知值,自动转换为Null。
此外,还有地理型,可以根据需要将省市字段转换为具有经纬度坐标的字段。
3.2.2 更改数据类型
在日常工作中,Tableau可能会将字段标识为错误的数据类型。例如,可能会将包含日期的字段标识为整数而不是日期,可以在“数据源”页面上更改曾经作为原始数据源一部分的字段数据类型。
在“数据源”页面单击字段的字段类型图标,从下拉列表中选择一种新数据类型,如图3-7所示。
图3-7 在“数据源”页面更改数据类型
如果使用数据提取,就要确保在创建数据提取之前已经进行所有必要的数据类型更改,否则数据可能不准确。例如,Tableau把原始数据源中的浮点字段解释为整数,生成的浮点字段部分精度会被截断。
如果要在“数据”窗格中更改字段的数据类型,就要单击字段名称左侧的字段类型图标,然后从下拉列表中选择一种新数据类型,如图3-8所示。
图3-8 在“数据”窗格更改数据类型
若要在视图中更改字段的数据类型,则要在“数据”窗格中右击某个字段,选择“更改数据类型”,然后选择适当的数据类型,如图3-9所示。
此外,由于数据库中数据的精度比Tableau可以建模的精度高,因此将这些值添加到视图中时状态栏右侧将显示一个精度警告对话框。
图3-9 在“数据”视图更改数据类型