MySQL提供了大量的数据类型,为了优化存储、提高数据库性能,在任何情况下均应使用最精确的类型,即在所有可以表示该列值的类型中,选择存储量最少的那种类型。
如果不需要小数部分,就使用整数来保存数据;如果需要表示小数部分,就使用浮点数类型。对于浮点数据列,存入的数值会对该列定义的小数位进行四舍五入。例如,某列的值的范围为1~99999,若只需存储整数,则MEDIUMINT UNSIGNED是最好的类型;若需要存储小数,则使用FLOAT类型。
浮点类型包括FLOAT和DOUBLE类型。DOUBLE类型的精度比FLOAT类型的精度更高,因此当存储精度要求较高时,应选择DOUBLE类型。
浮点数FLOAT、DOUBLE相对于定点数DECIMAL的优势是:在长度一定的情况下,浮点数能表示更大的数据范围。由于浮点数容易产生误差,因此当对精确度要求比较高时,建议使用DECIMAL来存储。DECIMAL在MySQL中是以字符串存储的,用于定义货币等对精确度要求较高的数据。在数据迁移中,float(M,D)是非标准SQL定义,数据库迁移可能会出现问题,最好不要这样使用。另外,两个浮点数在进行减法和比较运算时也容易出问题,因此在进行计算的时候一定要小心。进行数值比较时,最好使用DECIMAL类型。
MySQL对于不同种类的日期和时间有很多数据类型,比如YEAR和TIME。如果只需要记录年份,则使用YEAR类型即可;如果只记录时间,则使用TIME类型。
如果同时需要记录日期和时间,则可以使用TIMESTAMP或者DATETIME类型。由于DATETIME的取值范围大于TIMESTAMP,因此存储范围较大的日期时最好使用DATETIME。
TIMESTAMP有一个DATETIME不具备的属性——默认情况下,当插入一条记录但没有指定TIMESTAMP这个列值时,MySQL会把TIMESTAMP列设为当前的时间。因此,当需要在插入记录的同时插入当前时间,使用TIMESTAMP会更方便。另外,TIMESTAMP在空间上比DATETIME更有效。
CHAR和VARCHAR的区别如下:
· CHAR是固定长度字符,VARCHAR是可变长度字符。
· CHAR会自动删除插入数据的尾部空格,VARCHAR不会删除插入数据的尾部空格。
· 因为CHAR是固定长度,所以它的处理速度比VARCHAR的要快,但也因此浪费了存储空间。对于存储量不大但在速度上有要求的字段,可以使用CHAR类型,反之可以使用VARCHAR类型。
存储引擎对于选择CHAR和VARCHAR的影响:
· 对于MyISAM存储引擎:最好使用固定长度的数据列代替可变长度的数据列。这样可以使整张表静态化,从而使数据检索更快,用空间换时间。
· 对于InnoDB存储引擎:最好使用可变长度的数据列。因为InnoDB数据表的存储格式不分固定长度和可变长度,所以使用CHAR不一定比使用VARCHAR更好,但由于VARCHAR是按照实际的长度存储的,比较节省空间,因此比较节省磁盘I/O和数据存储总量。
ENUM只能取单值,它的数据列表是一个枚举集合。它的合法取值列表最多允许有65535个成员。因此,在需要从多个值中选取一个时,可以使用ENUM。例如,性别字段适合定义为ENUM类型,每次只能从“男”或“女”中取一个值。
SET可取多值。它的合法取值列表最多允许有64个成员。空字符串也是一个合法的SET值。在需要取多个值的时候,适合使用SET类型,比如要存储一个人的兴趣爱好,最好使用SET类型。
ENUM和SET的值是以字符串形式出现的,但在MySQL内部,是以数值的形式存储它们的。
BLOB是二进制字符串,TEXT是非二进制字符串,两者均可存放大容量的信息。BLOB主要存储图片、音频信息等,而TEXT只能存储纯文本文件。