在 MySQL 中的 NULL 是一种特殊的数据。一个字段是否允许为 NULL,字段默认值是否为 NULL。
NULL 本身是一个特殊值,MySQL 采用特殊的方法来处理 NULL 值。从理解肉眼判断,操作符运算等操作上,可能和我们预期的效果不一致。可能会给我们项目上的操作不符合预期。
你必须要使用 IS NULL / IS NOT NULL 这种与普通 SQL 大相径庭的方式去处理 NULL。
尽管在存储空间上,在索引性能上可能并不比空值差,但是为了避免其身上特殊性,给项目带来不确定因素,因此建议默认值不要使用 NULL。如果字段是int类型,默认为0,如果是varchar类型,默认值用空字符串(’’)会更好一些。
1. NULL 与空字符存储上的区别
表中如果允许字段为 NULL,会为每行记录分配 NULL 标志位。NULL 除了在每行的行首存有 NULL 标志位,实际存储不占有任何空间。如果表中所有字段都是非 NULL,就不存在这个标示位了。
占用空间问题
(1)、c语言:
- ‘\0’,这个表示空,需要消耗存储空间的。
- NULL,则表示连这个\0都没有。
(2)、mysql:
- 空值(’’)是不占用空间的
- MySQL中的NULL其实是占用空间的。官方文档说明:
“NULL columns require additional space in the row to record whether their values are NULL. For MyISAM tables, each NULL column takes one bit extra, rounded up to the nearest byte.” 1
2. NULL使用上的一些问题
一、数值类型
对一个允许为NULL的字段进行min、max、sum、加减、order by、group by、distinct 等操作的时候会出错
1) 在 min / max / sum / avg 中 NULL 值会被直接忽略掉,如下是测试结果,可能 min / max / sum 还比较可以理解,但 avg 可能会出错:
CREATE TABLE `t1` ( `id` int(16) NOT NULL AUTO_INCREMENT, `name` varchar(20) DEFAULT NULL, `number` int(11) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=5 DEFAULT CHARSET=utf8;
select * from t1; +------+----------+--------+ | id | name | number | +------+----------+--------+ | 1 | zhangsan | NULL | | 2 | lisi | NULL | | 3 | wangwu | 0 | | 4 | zhangliu | 4 | +------+----------+--------+
select max(number) from t1; +-------------+ | max(number) | +-------------+ | 4 | +-------------+ select min(number) from t1; +-------------+ | min(number) | +-------------+ | 0 | +-------------+ select sum(number) from t1; +-------------+ | sum(number) | +-------------+ | 4 | +-------------+ select avg(number) from t1; +-------------+ | avg(number) | +-------------+ | 2.0000 | +-------------+
2) 对 NULL 做加减操作,如 1 + NULL,结果仍是 NULL
select 1+NULL; +--------+ | 1+NULL | +--------+ | NULL | +--------+
3) order by 以升序检索字段的时候 NULL 会排在最前面(倒序相反)
select * from t1 order by number; +----+----------+--------+ | id | name | number | +----+----------+--------+ | 1 | zhangsan | NULL | | 2 | lisi | NULL | | 3 | wangwu | 0 | | 4 | zhangliu | 4 | +----+----------+--------+ select * from t1 order by number desc; +----+----------+--------+ | id | name | number | +----+----------+--------+ | 4 | zhangliu | 4 | | 3 | wangwu | 0 | | 1 | zhangsan | NULL | | 2 | lisi | NULL | +----+----------+--------+
4) group by / distinct 时,NULL 值被视为相同的值
select distinct(number) from t1; +--------+ | number | +--------+ | NULL | | 0 | | 4 | +--------+ select number,count(*) from t1 group by number; +--------+----------+ | number | count(*) | +--------+----------+ | NULL | 2 | | 0 | 1 | | 4 | 1 | +--------+----------+
二、字符类型,在使用 NULL 值的时候,也需要格外注意
1) 字段是字符时,你无法一目了然的区分这个值到底是 NULL ,还是字符串 ‘NULL’
insert into t1 (name,number) values ('NULL',5); insert into t1 (number) values (6); select * from t1 where number in (5,6); +----+------+--------+ | id | name | number | +----+------+--------+ | 5 | NULL | 5 | | 6 | NULL | 6 | +----+------+--------+ select name is NULL from t1 where number=5; +--------------+ | name is NULL | +--------------+ | 0 | +--------------+ select name is NULL from t1 where number=6; +--------------+ | name is NULL | +--------------+ | 1 | +--------------+
2) 统计包含 NULL 字段的值,NULL 值不包括在里面
select count(*) from t1; +----------+ | count(*) | +----------+ | 6 | +----------+ select count(name)from t1; +-------------+ | count(name) | +-------------+ | 5 | +-------------+ select * from t1 where name is null; +----+------+--------+ | id | name | number | +----+------+--------+ | 6 | NULL | 6 | +----+------+--------+
3) 如果你用 length 去统计一个 VARCHAR 的长度时,NULL 返回的将不是数字
select length(name) from t1 where name is null; +--------------+ | length(name) | +--------------+ | NULL | +--------------+