字段索引函数操作会使索引失效
b+树提供快速等位的功能,来源于同一层兄弟节点的有效性。
使用函数之后会破坏同一层节点的顺序,因此mysql会直接放弃索引。但是不是不走索引,mysql会对比索引树和聚集树做对比,对比之后还是会走索引树,但是这个时候是遍历索引树。
例如:
CREATE TABLE `tradelog` (
`id` int(11) NOT NULL,
`tradeid` varchar(32) DEFAULT NULL COMMENT '流水号',
`operator` int(11) DEFAULT NULL COMMENT '交易人',
`t_modified` datetime DEFAULT NULL COMMENT '交易时间',
PRIMARY KEY (`id`),
KEY `tradeid` (`tradeid`),
KEY `t_modified` (`t_modified`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
select count(*) from tradelog where month(t_modified)=7;
mysql> explain select count(*) from tradelog where month(t_modified)=7;
+----+-------------+----------+------------+-------+---------------+------------+---------+------+------+----------+--------------------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+----------+------------+-------+---------------+------------+---------+------+------+----------+--------------------------+
| 1 | SIMPLE | tradelog | NULL | index | NULL | t_modified | 6 | NULL | 1 | 100.00 | Using where; Using index |
+----+-------------+----------+------------+-------+---------------+------------+---------+------+------+----------+--------------------------+
1 row in set, 1 warning (0.00 sec)
由操作结果可知:是走索引的,并且还走了覆盖索引(Using where; Using index) 但是其实是遍历的索引树
下面是从网上找的一张图:(由图中的结果可以知道,month(t_modified) 之后不再保证是顺序的。索引不再有效)
隐式转换
还是上面的例子
mysql> explain select * from tradelog where tradeid=110717;
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
| 1 | SIMPLE | tradelog | NULL | ALL | tradeid | NULL | NULL | NULL | 1 | 100.00 | Using where |
+----+-------------+----------+------------+------+---------------+------+---------+------+------+----------+-------------+
1 row in set, 3 warnings (0.01 sec)
tradeid是创建索引的,为什么不走索引。因为:隐式转换。除了类型当编码不同的时候也会索引失效,其实都是因为mysql加上了相应的函数。导致索引失效。
字符串创建索引(前缀索引)
比如邮箱或者身份证号的存储,使用前缀索引,前缀索引长度的选择。
select
count(distinct left(email,4)) as a,
count(distinct left(email,4)) as b,
count(distinct left(email,4)) as c,from table
注意:前缀索引会使覆盖索引失效,因为前缀索引只有部分数据,需要回表找到完整数据。
对于区分度不太好的,例如身份证号。之后后面几位才有区分度。那么如何存储?
- 倒序存储之后取前缀索引
select * from table where card = reverse('card_string')
- 使用hash字段存储(查询的时候必须使用等于,精确匹配)
select * from t where card = crc32('card_string')
上面2个缺点是都不支持范围查询。
总结:
- 直接创建索引,空间占用大。
- 前缀索引,节省空间,但是覆盖索引会失效。
- 对于前缀区分度不高的使用,倒序存储,不支持范围查询。
- 创建hash字段索引,性能稳定,也不支持范围查询。
考虑一种场景:用户名+密码的登录。因为只有单数据查询没有范围查询场景,一般可以吧多个字段hash字后存储。
唯一索引和普通索引的选取
前提:在业务保证一致的情况下,如何选择?
查询
select * from where a = '1';
a为唯一索引:mysql会在a索引树上找到1这条数据的id,回表查出所有数据。
a为普通索引:mysql在a索引上找到1之后会接着找下一个,直到下一个不为1,然后同样回表查出数据返回。如果查下一个数据的时候正好在下一页,会涉及到一次io,但是一个数据页一般会放进千个数据,索引概率相对较小。
更新
更新数据的时候,如果数据在数据页中就直接更新,否则存入change buffer中,就不会从磁盘中读取数据。下次查询访问数据也的时候,将数据也读入内存,执行change buffer 中与这个页面的merge操作。通过这种方式保证一致性。数据库也会定期执行merge操作。
update table set a = a+1 where xxx;
由上可知:
当更新的数据在内存中的话:
- 唯一索引:判断数据唯一,直接更新内存数据。
- 普通索引:直接更新内存数据。
更新数据不在内存:
- 唯一索引:数据读入内存,(io)判断是否是否重复,不重复就插入
- 普通索引:直接写change buffer
场景:如果写入之后立马会读,就没必要使用change buffer 。反而增加维护成本。但是对于大数据量的写的操作,性能会有很大的提升。
最左前缀索引
暂无。