企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
# 优化order by语句 当进行数据的insert操作的时候,可以考虑采用以下几种优化方案。 ## 1. 环境准备 ```SQL CREATE TABLE `emp` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(100) NOT NULL, `age` int(3) NOT NULL, `salary` int(11) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; insert into `emp` (`id`, `name`, `age`, `salary`) values('1','Tom','25','2300'); insert into `emp` (`id`, `name`, `age`, `salary`) values('2','Jerry','30','3500'); insert into `emp` (`id`, `name`, `age`, `salary`) values('3','Luci','25','2800'); insert into `emp` (`id`, `name`, `age`, `salary`) values('4','Jay','36','3500'); insert into `emp` (`id`, `name`, `age`, `salary`) values('5','Tom2','21','2200'); insert into `emp` (`id`, `name`, `age`, `salary`) values('6','Jerry2','31','3300'); insert into `emp` (`id`, `name`, `age`, `salary`) values('7','Luci2','26','2700'); insert into `emp` (`id`, `name`, `age`, `salary`) values('8','Jay2','33','3500'); insert into `emp` (`id`, `name`, `age`, `salary`) values('9','Tom3','23','2400'); insert into `emp` (`id`, `name`, `age`, `salary`) values('10','Jerry3','32','3100'); insert into `emp` (`id`, `name`, `age`, `salary`) values('11','Luci3','26','2900'); insert into `emp` (`id`, `name`, `age`, `salary`) values('12','Jay3','37','4500'); create index idx_emp_age_salary on emp(age,salary); ``` ## 2.两种排序方式 1). 第一种是通过对返回数据进行排序,也就是通常说的 filesort 排序,所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。 ~~~ explain select * from emp order by age,salary; ~~~ ![](https://img.kancloud.cn/2e/69/2e695b7463e952fd42afe5d665b2455c_2426x226.png) 2). 第二种通过有序索引顺序扫描直接返回有序数据,这种情况即为 using index,不需要额外排序,操作效率高。 ![](https://img.kancloud.cn/cf/15/cf15814579d44ab9166416a497e01cf6_2348x226.png) 3). 第三种情况排序顺序跟索引顺序不一样,但好像mysql 8 好像不太一样 ![](https://img.kancloud.cn/a4/7f/a47f7f6615b881339f7744ad4494d567_2734x242.png) mysql8.0 有降序descend索引,有backward index scan的扫描方式,两者是有区别的, 对于descend索引,是在创建索引的时候就加上desc就可以了。 对于一般的升序索引,从根节点到叶子节点是升序的,所有索引节点从左到右也是升序的。但是想取值升序索引的后面的数据(就是值最新的,举例主键id,默认升序,select * from a where id <1000 order by id desc),然后还要对这个索引进行降序排序,这样就使用了backward index scan,这就是基于双向链表的。 **总结:** 了解了MySQL的排序方式,优化目标就清晰了:尽量减少额外的排序,通过索引直接返回有序数据。where 条件和Order by 使用相同的索引,而且尽可能要命中索引,否则肯定需要额外的操作,这样就会出现FileSort。 ## 2. Filesort 的优化 通过创建合适的索引,能够减少 Filesort 的出现,但是在某些情况下,条件限制不能让Filesort消失,那就需要加快 Filesort的排序操作。对于Filesort , MySQL 有两种排序算法: **1) 两次扫描算法:** MySQL4.1 之前,使用该方式排序。首先根据条件取出排序字段和行指针信息,然后在排序区 sort buffer 中排序,如果sort buffer不够,则在临时表 temporary table 中存储排序结果。完成排序之后,再根据行指针回表读取记录,该操作可能会导致大量随机I/O操作。 **2)一次扫描算法** 一次性取出满足条件的所有字段,然后在排序区 sort buffer 中排序后直接输出结果集。排序时内存开销较大,但是排序效率比两次扫描算法要高。 MySQL 通过比较系统变量 max_length_for_sort_data 的大小和Query语句取出的字段总大小, 来判定是否那种排序算法,如果max_length_for_sort_data 更大,那么使用第二种优化之后的算法;否则使用第一种。 可以适当提高 sort_buffer_size 和 max_length_for_sort_data 系统变量,来增大排序区的大小,提高排序的效率。