SQL优化之操作符篇 - 王朝网络宽屏版

今天霄汉的SQL优化培训收获颇丰，摘要出一部分．

1.1 IN 操作符

用IN写出来的SQL的优点是比较轻易写及清楚易懂，这比较适合现代软件开发的风格。

但是用IN的SQL性能总是比较低的，从Oracle执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别：

ORACLE试图将其转换成多个表的连接，假如转换不成功则先执行IN里面的子查询，再查询外层的表记录，假如转换成功则直接采用

多个表的连接方式查询。

由此可见用IN的SQL至少多了一个转换的过程。一般的SQL都可以转换成功，但对于含有分组统计等方面的SQL就不能转换了。

推荐方案：在业务密集的SQL当中尽量不采用IN操作符而使用EXISTS。

1.2 NOT IN操作符

此操作是强列推荐不使用的，因为它不能应用表的索引。

推荐方案：用NOT EXISTS代替

1.3 <> 操作符（不等于）

不等于操作符是永远不会用到索引的，因此对它的处理只会产生全表扫描。

推荐方案：用其它相同功能的操作运算代替，如

a<>0 改为 a>0 or a<0

a<>’’ 改为 a>’’

1.4 IS NULL 或IS NOT NULL操作（判定字段是否为空）

判定字段是否为空一般是不会应用索引的，因为B树索引是不索引空值的。

推荐方案：

用其它相同功能的操作运算代替，如

a is not null 改为 a>0 或a>’’等。

不答应字段为空，而用一个缺省值代替空值。

1.5 > 及 < 操作符（大于或小于操作符）

大于或小于操作符一般情况下是不用调整的，因为它有索引就会采用索引查找，但有的情况下可以对它进行优化，

如一个表有100万记录，一个数值型字段A，30万记录的A=0，30万记录的A=1，39万记录的A=2，1万记录的A=3。

那么执行A>2与A>=3的效果就有很大的区别了，因为A>2时ORACLE会先找出为2的记录索引再进行比较，而A>=3时ORACLE则直接找到=3的记录

索引。

1.6 LIKE操作符

LIKE操作符可以应用通配符查询，里面的通配符组合可能达到几乎是任意的查询，但是假如用得不好则会产生性能上的问题，

如LIKE ‘%5400%’ 这种查询不会引用索引，而LIKE ‘X5400%’则会引用范围索引。

一个实际例子：用YW_YHJBQK表中营业编号后面的户标识号可来查询营业编号 YY_BH LIKE ‘%5400%’ 这个条件会产生全表扫描，

假如改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 则会利用YY_BH的索引进行两个范围的查询，性能肯定大大提高。

1.7 UNION操作符

UNION在进行表链接后会筛选掉重复的记录，所以在表链接后会对所产生的结果集进行排序运算，删除重复的记录再返回结果。

select * from gc_dfys

union

select * from ls_jg_dfys

这个SQL在运行时先取出两个表的结果，再用排序空间进行排序删除重复的记录，最后返回结果集，假如表数据量大的话可能会

导致用磁盘进行排序。

推荐方案：

采用UNION ALL操作符替代UNION，因为UNION ALL操作只是简单的将两个结果合并后就返回。

select * from gc_dfys

union all

select * from ls_jg_dfys

1.8 group by用法

Oracle的GROUP BY语句除了最基本的语法外，还支持ROLLUP和CUBE语句。

select topicid,userid,sum(counter) from cis_topic_stat group by rollup(topicid,userid);

也就是说，假如是ROLLUP(A, B, C)的话，首先会对(A、B、C)进行GROUP BY，然后对(A、B)进行GROUP BY，

然后是(A)进行GROUP BY，最后对全表进行GROUP BY操作。

select topicid,userid,sum(counter) from cis_topic_stat group by cube(topicid,userid);

和ROLLUP相比，CUBE又增加了对STATUS列的GROUP BY统计。

假如是GROUP BY CUBE(A, B, C)，则首先会对(A、B、C)进行GROUP BY，然后依次是(A、B)，(A、C)，(A)，(B、C)，(B)，(C)，

最后对全表进行GROUP BY操作。

1.9 如何使用Hint提示

在select/delete/update后写/*+ hint */

如 select /*+ index(TABLE_NAME INDEX_NAME) */ col1...

注重/*和+之间不能有空格

如用hint指定使用某个索引

select /*+ index(cbotab) */ col1 from cbotab;

select /*+ index(cbotab cbotab1) */ col1 from cbotab;

select /*+ index(a cbotab1) */ col1 from cbotab a;

其中

TABLE_NAME是必须要写的，且假如在查询中使用了表的别名，在hint也要用表的别名来代替表名;

INDEX_NAME可以不必写，Oracle会根据统计值选一个索引;

假如索引名或表名写错了，那这个hint就会被忽略;