奇怪的SQL

2012年7月12日 D瓜哥发表评论阅读评论 431 人阅读

　　昨天遇到一些很奇怪的SQL。

　　业务：查询有员工的组织的数量。

　　很奇怪，为什么同样的数据、同样的业务逻辑，两个SQL差距怎么这么大啊？！具体SQL如下：

　　注意：sys_organize表有36640条数据，sys_staff_org_relat表中有3068条数据。

第一种情况：原始SQL的情况：

　　select count(1)
　　  from sys_organize t
　　 where t.organize_id not in
　　       (select c.organize_id from sys_staff_org_relat c);

　　执行结果：16.661s

第二个情况：加distinct的情况：

　　select count(1)
　　  from sys_organize t
　　 where t.organize_id not in
　　       (select distinct c.organize_id from sys_staff_org_relat c);

　　执行结果：20.826s

第三种情况：加to_number()后

　　select count(1)
　　  from sys_organize t
　　 where t.organize_id not in
　　       (select to_number(c.organize_id) from sys_staff_org_relat c);

　　执行结果：92.758s

第四种情况：同时加上distinct、to_number()后

　　select count(1)
　　  from sys_organize t
　　 where t.organize_id not in
　　       (select distinct to_number(c.organize_id) from sys_staff_org_relat c);

　　执行时间：96.721s；

最后：使用exists

　　select count(1) --t.*
　　  from sys_organize t
　　 where not exists (select c.organize_id
　　          from sys_staff_org_relat c
　　         where t.organize_id = c.organize_id);

　　执行时间：0.047s

　　从以上的数据可以得出几个结论：

使用to_number是非常耗时的，（92.758-16.661）/16.661 =456.737%
加上distinct，会对性能有相当大的影响（20.826-16.661）/16.661 = 24.998%
exists比in效率要高很多，大概是in的 16.661/0.047 = 35.449倍 (我指的差异很大的SQL也就是使用in和exists的这两个SQL)

　　疑问：

　　为什么使用exists的效率比in高这么多？数据库是如何解析这些SQL的？关于这个问题，我下次把Oracle的“执行计划”拿出来，从原理层面解释一下。

　　关于这个问题，我下次把Oracle的“执行计划”拿出来，从原理层面解释一下。

作者： D瓜哥，https://www.diguage.com/
原文链接：https://wordpress.diguage.com/archives/30.html
版权声明：非特殊声明均为本站原创作品，转载时请注明作者和原文链接。

分类: 挨踢(IT), 数据库标签: 优化, 性能, 数据库

评论 (2) Trackbacks (0) 发表评论 Trackback

jsper

2012年7月24日13:54 | #1

回复 | 引用

not in 内外表都要全表扫描

not exists 内表使用联接方式内层表子查询可以走索引
- D瓜哥
  
  2012年7月24日15:17 | #2
  
  回复 | 引用
  
  谢谢！有机会我查看一下Oracle的解析计划，再重新炒炒。哈哈

本文目前尚无任何 trackbacks 和 pingbacks.

为数据量非常大的表添加外键的有效方法为什么金庸作品改编成影视作品比古龙改编成影视作品要好？

"地瓜哥"博客网

奇怪的SQL

第一种情况：原始SQL的情况：

第二个情况：加distinct的情况：

第三种情况：加to_number()后

第四种情况：同时加上distinct、to_number()后

最后：使用exists

友情赞助

最新文章

热门文章

新浪微博

分类目录

Blogroll

最新评论