首页 > 挨踢(IT), 数据库 > 奇怪的SQL

奇怪的SQL

2012年7月12日 发表评论 阅读评论 338 人阅读    

  昨天遇到一些很奇怪的SQL。

  业务:查询有员工的组织的数量。

  很奇怪,为什么同样的数据、同样的业务逻辑,两个SQL差距怎么这么大啊?!具体SQL如下:

  注意:sys_organize表有36640条数据,sys_staff_org_relat表中有3068条数据。

  

第一种情况:原始SQL的情况:

  select count(1)
    from sys_organize t
   where t.organize_id not in
         (select c.organize_id from sys_staff_org_relat c); 

  执行结果:16.661s

  

  

第二个情况:加distinct的情况:

  select count(1)
    from sys_organize t
   where t.organize_id not in
         (select distinct c.organize_id from sys_staff_org_relat c);

  执行结果:20.826s

  

  

  

第三种情况:加to_number()后

  select count(1)
    from sys_organize t
   where t.organize_id not in
         (select to_number(c.organize_id) from sys_staff_org_relat c);

  执行结果:92.758s

  

  

  

第四种情况:同时加上distinct、to_number()后

  select count(1)
    from sys_organize t
   where t.organize_id not in
         (select distinct to_number(c.organize_id) from sys_staff_org_relat c);

  执行时间:96.721s;

  

  

  

最后:使用exists

  select count(1) --t.*
    from sys_organize t
   where not exists (select c.organize_id
            from sys_staff_org_relat c
           where t.organize_id = c.organize_id);

  执行时间:0.047s

  

  从以上的数据可以得出几个结论:

  1. 使用to_number是非常耗时的,(92.758-16.661)/16.661 =456.737%
  2. 加上distinct,会对性能有相当大的影响(20.826-16.661)/16.661 = 24.998%
  3. exists比in效率要高很多,大概是in的 16.661/0.047 = 35.449倍 (我指的差异很大的SQL也就是使用in和exists的这两个SQL)
  4.  

  疑问:

  为什么使用exists的效率比in高这么多?数据库是如何解析这些SQL的?关于这个问题,我下次把Oracle的“执行计划”拿出来,从原理层面解释一下。

  关于这个问题,我下次把Oracle的“执行计划”拿出来,从原理层面解释一下。



作 者: D瓜哥,https://www.diguage.com/
原文链接:https://wordpress.diguage.com/archives/30.html
版权声明:非特殊声明均为本站原创作品,转载时请注明作者和原文链接。

  1. 2012年7月24日13:54 | #1

    not in 内外表都要全表扫描

    not exists 内表使用联接方式 内层表子查询可以走索引

    • D瓜哥
      2012年7月24日15:17 | #2

      谢谢!有机会我查看一下Oracle的解析计划,再重新炒炒。哈哈

  1. 本文目前尚无任何 trackbacks 和 pingbacks.