深入了解数据仓库优化中的星型转换


在数据仓库中经常查询的SQL总带有下列特征:

        ◆几个表进行关联

        ◆只有一个数据量巨大的表, 称为事实表

        ◆其他的都是编码表, 称为维表

        ◆维表和事实表之间有主外键关系

        假设有D1(key1),D2(key2),D3(key3),D4(key)四个小的维表和一个事实表F(key1,key2,key3,key4), 那么经常进行的查询将是:           SELECT
          D1.xxx, D2.xxx, D3.xxx, D4.xxx,
          SUM(F.xxx), SUM(F.xxx)
          FROM F, D1, D2, D3, D4
        WHERE F.KEY1=D1.KEY1 AND F.KEY2=D2.KEY2
          AND F.KEY3=D3.KEY3 AND F.KEY4=D4.KEY4
          AND D1.xxx=? AND D2.xxx=?
          AND D3.xxx=? AND D4.xxx=?
        GROUP BY D1.xxx, D2.xxx, D3.xxx, D4.xxx


        而为了提高查询速度, 根据数据特征, key1,key2,key3,key4这四个字段会比较,每个字段上建一个位图索引(Bitmap Index), 但是上面的查询语句并不能用到位图索引, 除非是进行了星型转换, 这个转换需要将SQL转换成下面的格式:          SELECT
          D1.xxx, D2.xxx, D3.xxx, D4.xxx,
          SUM(F.xxx), SUM(F.xxx)
          FROM F, D1, D2, D3, D4
        WHERE F.KEY1=D1.KEY1 AND F.KEY2=D2.KEY2
          AND F.KEY3=D3.KEY3 AND F.KEY4=D4.KEY4
          AND D1.xxx=? AND D2.xxx=?
          AND D3.xxx=? AND D4.xxx=?
          AND F.KEY1 IN (SELECT D1.KEY1 FROM D1 WHERE D1.xxx=?)
          AND F.KEY2 IN (SELECT D2.KEY2 FROM D2 WHERE D2.xxx=?)
          AND F.KEY3 IN (SELECT D3.KEY3 FROM D3 WHERE D3.xxx=?)
          AND F.KEY4 IN (SELECT D4.KEY4 FROM D4 WHERE D4.xxx=?) GROUP BY D1.xxx, D2.xxx, D3.xxx, D4.xxx


        有条件的可以试试, 使用星型转换有三个条件:

        ◆事实表的每个代码列上有位图索引

        ◆参数STAR_TRANSFORMATION_ENABLED的值要设为TRUE

        ◆必须使用CBO, 所以最好对表进行适当的分析

本文作者:
« 
» 
快速导航

Copyright © 2016 phpStudy | 豫ICP备2021030365号-3