位图索引和b树索引的区别(b树索引和位图索引有什么区别)

概述

关于优化这个体系博大精深。例如内核优化。系统优化。中间件优化。oracle优化。sql优化。网络优化等等。网上很多思路都比较偏。比较杂。后面小编会花比较多时间去梳理下这方面内容。深入研究下这方面。试着去做个大致优化的体系和思路。

下面主要讲索引方面的内容。基本概念就不做介绍啦。

索引原理

1. 若没有索引。搜索某个记录时（例如查找name=’wish’）需要搜索所有的记录。因为不能保证只有一个wish。必须全部搜索一遍

2. 若在name上建立索引。oracle会对全表进行一次搜索。将每条记录的name值哪找升序排列。然后构建索引条目（name和rowid）。存储到索引段中。查询name为wish时即可直接查找对应地方

3.创建了索引并不一定就会使用。oracle自动统计表的信息后。决定是否使用索引。表中数据很少时使用全表扫描速度已经很快。没有必要使用索引

索引的类型与结构

1。索引类型

从总的概念上来说。索引分为B树索引（也叫平衡树索引。即就是什么都不写。最常用）和位图索引（多用于数据仓库）。这两种索引在逻辑结构（存储）上完全不同。

1.1。B树索引

其中B树索引又可以具体分为：

（1）唯一索引：

唯一索引确保在定义索引的列中没有重复值。Oracle 自动在表的主键列上创建唯一索引。

使用CREATE UNIQUE INDEX语句创建唯一索引

语法：create unique index index_name on table_name (column_name);

具体列值：索引相关列上的值必须唯一。但可以不限制NULL值。

（2）组合索引：

组合索引是在表的多个列上创建的索引。索引中列的顺序是任意的。

如果 SQL 语句的 WHERE 子句中引用了组合索引的所有列或大多数列。则可以提高检索速度

语法：create index index_name on table_name (column_name1。column_name2);

具体列值：该表中的元组由两列共同确定一行。例如班级号学号唯一确定一个学生。

（3）反向键索引：

反向键索引反转索引列键值的每个字节。为了实现索引的均匀分配。避免b树不平衡。

通常建立在值是连续增长的列上。使数据均匀地分布在整个索引上

创建索引时使用REVERSE关键字

语法：create index index_name on table_name (column_name) reverse;

具体列值：适用于某列值前面相同。后几位不同的情况。例如

sno： 1001 1002 1003 1004 1005 1006 1007

索引转化：1001 2001 3001 4001 5001 6001 7001

（4）位图索引：

位图索引适合创建在低基数列上

位图索引不直接存储ROWID。而是存储字节位到ROWID的映射

节省空间占用

如果索引列被经常更新的话。不适合建立位图索引

总体来说。位图索引适合于数据仓库中。不适合OLTP中

语法：create bitmap index index_name on table_name (column_name);

具体列值：不适用于经常更新的列。适用于条目多但取值类别少的列。例如性别列。

（5）基于函数的索引：

基于一个或多个列上的函数或表达式创建的索引。表达式中不能出现聚合函数

不能在LOB类型的列上创建

创建时必须具有 QUERY REWRITE 权限

语法：create index index_name on table_name (函数（column_name)）;

具体列值：不能在LOB类型的列上创建。用户在该列上对该函数有经常性的要求。

例如：用户不知道存储时候姓名是大写还是小写。使用

select * from student where upper(sname)=’TOM’；

2。索引结构

索引的结构是一个倒立的树状结构。其中每个节点的左子树比他的右子树小。索引最终指向表里面的数据与表里面的数据对应。

如上图。前三行是索引的内部构造。第三行与最后一行。这是索引指向表里数据的一个指向。索引是建立在列上的。最后一行是索引建立在表中某列上的值。

根节点块：如果索引列的值>0时。指向B1这个分支节点块。如果索引列的值>500时。指向B2这个分支节点块。如果索引列的值>1000时。指向B3这个分支节点块。

分支节点块：对于B1来说。再进行细分如果索引列的值>0且<200时。指向L1这个分支节点块。如果索引列的值>200且<400时。指向L2这个分支节点块。如果索引列的值>400且<500时。指向L3这个分支节点块。

叶子节点块：对于L1来说。如果数据行的值为0。那就放在R1这个数据行中。如果数据行的值为29。那就放在R2这个数据行中。如果数据行的值为190。那就放在R3这个数据行中。等。

SQL什么条件会使用索引？

当字段上建有索引时。通常以下情况会使用索引：

INDEX_COLUMN = ?

INDEX_COLUMN > ?

INDEX_COLUMN >= ?

INDEX_COLUMN < ?

INDEX_COLUMN <= ?

INDEX_COLUMN between ? and ?

INDEX_COLUMN in (?。?。…。?)

INDEX_COLUMN like ?||’%’（后导模糊查询）

T1. INDEX_COLUMN=T2. COLUMN1（两个表通过索引字段关联）

SQL什么条件不会使用索引？

一般在什么字段上建索引？

主键及外键通常都要有索引。其它需要建索引的字段应满足以下条件：

1。字段出现在查询条件中。并且查询条件可以使用索引；

2。语句执行频率高。一天会有几千次以上；

以下是一些字段是否需要建B-TREE索引的经验分类：

索引对DML(INSERT。UPDATE。DELETE)附加的开销有多少？

这里还没有去做实验认真测试过。主要与每个表记录的大小及索引字段大小密切相关。参考了其他人对一个普通表的测试数据：

索引对于Insert性能降低56%

索引对于Update性能降低47%

索引对于Delete性能降低29%

因此对于写IO压力比较大的系统。表的索引需要仔细评估必要性。另外索引也会占用一定的存储空间。如果不涉及增删改。可以考虑使用索引。

PS:顺便问一个问题：B+树跟B树索引有什么区别？

关于索引这块讲的还是比较浅显。后面再介绍相关的实验加深下对于索引这一块的印象。感兴趣的朋友可以关注下！

位图索引和b树索引的区别(b树索引和位图索引有什么区别)

Published by

风君子