分享
 
 
 

索引全攻略

王朝other·作者佚名  2006-01-08
窄屏简体版  字體: |||超大  

索引问题

一 概述

可以利用索引快速访问数据库表中的特定信息。索引是对数据库表中一个或多个列的值进行排序的结构。

索引提供指针以指向存储在表中指定列的数据值,然后根据指定的排序次序排列这些指针。

数据库使用索引的方式与使用书的目录很相似:通过搜索索引找到特定的值,

然后跟随指针到达包含该值的行

二 索引的两种类型:

聚集索引=簇集索引

聚集索引基于数据行的键值在表内排序和存储这些数据行。由于数据行按基于聚集索引键的排序次序存储,

因此聚集索引对查找行很有效。每个表只能有一个聚集索引,因为数据行本身只能按一个顺序存储。

数据行本身构成聚集索引的最低级别。

只有当表包含聚集索引时,表内的数据行才按排序次序存储。如果表没有聚集索引,

则其数据行按堆集方式存储。

聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后,

便可以确保包含后续索引值的行在物理相邻。例如,如果应用程序执行的一个查询经常检索某一日期范围

内的记录,则使用聚集索引可以迅速找到包含开始日期的行,然后检索表中所有相邻的行,

直到到达结束日期。这样有助于提高此类查询的性能。同样,如果对从表中检索的数据进行排序时

经常要用到某一列,则可以将该表在该列上聚集(物理排序),避免每次查询该列时都进行排序,

从而节省成本

非聚集索引

非聚集索引具有完全独立于数据行的结构。非聚集索引的最低行包含非聚集索引的键值,

并且每个键值项都有指针指向包含该键值的数据行。数据行不按基于非聚集键的次序存储。

在非聚集索引内,从索引行指向数据行的指针称为行定位器。

行定位器的结构取决于数据页的存储方式是堆集还是聚集。对于堆集,行定位器是指向行的指针。

对于有聚集索引的表,行定位器是聚集索引键。

只有在表上创建了聚集索引时,表内的行才按特定的顺序存储。这些行就基于聚集索引键按顺序存储。

如果一个表只有非聚集索引,它的数据行将按无序的堆集方式存储

非聚集索引可以建多个,两者都能改善查询性能

非聚集索引与聚集索引一样有 B 树结构,但是有两个重大差别:

数据行不按非聚集索引键的顺序排序和存储。

非聚集索引的叶层不包含数据页。

相反,叶节点包含索引行。每个索引行包含非聚集键值以及一个或多个行定位器,

这些行定位器指向有该键值的数据行(如果索引不唯一,则可能是多行)。

非聚集索引可以在有聚集索引的表、堆集或索引视图上定义

另外

唯一索引

唯一索引可以确保索引列不包含重复的值。在多列唯一索引的情况下,该索引可以确保索引列中每个值组

合都是唯一的。唯一索引既是索引也是约束。

复合索引

索引项是多个的就叫组合索引,也叫复合索引。复合索引使用时需要注意索引项的次序。

二 索引的创建

有两种方法可以在 SQL Server 内定义索引: CREATE INDEX 语句和CREATE TABLE 语句

CREATE TABLE支持在创建索引时使用下列约束:

PRIMARY KEY 创建唯一索引来强制执行主键

UNIQUE 创建唯一索引

CLUSTERED 创建聚集索引

NONCLUSTERED 创建非聚集索引

注: 1 定义索引时,可以指定每列的数据是按升序还是降序存储。如果不指定,则默认为升序

2 支持在计算列上创建索引

3 为索引指定填充因子

可标识填充因子来指定每个索引页的填满程度。索引页上的空余空间量很重要,

因为当索引页填满时,系统必须花时间拆分它以便为新行腾出空间。

三 索引的维护语句

DBCC DBREINDEX 重建指定数据库中表的一个或多个索引

DBCC INDEXFRAG整理指定的表或视图的聚集索引和辅助索引碎片

比较

速度 兼容性 日志影响 数据访问影响 额外磁盘空间

DBCC 最快 最好 大,但能通过把 操作过程中数据不 需要大

DBREINDEX 可以重 故障还原模型设 能访问,影响大

建所有 为简单减少日志

有索引

DBCC 慢 但可 必须分 小 数据未被锁定 需要小

INDEXDEFRAG 随时终 别指定

止执行

drop index 中等 必须分 大,但能通过把 仅在操作执行时 中等,操作在

create index 别指定 故障还原模型设 锁定数据 tempdb中进行

为简单减少日志

四 查看索引的方法

sp_indexes 返回指定远程表的索引信息

INDEXKEY_PROPERTY 返回有关索引键的信息

sysindexes系统表 数据库中的每个索引和表在表中各占一行,该表存储在每个数据库中

五 可以通过执行计划

查看sql语句执行时是否建立在索引之上

比如

CREATE TABLE Test

(Field_1 int NOT NULL,

Field_2 int CONSTRAINT PK_Test

PRIMARY KEY CLUSTERED (Field_1))

CREATE index IX_Test ON Test (Field_2)

1 SELECT * FROM Test WHERE Field_2 =408

执行计划可以看出使用了IX_Test索引

2 SELECT * FROM Test WHERE Field_1 =1

执行计划可以看出使用了PK_Test

3 但如果是SELECT * FROM Test with (index(IX_Test)) WHERE Field_1 =1

则指定使用索引

六 索引的具体使用 (转贴)

1) 索引的设计

A:尽量避免表扫描

检查你的查询语句的where子句,因为这是优化器重要关注的地方。包含在where里面的每一列(column)都是可能的侯选索引,为能达到最优的性能,考虑在下面给出的例子:对于在where子句中给出了column1这个列。

下面的两个条件可以提高索引的优化查询性能!

第一:在表中的column1列上有一个单索引

第二:在表中有多索引,但是column1是第一个索引的列

避免定义多索引而column1是第二个或后面的索引,这样的索引不能优化服务器性能

例如:下面的例子用了pubs数据库。

SELECT au_id, au_lname, au_fname FROM authors

WHERE au_lname = ’White’

按下面几个列上建立的索引将会是对优化器有用的索引

?au_lname

?au_lname, au_fname

而在下面几个列上建立的索引将不会对优化器起到好的作用

?au_address

?au_fname, au_lname

考虑使用窄的索引在一个或两个列上,窄索引比多索引和复合索引更能有效。用窄的索引,在每一页上

将会有更多的行和更少的索引级别(相对与多索引和复合索引而言),这将推进系统性能。

对于多列索引,SQL Server维持一个在所有列的索引上的密度统计(用于联合)和在第一个索引上的

histogram(柱状图)统计。根据统计结果,如果在复合索引上的第一个索引很少被选择使用,那么优化器对很多查询请求将不会使用索引。

有用的索引会提高select语句的性能,包括insert,uodate,delete。

但是,由于改变一个表的内容,将会影响索引。每一个insert,update,delete语句将会使性能下降一些。实验表明,不要在一个单表上用大量的索引,不要在共享的列上(指在多表中用了参考约束)使用重叠的索引。

在某一列上检查唯一的数据的个数,比较它与表中数据的行数做一个比较。这就是数据的选择性,这比较结果将会帮助你决定是否将某一列作为侯选的索引列,如果需要,建哪一种索引。你可以用下面的查询语句返回某一列的不同值的数目。

select count(distinct cloumn_name) from table_name

假设column_name是一个10000行的表,则看column_name返回值来决定是否应该使用,及应该使用什么索引。

Unique values Index

5000 Nonclustered index

20 Clustered index

3 No index

2) 镞索引和非镞索引的选择

<1:>镞索引是行的物理顺序和索引的顺序是一致的。页级,低层等索引的各个级别上都包含实际的数据页。一个表只能是有一个镞索引。由于update,delete语句要求相对多一些的读操作,因此镞索引常常能加速这样的操作。在至少有一个索引的表中,你应该有一个镞索引。

在下面的几个情况下,你可以考虑用镞索引:

例如: 某列包括的不同值的个数是有限的(但是不是极少的)

顾客表的州名列有50个左右的不同州名的缩写值,可以使用镞索引。

例如: 对返回一定范围内值的列可以使用镞索引,比如用between,>,>=,<,<=等等来对列进行操作的列上。

select * from sales where ord_date between ’5/1/93’ and ’6/1/93’

例如: 对查询时返回大量结果的列可以使用镞索引。

SELECT * FROM phonebook WHERE last_name = ’Smith’

当有大量的行正在被插入表中时,要避免在本表一个自然增长(例如,identity列)的列上建立镞索引。如果你建立了镞的索引,那么insert的性能就会大大降低。因为每一个插入的行必须到表的最后,表的最后一个数据页。

当一个数据正在被插入(这时这个数据页是被锁定的),所有的其他插入行必须等待直到当前的插入已经结束。

一个索引的叶级页中包括实际的数据页,并且在硬盘上的数据页的次序是跟镞索引的逻辑次序一样的。

<2:>一个非镞的索引就是行的物理次序与索引的次序是不同的。一个非镞索引的叶级包含了指向行数据页的指针。

在一个表中可以有多个非镞索引,你可以在以下几个情况下考虑使用非镞索引。

在有很多不同值的列上可以考虑使用非镞索引

例如:一个part_id列在一个part表中

select * from employee where emp_id = ’pcm9809f’

查询语句中用order by 子句的列上可以考虑使用镞索引

3) 一个表列如果设为主键(primary key),它会自动生成一个聚簇索引

这时不能直接使用Drop index Table1.Tableindex1语句

必须删除主键约束,用语句:alter table table1 drop constraint 约束名(如pk_xxx)

最后补充

全文索引请参考

http://expert.csdn.net/Expert/topic/1594/1594455.xml?temp=.1432154

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有