大话程序猿眼中的聚集索引和非聚集索引

OS：这里对聚集所以和非聚集所以的概念说明就不叙述了。

身为程序猿，在平时的开发中，数据的操作是经常要做的事情，大多数公司是没有DBA的，程序开发人员的在操作数据的时候根本不会去看SQL语句执行的效率，所以就时常的遇到大数据的情况下查询数据库总会遇到各种缓慢Loading的情况。

从用户的角度来说，我裤子都脱了，你给我看这个？

从技术的角度来说，我他么这么流弊，怎么可以让查询这么卡。

因此，作为程序猿的我们，在没有DBA的情况下，要掌握最基本的加快数据库查询的意识和技能；

直接上实例，动态说明，有图有真相，简单粗暴。

这里我们先创建一张表：

CREATE TABLE [dbo].[Student](

[ID] [INT] IDENTITY(1,1) NOT NULL,

[Name] [NVARCHAR](50) NOT NULL,

[Age] [INT] NOT NULL,

[Height] [INT] NOT NULL,

[Address] [NVARCHAR](100) NULL,

[Class] [NVARCHAR](50) NOT NULL,

[EntranceDateTime] [DATETIME] NOT NULL,

CONSTRAINT [PK_Student]PRIMARY KEY CLUSTERED

(

[ID] ASC

)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]

) ON [PRIMARY]

ALTER TABLE [dbo].[Student] ADD CONSTRAINT [DF_Student_EntranceDateTime] DEFAULT (GETDATE()) FOR [EntranceDateTime]

往表里插入 500万数据：

DECLARE @i INT;

SET @i=1;

WHILE(@i<5000001)BEGIN

INSERT INTO dbo.Student(Name,Age,Height,[Address],Class,EntranceDateTime)

VALUES('yang_'+CONVERT(NVARCHAR(10),@i),RAND()*10+7,RAND()*100+50,'厦门土豪小区1座'+CONVERT(NVARCHAR(10),CONVERT(INT,RAND()*100+1))+'号',CONVERT(NVARCHAR(10),CONVERT(INT,RAND()*6+1))+'年级',GETDATE())

SET @i=@i+1;

END

1.合理的使用索引提高查询速度

查询表里，所有年龄为10的名字，如图：

从图中可以看出，使用了聚集索引扫描，逻辑读取55057次

添加索引：

CREATE NONCLUSTERED INDEX [IX_Student_Age_Name] ON [dbo].[Student]

(

[Age] ASC

)

INCLUDE ( [Name]) WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]

GO 、

很明显的看出来，查询优化器使用了索引查找，逻辑读取次数变少为：2411，很可观。

(在执行计划中看到索引查找，就是说明索引被使用到了，如果出现索引扫描就说明索引没有被使用到)

这里注意：

误区：我添加了索引查询速度就一定比表扫描来得快，并且索引一定会被使用

我的总结理解：一，索引不一定比扫描快，在数据量少的情况下，使用表扫描会比索引来得快，二，添加了索引不一定会被使用，首先要知道sqlserver在执行语句的时候会选择最优耗能少的方案去执行，在索引无法达到最高效的情况下，就不会被使用到。

比如：

下面的查询操作，就没有使用到索引了，而是使用到了聚集索引扫描

出现上面的情况是为什么呢？

因为我创建的索引里，只有覆盖了Name字段，现在我查询的是Address字段，不在索引的覆盖中，那么查询优化器在执行语句的时候就没有使用到了索引，选择了开销更小的聚集索引扫描

但是我就是这么任性，要强制要求使用索引来查询，结果如截图：

这个结果就很明显了，逻辑读次数，和扫描次数多了很多。计划里也给了提示，让我们索引覆盖Address字段

2.合理的使用聚集索引

我们在添加表的主键的时候就会默认的将主键添加为聚集索引，但是并不是聚集索引就一定要是主键字段，一张表就只能添加一个聚集索引，所以合理的利用聚集索引的特性，可以很大的提高查询速度。

一般我们都是在自增的ID设置为主键，但是又很少会对ID进行查询操作，更多的会对表中的其他字段进行查询，比如：时间字段。

这个时候就可以将聚集索引加到时间字段里，你会发现整个查询就会高效很多。

3，4，5，6

未完待续。。。

-----------------------------------[我只是美丽的分割线]-----------------------------------------

索引的优缺点

优点：加快访问速度, 加强行的唯一性

缺点：带索引的表在数据库中需要更多的存储空间,操纵数据的命令需要更长的处理时间，因为它们需要对索引进行更新

创建索引的指导原则

请按照下列标准选择建立索引的列：

该列用于频繁搜索

该列用于对数据进行排序

请不要使用下面的列创建索引：

列中仅包含几个不同的值。

表中仅包含几行。为小型表创建索引可能不太划算，因为SQL Server在索引中搜索数据所花的时间比在表中逐行搜索所花的时间更长

假设我们在Col1列上创建了单列索引，可以在以下谓词上进行索引查找：

Ø [Col1] = 3.14

Ø [Col1] > 100

Ø [Col1] BETWEEN 0 AND 99

Ø [Col1] LIKE 'abc%'

Ø [Col1] IN (2, 3, 5, 7)

然而，在以下谓词上将不能使用索引查找：

Ø ABS([Col1]) = 1

Ø [Col1] + 1 = 9

Ø [Col1] LIKE '%abc'

-----------------------------------[我只是美丽的分割线]-----------------------------------------