理解和实现最佳 SQL 查询优化目标可以大大改善很多查询的响应时间。IBM® DB2® for i5/OS® on V5R4 提供了一种新方法,通过一些流行的动态 SQL 接口控制查询优化。本文展示如何用 CLI 实现新的性能调优增强。作为附加的优点,您将必须利用 iSeries Navigator 的性能监视器特性分析任何查询的优化目标。DB2 for i5/OS on V5R4 经过改进,现包含一个 Index Advice Condenser。查询和 SQL 活动会留下一些索引建议。当考虑是否创建永久索引时,很多原始的索引建议可以看作是互补的或者可压缩的。本文解释新的 Index Advisor 压缩特性,并演示如何在 iSeries Navigator 图形界面中使用该特性,或直接用一个定制的用户查询来访问该特性。DB2 for i5/OS Index AdvisorIndex Advisor 是 DB2 for i5/OS V5R4 中引入的特性,该特性记录关于系统索引需要的统计信息。每当执行一个查询或 SQL 语句时,Index Advisor 都会记录查询优化器建议使用的一些索引,留住提高性能的机会。这方面的基础知识有助于理解这个新的 Index Advice Condenser。每当建议一个索引时,就有一个新行被添加到系统索引建议表中,即模式 QSYS2 中的 SYSIXADV 表。这里是假设该索引之前还没有被建议。Index Advisor 检查以下列中的属性,以判定一个索引是否已经被优化器建议:LEADING_COLUMN_KEYSKEY_COLUMNS_ADVISEDTABLE_NAMETABLE_SCHEMAINDEX_TYPEPARTITION_NAMENLSS_TABLE_NAMENLSS_TABLE_SCHEMA表 3 给出了 SYSIXADV 表的完整布局。假如表中已经有匹配的建议,则更新已有的行。例如,“Number of Times Advised”条目加一,“Last Advised for Query Use”被更新为当前时间。就原始格式而言,索引建议不一定是冗长的。虽然表中所有条目都是惟一的,但是有些条目仍然存在冗余。一个很好的例子就是,假如有相同的一些列被建议,建议的顺序有所不同,但这些键的顺序无关紧要,那么就会出现上述情况。在这种情况下,可以用这些列创建覆盖不同索引实例的一个索引。对被建议的键重新排序的时机可通过“Leading Keys Order Independent”列表明。这一列中列出的键是可以被重新排序,且仍然能够满足被建议的索引的领头键。被建议索引的示例我们来看一些索引建议的示例,以便为 condenser 的简化工作搭建背景。下面的例子假设所有建议都是基于相同表、相同分区、相同的索引类型和排序顺序的。表 1. 被建议索引的示例 1被建议的键
领头键,顺序无关
C1, C2, C3
C1, C2, C3
C1, C3, C2
C1
在这个例子中,建议的第二行不易变通。为了满足索引建议,一个永久的索引需要有顺序为 { C1, C3, C2 } 的键。但是,建议的第一行有很大的灵活性。领头键顺序无关这个细节表明,键之间可以按任意顺序排列,所以可以通过将 { C1, C2, C3 } 重新排序为 { C1, C3, C2 },将两行建议压缩成一个永久索引。假如扩展表 2 中的例子,使之包括第三行建议,那么仍然可以得出结论,附加的一个永久索引 { C1, C3, C2, C4 } 应该足以帮助优化器永久地提高这些查询的性能。表 2. 被建议索引的示例 2被建议的键
领头键,顺序无关
C1, C2, C3
C1, C2, C3
C1, C3, C2
C1
C1, C3, C2, C4
C1, C2, C3, C4
Index Advisor 与压缩的索引建议的比较压缩索引建议技术要求在服务器上安装以下 V5R4M0 5722-SS1 PTF:SI25391、SI25469 和 SI25470。当压缩索引建议时,原始索引建议变成概要形式。原始建议中的一些字段是特定于建议实例的,在概要形式中没有价值。为了保持压缩的建议的重要性,其它字段则很重要。 表 3 逐列解释了在索引建议压缩期间原始索引建议发生的变化。跟 Index Advisor 下相比,压缩的索引建议答应进行与之相同的 iSeries Navigator 动作,只有一个例外。由于压缩的索引建议不是永久存在的,因此没有“Remove from List”动作。表 3. Condenser 对列的更改列名
列标题
压缩动作
Table_NAME
建议索引时所基于的表
保留,不作更改
Table_SCHEMA
包含表的模式
保留,不作更改
SYSTEM_TABLE_NAME
建议索引时所基于的系统表的表名
保留,不作更改
PARTITION_NAME
索引的分区细节
保留,不作更改
KEY_COLUMNS_ADVISED
被建议索引的列名
生成
LEADING_COLUMN_KEYS
领头的、顺序无关的键,这些键在 Key_Columns_Advised 字段的开头部分,可以重新排列该字段且仍能满足被建议的索引
使用后丢弃
INDEX_TYPE
基数(默认)或编码向量索引(EVI)
保留,不作更改
LAST_ADVISED
该行的上一次更新时间
使用最新建议时间戳
TIMES_ADVISED
索引被建议的次数
通过总计生成
ESTIMATED_CREATION_TIME
估计创建索引所需的秒数
使用最大值
REASON_ADVISED
表明索引被建议的原因的原因码
丢弃
LOGICAL_PAGE_SIZE
建议用于索引的页面大小
使用最大值
MOST_EXPENSIVE_QUERY
查询的执行时间,单位为秒
使用最大值
AVERAGE_QUERY_ESTIMATE
查询的平均执行时间,单位为秒
通过求平均值生成
Table_SIZE
当索引被建议时表中的行数
使用最新建议中的值
NLSS_TABLE_NAME
用于索引的排序顺序表
保留,不作更改
NLSS_TABLE_SCHEMA
排序顺序表的库名
保留,不作更改
MTI_USED
因匹配的永久索引不存在,而使用与被建议定义相匹配的 MTI(被维护的临时索引,自主索引)的次数
丢弃
MTI_CREATED
这个特定的索引建议被用于创建 MTI 的次数
丢弃
LAST_MTI_USED
上一次因匹配的永久索引不存在而使用 MTI 的时间
丢弃
下面的 SQL 语句用于生成 图 1a 和 图 1b 中包含的原始索引建议。清单 1. 用于生成索引建议的数据库和查询-- Create sample database in CONDENSE schema
CALL QSYS.CREATE_SQL_SAMPLE('CONDENSE');
SET SCHEMA Condense;
SELECT e.firstnme, d.deptnmae FROM department d, employee e
WHERE e.job = 'DESIGNER' AND YEAR(e.birthdate) > 1950 AND e.sex = 'M';
SELECT e.firstnme, d.deptnmae FROM department d, employee e
WHERE YEAR(e.birthdate) = 1953 AND e.job = 'DESIGNER' AND e.sex IN ('M');
SELECT e.firstnme, d.deptnmae FROM department d, employee e
ORDER BY e.job, e.sex, e.birthdate;图 1b 只包含 图 1a 中放不下的索引建议属性。注重,‘Keys Advised’列下的键的顺序有所不同。图 1a. 被建议索引输出
图 1b. 被建议索引输出(续)在这个例子中,两个被建议索引的键顺序有足够的灵活性,答应将建议压缩成一个索引。图 2 显示了压缩的索引建议。除了为用户提供压缩列键顺序 { JOB, SEX, BIRTHDATE } 外,压缩的建议还包括帮助确定建议的重要性的上下文信息。通过“Times Advised for Query Use”和“Average of Query Estimates”等列可以看出永久索引能为这个环境带来多大的好处。而“Estimated Index Creation Time”列用于判定是否要将创建索引作为预定的活动。图 2. 压缩的索引建议iSeries Navigator 压缩器界面在 iSeries Navigator 中,有 Index Advisor 的地方就有压缩索引建议动作。图 3 显示了压缩器的图形化界面,该界面可以通过右键单击一个模式对象打开。也可以从一个表对象中进行访问。图 3. iSeries Navigator 压缩器界面为了使用压缩器的 iSeries Navigator 界面,需要在客户机上安装最新的 V5R4M0 iSeries access for Windows Service Pack。可编程压缩器接口除了 iSeries Navigator 界面以外,还可以用一条 SQL 语句以可编程方式访问索引建议压缩器。DB2 for i5/OS 在 QSYS2 模式中提供了一个新的视图 CondensedIndexAdvice。清单 2 显示了新的 CondensedIndexAdvice 视图返回的数据。由于 CondensedIndexAdvice 视图是用一个用户定义表函数(UDTF)实现的,因此该视图本身是只读的。任何修改该视图的尝试都会出现 SQL0150 错误。清单 2. CondensedIndexAdvice 视图定义QSYS2.CONDENSEDINDEXADVICE (TABLE_NAMEFOR COLUMN TABNAMEVARCHAR(258) CCSID 37 NOT NULL ,
TABLE_SCHEMAFOR COLUMN TABSCHEMACHAR(10) CCSID 37 NOT NULL ,
SYSTEM_TABLE_NAME FOR COLUMN SYS_TNAMECHAR(10) CCSID 37 NOT NULL ,
PARTITION_NAMEFOR COLUMN TABPARTVARCHAR(128) CCSID 37 DEFAULT NULL ,
KEY_COLUMNS_ADVISED FOR COLUMN KEYSADVVARCHAR(16000) CCSID 37 DEFAULT NULL ,
INDEX_TYPECHAR(14) CCSID 37 DEFAULT NULL ,
LAST_ADVISEDFOR COLUMN LASTADVTIMESTAMP DEFAULT NULL ,
TIMES_ADVISED FOR COLUMN TIMESADV BIGINT DEFAULT NULL ,
ESTIMATED_CREATION_TIME FOR COLUMN ESTTIMEINTEGER DEFAULT NULL ,
LOGICAL_PAGE_SIZE FOR COLUMN "PAGESIZE" INTEGER DEFAULT NULL ,
MOST_EXPENSIVE_QUERYFOR COLUMN QUERYCOSTINTEGER DEFAULT NULL ,
AVERAGE_QUERY_ESTIMATEFOR COLUMN QUERYEST INTEGER DEFAULT NULL ,
TABLE_SIZEBIGINT DEFAULT NULL ,
NLSS_TABLE_NAME FOR COLUMN NLSSNAME CHAR(10) CCSID 37 DEFAULT NULL ,
NLSS_TABLE_SCHEMA FOR COLUMN NLSSSCHEMA CHAR(10) CCSID 37 DEFAULT NULL )通过下面的 SELECT 语句可以看到,编写 SQL 语句来访问压缩的建议很简单。如前所述,压缩的索引建议分析可以在表级进行,也可以在模式级进行。清单 3. CondensedIndexAdvice 查询示例-- Condensed index advice for an entire schema, named CONDENSE
SELECT * FROM QSYS2.CONDENSEDINDEXADVICE WHERE table_schema = 'CONDENSE' ;
-- Condensed index advice for a specific table, named EMPLOYEE in CONDENSE schema
SELECT * FROM QSYS2.CONDENSEDINDEXADVICE
WHERE table_name = 'EMPLOYEE'AND table_schema = 'CONDENSE';
-- Condensed index advice for a range of schemas, where the average
-- query estimate driving the index advice is greater than 10 seconds
SELECT * FROM QSYS2.CONDENSEDINDEXADVICE
WHERE table_schema LIKE 'Q%' AND average_query_estimate > 10 ;新的 CondensedIndexAdvice 视图使用的 Condense_Advice UDTF 还可以直接通过用户查询来访问。下面是这个表函数的定义,另外还有一个简单的例子,用于演示如何使用该 UDTF。清单 4. Condense_Advice UDTFCREATE FUNCTION QSYS2.Condense_Advice(TABLE_SCHEMA VARCHAR(128),
TABLE_NAME VARCHAR(128) )
RETURNS TABLE(TABLE_PARTITION VARCHAR(128), KEY_COLUMNS_ADVISED VARCHAR(16000),
INDEX_TYPE CHAR(14), LAST_ADVISED TIMESTAMP, TIMES_ADVISED BIGINT,
ESTIMATED_CREATION_TIME INTEGER, LOGICAL_PAGE_SIZE INTEGER,
MOST_EXPENSIVE_QUERY INTEGER, AVERAGE_QUERY_ESTIMATE INTEGER,
TABLE_SIZE BIGINT, NLSS_TABLE_NAME CHAR(10),NLSS_TABLE_SCHEMA CHAR(10))
LANGUAGE C
NOT DETERMINISTIC
READS SQL DATA
CALLED ON NULL INPUT
SCRATCHPAD 325064
DISALLOW PARALLEL
FINAL CALL
CARDINALITY 1
EXTERNAL NAME 'QSYS/QDBSSUDF2(CONDENSE_ADVICE)'
PARAMETER STYLE DB2SQL;
-- Query the condenser UDTF directly, PRoviding selection criteria and ordering
-- the results of the 15 most important condensed entries
SELECT * FROM TABLE(QSYS2.CONDENSE_ADVICE('CRPDTA','B123456')) AS a
WHERE a.table_size >(1024*1024) AND MONTH(last_advised)= MONTH(CURRENT TIMESTAMP)
ORDER BY average_query_estimate DESC
FETCH FIRST 15 ROWS ONLY ;结束语不管是使用压缩索引建议还是原始索引建议,都是改善索引策略的一个有效的办法。在根据建议采取行动之前,需要考虑的重要的一点是查看已有的索引和它们的使用情况。由于任何索引都隐含着维护成本,因此任何性能调优活动的共同之处就是限制永久索引的数量。本文的主旨是,查看压缩的索引建议,以发现改善性能的机遇,并且在作出任何更改之前和之后,查看索引的使用情况。