| 導購 | 订阅 | 在线投稿
分享
 
 
 

由淺入深講解MySQL數據庫索引的選擇性

來源:互聯網  2008-06-01 03:22:20  評論

在MySQL中,對于索引的使用並是一直都采用正確的決定。

簡單表的示例:

CREATE TABLE `r2` (

ID` int(11) DEFAULT NULL,

ID1` int(11) DEFAULT NULL,

CNAME` varchar(32) DEFAULT NULL,

KEY `ID1` (`ID1`)

) ENGINE=MyISAM DEFAULT CHARSET=latin1

SELECT COUNT(*) FROM r2;

250001 (V1)

SELECT COUNT(*) FROM r2 WHERE ID1=1;

83036 (V2)

(execution time = 110 ms)

(ID1=1)條件查詢索引的選擇性是 V2/V1 = 0.3321 或 33.21%

一般來說(例如書 「SQL Tuning「),如果選擇性超過 20% 那麽全表掃描比使用索引性能更優。

我知道Oracle一直是在選擇性超過25%時會選擇全表掃描。

而MySQL呢:

mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1;

+----+-------------+-------+------+---------------+-----

| id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra |

+----+-------------+-------+------+---------------+-----

| 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE |

+----+-------------+-------+------+---------------+-----

這就是MySQL將會使用索引來完成這個查詢。

讓我們來對比索引查詢和全表掃描的執行時間:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms

如你所看到全表掃描要快2倍。

參考更特殊的例子:選擇性 ~95%:

SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2;

0.9492 = 94.92%;

說明MySQL將會用索引來完成查詢。

執行時間:

SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms

SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms

這次全表掃描要快4.6倍。

爲什麽MySQL選擇索引訪問查詢?

MySQL沒有計算索引的選擇性,只是預測邏輯IO操作的數量,並且我們的例子中間的邏輯IO數量,索引訪問要少于全表掃描。

最後我們得出結論,對于索引要小心使用,因爲它們並不能幫助所有的查詢。

在MySQL中,對于索引的使用並是一直都采用正確的決定。 簡單表的示例: CREATE TABLE `r2` ( ID` int(11) DEFAULT NULL, ID1` int(11) DEFAULT NULL, CNAME` varchar(32) DEFAULT NULL, KEY `ID1` (`ID1`) ) ENGINE=MyISAM DEFAULT CHARSET=latin1 SELECT COUNT(*) FROM r2; 250001 (V1) SELECT COUNT(*) FROM r2 WHERE ID1=1; 83036 (V2) (execution time = 110 ms) (ID1=1)條件查詢索引的選擇性是 V2/V1 = 0.3321 或 33.21% 一般來說(例如書 「SQL Tuning「),如果選擇性超過 20% 那麽全表掃描比使用索引性能更優。 我知道Oracle一直是在選擇性超過25%時會選擇全表掃描。 而MySQL呢: mysql> EXPLAIN SELECT COUNT(SUBNAME) FROM r2 WHERE ID1=1; +----+-------------+-------+------+---------------+----- | id | select_type | TABLE | type | possible_keys | KEY | key_len | ref | rows | Extra | +----+-------------+-------+------+---------------+----- | 1 | SIMPLE | t2 | ref | ID1 | ID1 | 5 | const | 81371 | USING WHERE | +----+-------------+-------+------+---------------+----- 這就是MySQL將會使用索引來完成這個查詢。 讓我們來對比索引查詢和全表掃描的執行時間: SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 410 ms SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 200 ms 如你所看到全表掃描要快2倍。 參考更特殊的例子:選擇性 ~95%: SELECT cnt2 / cnt1 FROM (SELECT count(*) cnt1 FROM r2) d1, (SELECT count(*) cnt2 FROM r2 WHERE ID1=1) d2; 0.9492 = 94.92%; 說明MySQL將會用索引來完成查詢。 執行時間: SELECT COUNT(SUBNAME) FROM t2 WHERE ID1=1 - 1200 ms SELECT COUNT(SUBNAME) FROM t2 IGNORE INDEX (ID1) WHERE ID1=1 - 260 ms 這次全表掃描要快4.6倍。 爲什麽MySQL選擇索引訪問查詢? MySQL沒有計算索引的選擇性,只是預測邏輯IO操作的數量,並且我們的例子中間的邏輯IO數量,索引訪問要少于全表掃描。 最後我們得出結論,對于索引要小心使用,因爲它們並不能幫助所有的查詢。
󰈣󰈤
王朝萬家燈火計劃
期待原創作者加盟
 
 
 
>>返回首頁<<
 
 
 
 
 熱帖排行
 
王朝網路微信公眾號
微信掃碼關註本站公眾號 wangchaonetcn
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有