说明:以下数据库操作基于SQL Server 2000
问题出现:
假设一个新闻系统,你需要获取最近一周的热点文章,一定会使用类似下面的SQL语句:
select top 50 newsID, newsTitle, newsRead from newstable where datediff("d", newsTime, getdate())<7 order by newsRead desc只要对newsID,newsRead,newsTime都有索引,用查询分析器分析成本发现成本非常小,在newstable数据量小的情况下,访问速度非常快。可是最近发现,当newstable到达200万条记录的时候,这条看似简单的语句执行居然要1分钟以上。
解决问题:
这个问题排查比较简单,去掉order by一样很慢,只能断定是datediff造成的。我们尝试把上面的语句分成2段:
第一条语句:select min(newsID) from newstable where datediff("d", newsTime, getdate())<7
第二条语句:select top 50 newsID, newsTitle, newsRead from newstable where newsID>[minID] order by newsRead desc其中[minID]是第一条语句的结果,我们发现:第二条语句执行非常快,关键是第一条慢。newsID和newsTime均有索引,这是为什么呢?
换一个思路,第一条语句基本等价为
第三条语句:select max(newsID) from newstable where datediff("d", newsTime, getdate())>=7奇怪了,第三条语句执行起来飞快,虽然问题是曲线解决了,可这又是为什么?难道和索引的排序次序有关?欢迎大家讨论。