LINQ 性能分析系列之传说中的LINQ

王朝other·作者佚名  2008-06-01
窄屏简体版  字體: |||超大  

话说自从 Beta1 发布以来,关于 .Net Framework 3.5 的讨论真是沸沸扬扬。我大概也算是比较早吃螃蟹的一位,Beta1 发布伊始就将它用于正式的开发中。虽然其间碰到过许许多多的 BUG,对于 .Net Framework 3.5 的核心特性 - LINQ,我个人感觉还是相当满足的。然而仅仅是 LINQ 比较酷的语法,绝不足以决定项目所用的技术。事实上,假如不是我这种个人作坊式的开发,评估新技术是否采用很重要的一点,就是它的性能是否令人满足。假如您还不了解 LINQ,可以通过简单的 VB9 示例作出感性的认知。

LINQ 基础示例

Dim Collection As String() = {"Beijing", "Shanghai", "Guangzhou", "Shenzhen", "Shijiazhuang", "Tianjin", "Taiyuan}

Console.WriteLine((From City In Collection Where City(0) = "T").First)

在此要强调一点,绝不要把 LINQ 与 Linq to SQL(DLINQ) 混为一谈,DLINQ 仅仅是 LINQ 的一个应用,绝非 LINQ 的全部。与 LINQ 一同来到的是大量的编译器特性,不论是 C#3 或是 VB9,都有着许多令人耳目一新的新语法特性。然而,由于 .Net Framework 3.x 都是 .Net Framework 2 的超集,所以所有的语法特性都不过是编译时的翻译。假如您试图反编译 LINQ 表达式,Lambda 或匿名函数,您将见到大批的函数嵌套,不知名的函数与其他令人头昏脑涨的程序结构。这一切都是编译器代为完成的。您无需担心 C# 中的 Var,或是 VB 中的无需 As 的变量定义带来的装/拆箱问题,它们将在 IL 中被推断为真实的数据类型。

探讨 LINQ 的性能问题时,我们将不仅局限于简单的时间比较,还将对 LINQ 的实现代码进行简单的分析,并就 Linq to SQL 生成的 T-SQL 语句讨论优化数据库性能的方法。工欲善其事,必先利其器,此系列中测试的平台基于 SQL Server 2005 SP2,反编译工具采用 Lutz Roeder's Reflector。

言归正传。由于应用了扩展方法,LINQ 得以查询任何现有 IEnumerable(Of T) 的内容。但是,性能问题却被隐藏在通用性与易用性之下。让我们做一个简短的测试,测试是使用 LINQ 获取一个随机数字数组的开头,结尾与总计,并与传统方式按数组索引获取作出对比。测试代码如下:

Visual Basic 9 - LINQ 性能测试: 获取随机数组数据

Sub Main()

Dim Start As Integer

For Count As Integer = 0 To 2

Dim Random As New Random

Dim TempArray As New List(Of Integer)

'生成测试数组

For I As Integer = 0 To 50000

TempArray.Add(Random.Next(10000, 99999))

Next

'进行测试查询

Dim Source As Integer() = TempArray.ToArray

'计算时间

'获取最后一条

Start = Timer

Dim Last As Integer, First As Integer, Length As Integer

For I As Integer = 0 To 500000

Last = Source.Last

First = Source.First

Length = Source.Count

Next

System.Console.WriteLine("Linq 查询数组首末与统计耗时: " & Math.Abs(Timer -Start) * 1000 & " 毫秒")

'方法2: 计算时间

Start = Timer

'获取最后一条

Length = Source.Length - 1

For I As Integer = 0 To 500000

Last = Source(Length - 1)

First = Source(0)

Length = Source.Length

Next

System.Console.WriteLine("传统查询数组首末与统计耗时: " & Math.Abs(Timer - Start) * 1000 & " 毫秒")

Next

End Sub

程序运行于 Release 模式下,连续测试3次。测试结果如下:

Linq 查询数组首末与统计耗时: 2109.375 毫秒

传统查询数组首末与统计耗时: 296.875 毫秒

Linq 查询数组首末与统计耗时: 2406.25 毫秒

传统查询数组首末与统计耗时: 406.25 毫秒

Linq 查询数组首末与统计耗时: 2156.25 毫秒

传统查询数组首末与统计耗时: 218.75 毫秒

看到这里,通用的 LINQ 与传统方法的差距就已明了。虽然仅仅是管中窥豹式的简单测试,但各位若无必要,还是尽量使用原生于数组的功能。当然,各位看官欲知为何差距如此之大,且听下回分解。水平有限,若有错谬,敬请谅解并指出。

本文作者保留全部权力,禁止用于商业用途,非商业用途转载请附加 www.soobb.com链接。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航