New Groovy --- Closure/Block问题 - 王朝网络宽屏版

在经历了从blog到mailing list的腥风血雨之后，New Groovy的Roadmap粉墨登场。一定程度上这是对最近一段时间尘嚣甚上的Groovy is dead的回应。另一方面，Groovy的苦谏者Mike Spille对于新Groovy特性的批评所得到的回应却是以wiki形式确定下来的文档。

所有新特性中争议最大的，当然就是此条：return/break/continue to behave inside closures like these statements work in other blocks (such as the block on a for() or while() loop.

简而言之，这就是统一block和closure。

这里我忍不住王婆卖瓜一下，其实我已经直觉出这个味道。我在1月16日在groovy-dev上re了Mike Spille一篇：

I think we should regard foo() {} as syntax-sugar, this feature eliminate the difference between built-in flow structure and user-defined method call.

If = { condition, doSth | if (condition) doSth() }

t = { println 'Hello!' }

if (true) { println 'Hello!' } // built-in if

If (true) { println 'Hello!' } // user-defined If is similar to

built-in if, that's groovy!

If(true, t) // normal method call

If(true, { println 'Hello!' }) // normal method call even the last

param is a anonymous closure

> The puzzling errors bit is also why I favor a keyword for closures. It'll

> not only greatly simplify the grammar and parser, but I think it's better

> for users too. It clearly signals where closures are in your code, and

> avoids the problems of _users_ not knowing when they have a closure and

> when they have a block.

I think there is no essential difference between closure and block. User have a block, then want to reuse the block. make the block can be passed or returned or parameterized --- that is closure.

现在看来，当时我已经接近摆脱最初仅仅视closure为javascript中anonymous function等价物的想法了。我已经直觉到此closure与一般block之间的微妙关系。

closure的syntax很大程度上消除了内建流程结构和用户定义方法的区别。换言之，我们可以很方便的写出接受closure参数的方法，使得其调用语法能非常类似while, when（不带else的if）的语法结构！虽然还是无法复制for(;;)和if-else这样特殊的语法构造，但这已经是很大的震撼。

进而，我发现，就应用程序员角度而言，block和closure并不存在本质区别。block可以看作一个代码段，而closure是可以重用（可传递、返回以及参数化）的代码段。

然而closure和传统flow控制具有一定的冲突，这主要表现在如何实现break、continue语义。之前的建议一般是要求closure返回一个特定常量标记如Closure.BREAK来指示，然后由closure的调用者负有责任来处理此标志。

更大的问题在于，同样作为代码功能抽象和复用的单位，closure与function(method)发生了冲突。这就是要命的return问题！

显然，按照一般思路，closure在底层就是一个function或者说method，匿名closure形同block的 { param | expression } 的简洁构造可被视作一种语法sugar。并且从最初一直到现在，此sugar主要是为了达到精巧的GPath的简洁性。且另一方面，在从js或者是对泛函式编程（fp）有点入门知识的人看来，closure都应该与function划上等号。

应该说，groovy的closure一开始也是如此。唯一是，同样为了GPath的简洁性，采用了可省略return的设计（直接返回最后一个语句的值）。

从此，groovy的codebase中，所有closure几乎都没有return关键字的出现。因为几乎没有必要，所以似乎没有理由记得它甚至提到它。由此，一扇门打开了……

考虑一个传统程序。这个函数检查名为file的文件的每一行，并返回满足filter的第一行行号，否则返回-1。

def findLine(file, filter) {

lineNo = 0

f = new File(file)

while(!f.isEOF()) {

line = f.readLine()

if (filter(line)) return lineNo;

else ++lineNo

}

return -1

}

现在一个newbie刚刚看了几个closure的例子，兴奋异常，于是换用closure style来撰写：

def findLine(file, filter) {

lineNo = 0

new File(file).eachLine { line |

if (filter(line)) return lineNo; else ++lineNo

}

return -1

}

Ok，一切看上去没错，代码更清晰的表达了程序的主旨，几乎没有多余的东西。

但是，不幸的是，这段程序在Classic Groovy里面是无法达到预期效果的，findLine总是返回-1！

因为在eachLine之后的匿名closure中的return是从该closure返回到eachLine方法内部的调用点上（事实上eachLine方法只是简单的忽略这个返回值，没有任何人期待它的到来），而不是如程序员所期望的返回给findLine的调用者！

ok，这是程序员的问题，误用了return——有人会简单的下结论。如何用建议的Closure.BREAK常量标志来达成这个功能先不论，仅仅考虑到这个return是多么直觉的事情，并且groovy的目标就是要让程序员能按直觉办事（去掉烦心的程序终结符;居然还允许跨行，就是例证），就不能简单的把问题归咎于程序员。

照例说，在这个结构里面，return的用意非常清楚，不带偏见的说，任何一个java程序员转向groovy之后几乎都会写出这样的程序。由于 closure大量被用于简化迭代结构（Martin Flower号称他因此在没有closure的语言中是如此怀念closure），对于从c-style转过来的程序员来说，面对最常使用的each，自然把它看作for, while结构的替代物，所以把return视作从findLine返回，而不是从匿名closure返回是狠自然的。

对此问题，Mike Spille的意见是：一切起因于closure实在太像block，程序员忘记了此处实际上是个语法sugar，本质是个method而并不是一个 block，因而诱导了程序员错误的期望该return的返回位置。既然如此，我们就应该明确哪里是block哪里是closure。其建议就是增加一个指示closure的关键字，譬如def { closure code... }

对此，有人尖锐的指出，那还不如去用C#的delegate！（另一方面，那也是js的实际情况，function关键字就相当于此关键字）

无论如何，情况很清楚：普通block和closure在syntax上如此相似以至于无法分辨，解决方案无外乎，区分它们（Mike Spille的建议），或者统一它们——使得break/return等的语义在block和closure中一致！

John Rose提出的并且为多数人接受的方案是，应该令closure的return如程序员最可能期望的那样行为：返回到定义其的函数上。并且他还参照 smalltalk, ruby, lisp等提出了break, continue在closure中的一揽子改进语法和语义。由此，通过在closure中使用continue L:value的语法结构，可以达到从label L处返回value的需求。（当然实际需要使用这样怪异的continue的机会其实很少，按照我一贯的语调——你当然可以用xxx，但是如果需要用到 xxx，那往往是坏味道的信号……）

对此提案，Mike Spille自然是全力反对，对此的指责还牵涉上了开发进度、管理模式等问题。如我没有看错，Mike Spille的rant（虽然他自己不承认）甚至多次要求几个核心人物下台……:D

顺便说一下，在我写前面那个mail的时候，还没有意识到这个问题。John Wilson的re中向我指出了这个棘手问题：

On 16 Jan 2005, at 13:53, Shijun He wrote:

> I think there is no essential difference between closure and block.

> User have a block, then want to reuse the block. make the block can be

> passed or returned or parameterized --- that is closure.

this is almost true but not quite..

if (a == 1) {

return // returns from enclosing function

}

a.each {

return // returns from closure

}

this (and break in a closure) catches people out a lot.

This has been discussed a great deal but we have not come up with a

solution which pleases everybody.

显然，要pleases everybody是mission impossible :( 事实上吵的天翻地覆……Mike Spille已经被冠以FUD的名号了。

最近几天，我也跟pt同志讨论了这个问题，并且还拉出了ruby和lisp/scheme来“寻根”。pt同志的意见与Mike Spille出奇的一致。pt坚持认为closure就应该是function，改变return的语义是不可接受的。但是ruby的现状却是更接近 John Rose所说的（至少匿名closure的return不返回closure本身而返回到上层函数）。如果我们不怀疑John Rose的专业水准（这点倒是连Mike Spille也承认的，John是个有多种语言经验的高手），那么closure的这种return语义，是Smalltalk的语言标准规定的，而 ruby有大量的概念是师从smalltalk的，closure应该也不例外。进一步的，连Groovy的主要设计者James Strachan都发话了：我们不是要改变什么，而是要把从来没有明确下来的return/break/continue的语义明确下来，是要把尚未完全实现的closure功能完全化。（我乱说一句：这个有马后炮之嫌:)）。

问题最后进入了“哲学”阶段（请千万不要误会我是在调侃哲学）。那就是“什么是closure”。显然，目前为止我更相信John Rose的说法，lisp以来的closure都是如此，即一种特殊的block结构体。连Mike Spille的许多议论也只是说，groovy的目标是java程序员，应此不必全盘“西化”，应首先考虑java程序员的接受程度，譬如 closure/block的统一会破坏对java程序结构的认识根基。（不过此点在我看了'Java中的closure'这篇奇闻逸事之后，就根本不能说服我了。）

common lisp，具有特殊的操作符就叫做block，还有return-from，可以return到任何指定的层级！可谓是超级彻底的block！！另一方面，pt强烈认为closure就是lambda，或者说是lambda在命令式语言（OO语言？）中的复制品。他还认为跳转到上级lex应该以 call/cc方式实现。俺对lisp/scheme所知甚少，也不可能想清楚这当子事情。不过至少有一点是清楚的：Groovy的选择已经作出，并且我也觉得这是符合其核心价值的。至于其与block, func, method的关系，我尚无力作出论断。先走着瞧吧……