8.7 闭包
本章到目前为止,所有的函数字面量示例,都只是引用了传入的参数。例如,在(x: Int) => x > 0中,唯一在函数体x > 0中用到的变量是x,即这个函数的唯一参数。不过,也可以引用其他地方定义的变量:
这个函数将“more”也作为入参,不过more是哪里来的?从这个函数的角度来看,more是一个自由变量(free variable),因为函数字面量本身并没有给more赋予任何含义。相反,x是一个绑定变量(bound variable),因为它在该函数的上下文里有明确的含义:它被定义为该函数的唯一参数,一个Int。如果单独使用这个函数字面量,而并没有在任何处于作用域内的地方定义more,编译器将报错:
为什么要多这么一个下画线?
Scala用于表示部分应用函数的语法体现了Scala在设计取舍方面跟其他经典函数式编程语言(比如Haskell或ML)的区别。在这些函数式语言当中,部分应用函数被当作默认的用法。不仅如此,这些语言拥有非常严格的静态类型系统,通常对于你在做部分应用时会犯的每一种错误都有明确的提示。Scala在这方面跟指令式编程语言(比如Java)更为接近,对于那些没有给出全部参数的方法,都认为是错误。还有,面向对象的传统的子类型和全局公共的根类型等特性,允许某些在经典的函数式编程语言看来是有问题的程序通过编译。
举例来说,假定你本来想调用List的tail,但是却误用了drop(n: Int)。也就是说你忘记传入一个数值给drop,可能会写“println(xs.drop)”。如果Scala采纳了经典的函数式传统,即到处都允许部分应用的函数,这段代码会通过类型检查。但是,你可能会意外地发现,这句println打印出的输出永远都是<function>!这背后发生的是表达式drop被当作函数对象处理了。由于println接收任何类型的对象,这段代码能够正常编译,但结果并不是我们预期的。
要避免这类情况发生,Scala通常要求你明确指出那些你特意省去的参数,哪怕只是简单地加上_就好。Scala仅仅在明确预期函数类型的地方允许你省掉_。
另一方面,只要能找到名为more的变量,同样的函数字面量就能正常工作:
运行时从这个函数字面量创建出来的函数值(对象)被称作闭包(closure)。该名称源于“捕获”其自由变量从而“闭合”该函数字面量的动作。没有自由变量的函数字面量,比如(x: Int) => x + 1,称为闭合语(closed term),这里的语(term)指的是一段源代码。因此,运行时从这个函数字面量创建出来的函数值严格来说并不是一个闭包,因为(x: Int) => x + 1按照目前这个写法已经是闭合的了。而运行时从任何带有自由变量的函数字面量,比如(x: Int) => x + more,创建的函数值,按照定义,要求捕获到它的自由变量more的绑定。相应的函数值结果(包含指向被捕获的more变量的引用)就被称作闭包,因为函数值是通过闭合这个开放语(open term)的动作产生的。
这个例子带来一个问题:如果more在闭包创建以后被改变会发生什么?在Scala中,答案是闭包能够看到这个改变。参考下面的例子:
很符合直觉的是,Scala的闭包捕获的是变量本身,而不是变量引用的值。[6]正如前面示例所展示的,为(x: Int) => x + more创建的闭包能够看到闭包外对more的修改。反过来也是成立的:闭包对捕获到的变量的修改也能在闭包外被看到。参考下面的例子:
这个例子通过绕圈的方式来对List中的数字求和。sum这个变量位于函数字面量sum += _的外围作用域,这个函数将数字加给sum。虽然运行时是这个闭包对sum进行的修改,最终的结果-11仍然能被闭包外部看到。
那么如果一个闭包访问了某个随着程序运行会产生多个副本的变量会如何呢?例如,如果一个闭包使用了某个函数的局部变量,而这个函数又被调用了多次,会怎么样?闭包每次访问到的是这个变量的哪一个实例呢?
只有一个答案是跟Scala其他组成部分是一致的:闭包引用的实例是在闭包被创建时活跃的那一个。参考下面这个创建并返回“增加”闭包的函数:
该函数每调用一次,就会创建一个新的闭包。每个闭包都会访问那个在它创建时活跃的变量more。
当你调用makeIncreaser(1)时,一个捕获了more的绑定值1的闭包就被创建并返回出来。同理,当你调用makeIncreaser(9999)时,返回的是一个捕获了more的绑定值9999的闭包。当你将这些闭包应用到入参(本例中只有一个必选参数x),其返回结果取决于闭包创建时more的定义:
这里more是某次方法调用的入参,而方法已经返回了,不过这并没有影响。Scala编译器会重新组织和安排,让被捕获的参数在堆上继续存活。这样的安排都是由编译器自动帮我们完成的,你并不需要关心。看到喜欢的变量,只管捕获就好:val、var或者参数,都没问题。