新的架构、新的运行、新的开始
TensorFlow 2.0破天荒地抛弃了原有的架构,重新开始,整合了曾经为TensorFlow添加的多种组件,在2.0版本中,这些组件被打包成一个综合平台,可支持机器学习的工作流程(从训练到部署),即用一个新的架构从根本上代替了已有的架构。
可以看到新架构中的训练部分主要关注Python API,即训练的可用性、整洁性以及易用性。它通过使用“存档”的方式连接起训练与部署之间的桥梁。
模型的部署方式是多种多样,可以方便地使用多种端支持,使其能够运营在不同的平台上。而语言绑定(language binding)也有不同程度的支持,包括Swift、R和Julia等。
TensorFlow 2.0在1.x的基础上做了重新设计,重点放在了提升开发人员的工作效率上,确保2.0版本更加简单易用。TensorFlow 2.0为了提升易用性做了很多改进,例如对API做了精简,删除了冗余的API,使得API更加一致(例如统一了TensorFlow和tf.Keras的循环神经网络和优化器等),以及由静态计算图转变为了动态计算图等(这使得代码的编写和调试变得更加容易)。TensorFlow 2.0的一些主要变化说明如下。
(1)API精简
很多TensorFlow 1.x的API在2.0中被去掉或者改变了位置,还有一些则用新的API替换掉了。官方提供了一个转换工具,可以用来将1.X版本的代码升级到2.0,其主要的工作其实就是修改这些有变更的API。不过使用该工具不一定能够转换成功,转换成功后的代码也并不一定能够正常运行,很多时候还是需要人工修改。
(2)Eager Execution
Eager Execution(动态图机制)是TensorFlow从1.8版本开始正式加入的,但只是作为一种可选操作,在TensorFlow 2.0之前,TensorFlow默认的模式都是Graph Execution(静态图机制),TensorFlow 2.0将Eager Execution作为默认模式。在该模式下使用者能够更轻松地编写和调试代码,可以使用原生的Python控制语句,大大降低了学习和使用TensorFlow的门槛。在TensorFlow 2.0中,图(graph)和会话(session)都变成了底层实现,而不需要用户关心了。
(3)取消全局变量
TensorFlow 1.x非常依赖隐式全局命名空间。当调用tf.Variable创建变量时,该变量就会被放进默认的图中,即使忘记了指向它的Python变量,它也会留在那里。而当程序编写者想恢复这些变量时,就必须知道该变量的名称,如果没法控制这些变量的创建,也就无法做到这一点。TensorFlow 1.x中提供各种机制,旨在帮助用户再次找到程序设计者所创建的变量;而在2.0中则取消了所有的这些机制,支持默认的机制:跟踪变量。当TensorFlow不再用到创建的某个变量时,该变量就会被自动回收。
(4)使用函数而不是会话
在TensorFlow 1.x中,最常规的使用session.run()方法执行计算图,session.run()方法的调用类似于函数调用:指定输入数据和调用的方法,最后返回输出结果。为了保留静态图的一些优势,例如性能优化以及重用模块化的TensorFlow函数等,在TensorFlow 2.0中,可以使用tf.function来修饰Python函数以将其标记为即时(Just-In-Time)编译,从而TensorFlow可以将其作为单个图来执行。
(5)弃用collection
在TensorFlow 1.x中可以通过集合(collection)来管理不同类别的资源。例如使用tf.add_to_collection函数可以将资源加入一个或多个集合。使用tf.get_collection获取一个集合里面的所有资源。这些资源可以是张量、变量或者运行TensorFlow程序所需要的资源。这样的方法在TensorFlow框架的运行时是非常有用的,例如在训练神经网络时会大量使用集合管理技术,如通过tf.add_n(tf.get_collection("losses")获得总损失等。
由于collection控制变量很不友好,在TensorFlow 2.0中,弃用了collection,这样代码会更加清晰。例如新的总损失可以简写为:
Total_loss = loss_1 + loss_2
是不是简单到不敢让人相信!