将Tensorflow图序列化以及反序列化的巧妙方法
2018-07-20 来源:raincent
原标题 Smart way to serialize/deserialize classes to/from Tensorflow graph ,作者为 Francesco Zuppichini 。
将类中的字段和 graph 中的 tensorflow 变量进行自动绑定,并且在不需要手动将变量从 graph 中取出的情况下进行重存,听起来有没有很炫酷?
可以点击这里找到本文所涉及的代码。Jupyter-notebook 的版本点击这里。
假设你有一个 Model 类。
一般来说,首先需要构建模型,然后对模型进行训练。之后无需再次从头重新构建训练模型,而是从已经保存的 graph 中获取旧变量来进行使用。
假设我们已经训练好了模型,现在我们想要把它保存下来。通常的模式是:
接下来你会通过加载已保存的 graph 来执行 inference,也就是把变量取出的操作。在下面的例子中,我们将变量命名为 variable 。
现在我们可以从 graph 中取出变量 variable 。
假如我们想要再次使用 model 类要怎么办?如果我们尝试去调用 model.variable,得到的结果会是 None。
一个解决方案是重新构建整个模型,然后重新保存一个 graph 。
可以想见,这个过程肯定非常耗费时间。我们可以通过直接将 model.variable 绑定到相应的 graph 节点上来实现,如下:
假设我们有一个非常大的模型,且内含嵌套变量。
为了能够将变量指针正确的重存进模型,你需要
• 为每个变量命名
• 从 graph 中取回变量
如果可以通过在 Model 类中将变量设置为字段的方式来实现自动检索,这听起来就很酷,有没有?
TFGraphConvertible
我创建了一个 TFGraphConvertible 类,你可以用这个 TFGraphConvertible 类来自动进行类的序列化和反序列化。
让我们来重新创建我们的模型。
它会暴露两个方法: to_graph 和 from_graph 方法。
序列化?— ?to_graph
你可以通过调用 to_graph 方法来进行类的序列化,这个方法会创建一个以字段为 key , tensorflow 变量名为值的字典。
你想要序列化哪些字段来构建这个字典,那么你需要将这些字段作为 fields 参数传入。
在下例中,我们传入所有这些字段。
这会创建全量字典,以字段作为关键字,以每个字段对应的 tensorflow 变量名作为值。
反序列化?— ?from_graph
你可以通过调用 from_graph 方法来进行类的反序列化,这个方法通过我们在上文中构建的字典内容,将类中的字段绑定到对应的 tensorflow 变量上。
现在你恢复了 model 。
完整的例子
来看一个更有趣的例子!我们接下来要用 MNIST 数据集来训练/恢复一个模型。
首先,获取数据集。
现在我们用这个数据集来进行训练
完美!接下来我们将这个序列化后的模型存到内存中。
接着我们重置 graph,并且重建模型。
显而易见,变量并没有在 mnist_model 中。
我们通过调用 from_graph 方法来重建它们
现在 mnist_model 已经可以使用了,我们来看一下在测试集上的精确度如何吧。
结论
通过这次的教程,我们了解了如何进行类的序列化,以及如何在 tensorflow graph 中将类中的字段反绑到对应的变量上。
并且可以将 serialized_model 保存成 .json 格式,然后从任意位置直接加载它。
通过这种方式,你可以通过面向对象编程的方式来直接创建模型,且无需重新构建就可以索引到所有的变量。
原文链接:https://towardsdatascience.com/smart-way-to-srialize-deserialise-class-to-from-tensorflow-graph-1b131db50c7d
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。