tensorflow中的队列和线程--粉丝服务平台-粉丝头条-fensifuwu.com

tensorflow中的队列和线程

科技 08-25 来源：机器学习之路

一、队列

tensorflow中主要有FIFOQueue和RandomShuffleQueue两种队列，下面就详细介绍这两种队列的使用方法和应用场景。

1、FIFOQueue

FIFOQueue是先进先出队列，主要是针对一些序列样本。如：在使用循环神经网络的时候，需要处理语音、文字、视频等序列信息的时候，我们希望处理的时候能够按照顺序进行，这时候就需要使用FIFOQueue队列。

线程代码示例

控制台输出结果

2、RandomShuffleQueue

RandomShuffleQueue是随机队列，队列在执行出队操作的时候，是以随机的顺序进行的。随机队列一般应用在我们训练模型的时候，希望可以无序的获取样本来进行训练，如：在训练图像分类模型的时候，需要输入的样本是无序的，就可以利用多线程来读取样本，将样本放到随机队列中，然后再利用主线程每次从随机队列中获取一个batch进行模型的训练。

代码示例

注意：在使用随机队列的时候，我们设置了队列的容量为10，最小长度为2。当队列的长度已经等于队列的容量(10)再执行入队操作或队列的长度已经等于最小长度(2)再执行出队操作时，程序会发生阻断，即程序在执行，但是没有任何输出，如下图：

控制台输出结果

定义了10次出队操作，当队列出队8次之后，就被阻断了。我们可以通过设置会话在运行时的等待时间来解除阻断：

控制台输出结果

当队列出队第9次的时候，进入阻断状态时，我们可以通过DeadlineExceededError来捕获阻断信息。二、队列管理器

在训练模型的时候，我们需要将样本从硬盘读取到内存之后，才能进行训练。会话中可以运行多个线程，我们可以在队列管理器中创建一系列新的线程进行入队操作，主线程可以利用队列中的数据进行训练，而不需要等到所有的样本都读取完成之后才开始训练，即数据的读取和模型的训练是异步的，这样可以节省不少时间。

代码示例

控制台输出结果

程序结束的时候，还报了一个tensorflow.python.framework.errors_impl.CancelledError: Enqueue operation was cancelled的异常。那是因为主线程已经完成了，入队线程还在继续执行导致程序没法结束从而报错。由于计数器加1操作和入队操作不同步，可能会由于计数器还没来得及进行加1操作就再次被执行入队操作，从而导致多次入队同样的数字，也就是为什么出队的时候会出现同样的数字。三、协调器

为了避免上述异常的发生，我们可以通过协调器来实现线程间的同步，来终止其他线程。