admin 管理员组

文章数量: 1086019

Python进程池Pool的使用

1.进程池Pool

需要创建的子进程数量不多时,可以直接利用multiprocessing中的Process动态成生多个进程,但如果是上百甚至上千个目标,手动的去创建进程的工作量巨大,此时就可以用到multiprocessing模块提供的Pool方法。


初始化Pool时,可以指定一个最大进程数,当有新的请求提交到Pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果池中的进程数已经达到指定的最大值,那么该请求就会等待,直到池中有进程结束,才会用之前的进程来执行新的任务。

请看下面的实例:

import multiprocessing
import timedef copy_work():print("拷贝中....",multiprocessing.current_process().pid)time.sleep(0.3)if __name__ == '__main__':# 创建进程池, Pool(3) 表示创建容量为3个进程的进程池pool = multiprocessing.Pool(3)for i in range(10):# 利用进程池同步拷贝文件,进程池中的进程会必须等上一个进程退出才能执行下一个进程# pool.apply(copy_work)pool.apply_async(copy_work)pool.close()# 注意:如果使用异步方式执行copy_work任务,主线程不再等待子线程执行完毕再退出!pool.join()

同步方式:pool.apply() 运行结果:

异步方式 pool.apply_async(copy_work):

2. multiprocessing.Pool常用函数解析:

  • apply() 使用同步的方式,去执行。
  • apply_async(func[, args[, kwds]]):使用非阻塞方式调用func(并行执行,堵塞方式必须等待上一个进程退出才能执行下一个进程),args为传递给func的参数列表,kwds为传递给func的关键字参数列表;
  • close():关闭Pool,使其不再接受新的任务;
  • terminate():不管任务是否完成,立即终止;
  • join():主进程阻塞,等待子进程的退出, 必须在close或terminate之后使用;

3.进程池中的Queue

如果要使用Pool创建进程,就需要使用multiprocessing.Manager()中的Queue(),而不是multiprocessing.Queue(),否则会得到一条如下的错误信息:
RuntimeError: Queue objects should only be shared between processes through inheritance.

下面的实例演示了进程池中的进程如何通信:

import multiprocessing
import time# 写入数据的方法
def write_data(queue):# for循环 向消息队列中写入值for i in range(5):# 添加消息queue.put(i)time.sleep(0.2)# 创建读取数据的方法
def read_data(queue):# 循环读取数据while True:# 判断队列是否为空if queue.qsize() == 0:print("队列为空~")break# 从队列中读取数据result = queue.get()print(result)if __name__ == '__main__':# 创建进程池pool = multiprocessing.Pool(2)# 创建进程池队列queue = multiprocessing.Manager().Queue()# 在进程池中的进程间进行通信# 使用线程池同步的方式,先写后读# pool.apply(write_data, (queue, ))# pool.apply(read_data, (queue, ))# apply_async() 返回ApplyResult 对象result = pool.apply_async(write_data, (queue, ))# ApplyResult对象的wait() 方法,表示后续进程必须等待当前进程执行完再继续result.wait()pool.apply_async(read_data, (queue, ))pool.close()# 异步后,主线程不再等待子进程执行结束,再结束# join() 后,表示主线程会等待子进程执行结束后,再结束pool.join()

运行结果:

0
1
2
3
4
队列为空~

本文标签: Python进程池Pool的使用