Python多进程的使用详情

前言

前面我们介绍了多线程的使用,这篇文章将来学习多进程的使用。

进程的创建

Python的multiprocessing模块提供了Process类,该类可用来在各平台下创建新进程。其构造函数是:

__init__(self, group=None, target=None, name=None, args=(), kwargs={})

其中,各个参数的含义如下:

  1. group: 该参数未实现,不需要传参
  2. target:为新建进程指定执行任务,也就是指定一个函数
  3. args:以元组的方式,为target指定的方法传递参数,如果传入的是元组中有多个参数的话则传入方式是(arg1,arg2,....argn,)
  4. kwargs:以字典的方法,为target指定的方法传递参数。
  5. name: 为新建进程设置名称
一些常用方法介绍
  1. start() 方法用于启动进程
  2. run() 方法用于运行所要执行的任务
  3. is_alive() 方法用于判断当前进程是否还活着
  4. getPid() 方法用于获取进程的ID号。
1.直接创建Process类的实例对象,由此就可以创建一个新的进程;

这个就类似于直接创建实例化线程Thread类

from multiprocessing import Process
import os
# 定义要调用的方法
def async_fun(name, add):
    for arc in add:
        print(name + str(os.getpid()) + " " + arc)

if __name__ == '__main__':
    my_tuple = ("码农飞哥", "今天是宅家的一天", "30岁了还没对象焦虑呀")

    # 创建进程
    process = Process(target=async_fun, args=("子进程", my_tuple))
    # 启动子进程
    process.start()
    # 启动主进程
    async_fun("主进程", my_tuple)

运行结果是:

主进程11610 码农飞哥
主进程11610 今天是宅家的一天
主进程11610 30岁了还没对象焦虑呀
子进程11612 码农飞哥
子进程11612 今天是宅家的一天
子进程11612 30岁了还没对象焦虑呀

这里需要注意的一点是,必须要将代码放在if __name__ == '__main__': 代码块中。通过os.getpid()方法来获取进程号。

2.通过继承Process类的子类,创建实例对象,也可以创建新的进程。

第二种方式就是通过继承Process类的子类,创建实例对象,也可以创建新的进程,不过这种方式需要重写父类的run()方法。这种方法就类似于直接继承Thread类创建线程。

import multiprocessing
import os


# 定义要调用的方法
def async_fun(name, add):
    for arc in add:
        print(name + str(os.getpid()) + " " + arc)


class MyProcess(multiprocessing.Process):
    def __init__(self, name, add):
        multiprocessing.Process.__init__(self)
        self.add = add
        self.name = name
        # 重写run()方法

    def run(self):
        async_fun(self.name, self.add)


if __name__ == '__main__':
    my_tuple = ("码农飞哥", "今天是宅家的一天", "宅家也不能虚度")
    myprocess = MyProcess("子进程", my_tuple)
    myprocess.start()
    # 主进程
    async_fun("主进程", my_tuple)

运行结果同上。

这里还是推荐使用第一种方法创建进程,因为这种方式创建进程比较简洁

进程池的使用

由于创建进程对系统的开销比较大。所以,所以在实际开发中一般都会使用进程池来创建进程。进程池的使用与线程池的使用也是有神似的地方。同样的在multiprocessing模块中提供了Pool函数来创建进程池。

import os
from multiprocessing import Pool
import time


# 定义要调用的方法
def async_fun(add):
    time.sleep(1)
    print("进程号:" + str(os.getpid()) + " " + add)


if __name__ == '__main__':
    add = "码农飞哥,今天是宅家的一天,30岁了还没对象焦虑呀"
    # 创建包含4个进程的进程池
    pool = Pool(processes=4)
    # 提交action
    pool.apply_async(func=async_fun, args=(add,))
    pool.apply_async(func=async_fun, args=("加油加油",))
    pool.close()
    pool.join()

运行结果是:

进程号:11658 码农飞哥,今天是宅家的一天,30岁了还没对象焦虑呀
进程号:11659 加油加油

同样的进程池也可以通过with语句来创建

from multiprocessing import Pool
import os
import time


def async_add(max):
    time.sleep(1)
    print("进程号:" + str(os.getpid()) + "最大值是" + str(max))


if __name__ == '__main__':
    with Pool(processes=4) as pool:
        # 使用线程池执行max计算
        results = pool.map(async_add, (20, 30, 40, 50))

运行结果是:

进程号:11726最大值是20
进程号:11725最大值是30
进程号:11727最大值是40
进程号:11728最大值是50
多进程和多线程的优缺点对比

多进程的优点就是稳定性好,一个子进程崩溃了,不会影响主进程以及其余子进程,各个子进程各用一套独立的内存空间。多线程的优点就是效率高,适用于批处理等功能。

多进程的缺点就是创建进程的代价非常大,因为操作系统要给每个进程分配固定的资源,并且操作系统对进程的总数会有一定的限制,若进程过多,操作系统调度都会存在问题,会造成假死状况。

收藏 (0)
评论列表
正在载入评论列表...
我是有底线的
为您推荐
    暂时没有数据