Как использовать метод `multiprocessing.join()` для синхронизации завершения процессов?

Краткий ответ

Метод join() в модуле multiprocessing используется для того, чтобы главный процесс дождался завершения дочернего процесса. Он блокирует выполнение основного процесса, пока дочерний процесс, для которого он вызван, не завершится. Например:


import multiprocessing
import time

def worker():
  print("Дочерний процесс стартовал")
  time.sleep(2)
  print("Дочерний процесс завершился")

if __name__ == '__main__':
  process = multiprocessing.Process(target=worker)
  process.start()
  print("Главный процесс ждет завершения дочернего")
  process.join() # Главный процесс ждет завершения process
  print("Главный процесс завершился")

Без join() главный процесс завершился бы раньше, чем дочерний. Аргумент timeout (в секундах) может быть передан в join(), чтобы указать максимальное время ожидания завершения дочернего процесса. Если время истекает, главный процесс продолжит выполнение, даже если дочерний процесс еще не завершен.

Полный ответ

Метод multiprocessing.join() используется для того, чтобы убедиться, что дочерний процесс завершил свою работу, прежде чем продолжит выполнение основной поток (родительский процесс). Он позволяет синхронизировать процессы, предотвращая возникновение race conditions или других проблем, связанных с асинхронным выполнением.

Как это работает:

Создание процесса: Сначала создается объект multiprocessing.Process, представляющий дочерний процесс. Ему передается функция (цель), которая будет выполняться в отдельном процессе.
Запуск процесса: Вызывается метод start() для запуска процесса. Это начинает выполнение целевой функции в новом процессе параллельно с основным потоком.
Вызов join(): После запуска процесса, в основном потоке вызывается метод join() для объекта Process. Этот метод блокирует выполнение основного потока до тех пор, пока дочерний процесс, с которым он связан, не завершится.
Завершение процесса: Когда целевая функция в дочернем процессе завершает свою работу, процесс завершается.
Продолжение основного потока: Как только дочерний процесс завершился, метод join() возвращает управление основному потоку, и основной поток продолжает выполнение.

Пример использования:


import multiprocessing
import time

def worker(num):
  print(f"Процесс {num}: Начал работу")
  time.sleep(2)  # Имитация выполнения задачи
  print(f"Процесс {num}: Завершил работу")

if __name__ == '__main__':
  processes = []
  for i in range(3):
    p = multiprocessing.Process(target=worker, args=(i,))
    processes.append(p)
    p.start()

  print("Основной поток: Ожидание завершения процессов...")
  for p in processes:
    p.join() #Ждем завершения каждого процесса

  print("Основной поток: Все процессы завершены")

Объяснение примера:

В этом примере создается три дочерних процесса, каждый из которых выполняет функцию worker().
Функция worker() имитирует выполнение задачи с помощью time.sleep().
В основном потоке после запуска всех процессов, цикл перебирает созданные процессы и вызывает join() для каждого из них. Это гарантирует, что основной поток будет ждать завершения каждого дочернего процесса, прежде чем продолжить.
Вывод на консоль показывает, что основной поток продолжает выполнение только после того, как все дочерние процессы завершили свою работу.

Важные замечания:

Если не вызвать join(), основной поток может завершиться до того, как дочерние процессы закончат свою работу, что может привести к неожиданному поведению или потере данных.
Можно передать необязательный аргумент timeout в метод join(timeout). Если процесс не завершится в течение указанного времени, join() вернет управление, не дожидаясь завершения процесса. Это полезно для предотвращения зависания основного потока в случае, если дочерний процесс завис.

Хотите сохранять прогресс подготовки? Тогда пройдите регистрацию на сайте.

Нашли ошибку?