使用工作队列进行精细的并行处理

在这个例子中,我们会运行一个Kubernetes Job,其中的 Pod 会运行多个并行工作进程。

在这个例子中,当每个pod被创建时,它会从一个任务队列中获取一个工作单元,处理它,然后重复,直到到达队列的尾部。

下面是这个示例的步骤概述

  1. 启动存储服务用于保存工作队列。 在这个例子中,我们使用 Redis 来存储工作项。在上一个例子中,我们使用了 RabbitMQ。在这个例子中,由于 AMQP 不能为客户端提供一个良好的方法来检测一个有限长度的工作队列是否为空,我们使用了 Redis 和一个自定义的工作队列客户端库。在实践中,您可能会设置一个类似于 Redis 的存储库,并将其同时用于多项任务或其他事务的工作队列。

  2. 创建一个队列,然后向其中填充消息。 每个消息表示一个将要被处理的工作任务。在这个例子中,消息只是一个我们将用于进行长度计算的整数。

  3. 启动一个 Job 对队列中的任务进行处理。这个 Job 启动了若干个 Pod 。每个 Pod 从消息队列中取出一个工作任务,处理它,然后重复,直到到达队列的尾部。

准备开始

你必须拥有一个 Kubernetes 的集群,同时你的 Kubernetes 集群必须带有 kubectl 命令行工具。 如果你还没有集群,你可以通过 Minikube 构建一 个你自己的集群,或者你可以使用下面任意一个 Kubernetes 工具构建:

要获知版本信息,请输入 kubectl version.

启动 Redis

对于这个例子,为了简单起见,我们将启动一个单实例的 Redis。 了解如何部署一个可伸缩、高可用的 Redis 例子,请查看 Redis 样例

如果您在使用本文档库的源代码目录,您可以进入如下目录,然后启动一个临时的 Pod 用于运行 Redis 和 一个临时的 service 以便我们能够找到这个 Pod

  1. $ cd content/en/examples/application/job/redis
  2. $ kubectl create -f ./redis-pod.yaml
  3. pod/redis-master created
  4. $ kubectl create -f ./redis-service.yaml
  5. service/redis created

如果您没有使用本文档库的源代码目录,您可以直接下载如下文件:

使用任务填充队列

现在,让我们往队列里添加一些“任务”。在这个例子中,我们的任务只是一些将被打印出来的字符串。

启动一个临时的可交互的 pod 用于运行 Redis 命令行界面。

  1. $ kubectl run -i --tty temp --image redis --command "/bin/sh"
  2. Waiting for pod default/redis2-c7h78 to be running, status is Pending, pod ready: false
  3. Hit enter for command prompt

现在按回车键,启动 redis 命令行界面,然后创建一个存在若干个工作项的列表。

  1. # redis-cli -h redis
  2. redis:6379> rpush job2 "apple"
  3. (integer) 1
  4. redis:6379> rpush job2 "banana"
  5. (integer) 2
  6. redis:6379> rpush job2 "cherry"
  7. (integer) 3
  8. redis:6379> rpush job2 "date"
  9. (integer) 4
  10. redis:6379> rpush job2 "fig"
  11. (integer) 5
  12. redis:6379> rpush job2 "grape"
  13. (integer) 6
  14. redis:6379> rpush job2 "lemon"
  15. (integer) 7
  16. redis:6379> rpush job2 "melon"
  17. (integer) 8
  18. redis:6379> rpush job2 "orange"
  19. (integer) 9
  20. redis:6379> lrange job2 0 -1
  21. 1) "apple"
  22. 2) "banana"
  23. 3) "cherry"
  24. 4) "date"
  25. 5) "fig"
  26. 6) "grape"
  27. 7) "lemon"
  28. 8) "melon"
  29. 9) "orange"

因此,这个键为 job2 的列表就是我们的工作队列。

注意:如果您还没有正确地配置 Kube DNS,您可能需要将上面的第一步改为 redis-cli -h $REDIS_SERVICE_HOST

创建镜像

现在我们已经准备好创建一个我们要运行的镜像

我们会使用一个带有 redis 客户端的 python 工作程序从消息队列中读出消息。

这里提供了一个简单的 Redis 工作队列客户端库,叫 rediswq.py (下载)。

Job 中每个 Pod 内的 “工作程序” 使用工作队列客户端库获取工作。如下:

application/job/redis/worker.py 使用工作队列进行精细的并行处理 - 图1
  1. #!/usr/bin/env python
  2. import time
  3. import rediswq
  4. host=”redis
  5. # Uncomment next two lines if you do not have Kube-DNS working.
  6. # import os
  7. # host = os.getenv(“REDIS_SERVICE_HOST”)
  8. q = rediswq.RedisWQ(name=”job2”, host=”redis”)
  9. print(“Worker with sessionID: + q.sessionID())
  10. print(“Initial queue state: empty=” + str(q.empty()))
  11. while not q.empty():
  12. item = q.lease(lease_secs=10, block=True, timeout=2)
  13. if item is not None:
  14. itemstr = item.decode(“utf-8”)
  15. print(“Working on + itemstr)
  16. time.sleep(10) # Put your actual work here instead of sleep.
  17. q.complete(item)
  18. else:
  19. print(“Waiting for work”)
  20. print(“Queue empty, exiting”)

如果您在使用本文档库的源代码目录,请将当前目录切换到 content/en/examples/application/job/redis/。否则,请点击链接下载 worker.pyrediswq.pyDockerfile。然后构建镜像:

  1. docker build -t job-wq-2 .

Push 镜像

对于 Docker Hub,请先用您的用户名给镜像打上标签,然后使用下面的命令 push 您的镜像到仓库。请将 <username> 替换为您自己的用户名。

  1. docker tag job-wq-2 <username>/job-wq-2
  2. docker push <username>/job-wq-2

您需要将镜像 push 到一个公共仓库或者 配置集群访问您的私有仓库

如果您使用的是 Google Container Registry,请先用您的 project ID 给您的镜像打上标签,然后 push 到 GCR 。请将 <project> 替换为您自己的 project ID

  1. docker tag job-wq-2 gcr.io/<project>/job-wq-2
  2. gcloud docker -- push gcr.io/<project>/job-wq-2

定义一个 Job

这是 job 定义:

application/job/redis/job.yaml 使用工作队列进行精细的并行处理 - 图2
  1. apiVersion: batch/v1
  2. kind: Job
  3. metadata:
  4. name: job-wq-2
  5. spec:
  6. parallelism: 2
  7. template:
  8. metadata:
  9. name: job-wq-2
  10. spec:
  11. containers:
  12. - name: c
  13. image: gcr.io/myproject/job-wq-2
  14. restartPolicy: OnFailure

请确保将 job 模板中的 gcr.io/myproject 更改为您自己的路径。

在这个例子中,每个 pod 处理了队列中的多个项目,直到队列中没有项目时便退出。因为是由工作程序自行检测工作队列是否为空,并且 Job 控制器不知道工作队列的存在,所以依赖于工作程序在完成工作时发出信号。工作程序以成功退出的形式发出信号表示工作队列已经为空。所以,只要有任意一个工作程序成功退出,控制器就知道工作已经完成了,所有的 Pod 将很快会退出。因此,我们将 Job 的 completion count 设置为 1 。尽管如此,Job 控制器还是会等待其它 Pod 完成。

运行 Job

现在运行这个 Job :

  1. kubectl create -f ./job.yaml

稍等片刻,然后检查这个 Job。

  1. $ kubectl describe jobs/job-wq-2
  2. Name: job-wq-2
  3. Namespace: default
  4. Selector: controller-uid=b1c7e4e3-92e1-11e7-b85e-fa163ee3c11f
  5. Labels: controller-uid=b1c7e4e3-92e1-11e7-b85e-fa163ee3c11f
  6. job-name=job-wq-2
  7. Annotations: <none>
  8. Parallelism: 2
  9. Completions: <unset>
  10. Start Time: Mon, 11 Jan 2016 17:07:59 -0800
  11. Pods Statuses: 1 Running / 0 Succeeded / 0 Failed
  12. Pod Template:
  13. Labels: controller-uid=b1c7e4e3-92e1-11e7-b85e-fa163ee3c11f
  14. job-name=job-wq-2
  15. Containers:
  16. c:
  17. Image: gcr.io/exampleproject/job-wq-2
  18. Port:
  19. Environment: <none>
  20. Mounts: <none>
  21. Volumes: <none>
  22. Events:
  23. FirstSeen LastSeen Count From SubobjectPath Type Reason Message
  24. --------- -------- ----- ---- ------------- -------- ------ -------
  25. 33s 33s 1 {job-controller } Normal SuccessfulCreate Created pod: job-wq-2-lglf8
  26. $ kubectl logs pods/job-wq-2-7r7b2
  27. Worker with sessionID: bbd72d0a-9e5c-4dd6-abf6-416cc267991f
  28. Initial queue state: empty=False
  29. Working on banana
  30. Working on date
  31. Working on lemon

您可以看到,其中的一个 pod 处理了若干个工作单元。

其它

如果您不方便运行一个队列服务或者修改您的容器用于运行一个工作队列,您可以考虑其它的 job 模式

如果您有连续的后台处理业务,那么可以考虑使用 replicationController 来运行您的后台业务,和运行一个类似 https://github.com/resque/resque 的后台处理库。