6-6,使用tensorflow-serving部署模型

TensorFlow训练好的模型以tensorflow原生方式保存成protobuf文件后可以用许多方式部署运行。

例如:通过 tensorflow-js 可以用javascrip脚本加载模型并在浏览器中运行模型。

通过 tensorflow-lite 可以在移动和嵌入式设备上加载并运行TensorFlow模型。

通过 tensorflow-serving 可以加载模型后提供网络接口API服务,通过任意编程语言发送网络请求都可以获取模型预测结果。

通过 tensorFlow for Java接口,可以在Java或者spark(scala)中调用tensorflow模型进行预测。

我们主要介绍tensorflow serving部署模型、使用spark(scala)调用tensorflow模型的方法。

〇,tensorflow serving模型部署概述

使用 tensorflow serving 部署模型要完成以下步骤。

  • (1) 准备protobuf模型文件。

  • (2) 安装tensorflow serving。

  • (3) 启动tensorflow serving 服务。

  • (4) 向API服务发送请求,获取预测结果。

可通过以下colab链接测试效果《tf_serving》: https://colab.research.google.com/drive/1vS5LAYJTEn-H0GDb1irzIuyRB8E3eWc8

  1. %tensorflow_version 2.x
  2. import tensorflow as tf
  3. print(tf.__version__)
  4. from tensorflow.keras import *

一,准备protobuf模型文件

我们使用tf.keras 训练一个简单的线性回归模型,并保存成protobuf文件。

  1. import tensorflow as tf
  2. from tensorflow.keras import models,layers,optimizers
  3. ## 样本数量
  4. n = 800
  5. ## 生成测试用数据集
  6. X = tf.random.uniform([n,2],minval=-10,maxval=10)
  7. w0 = tf.constant([[2.0],[-1.0]])
  8. b0 = tf.constant(3.0)
  9. Y = X@w0 + b0 + tf.random.normal([n,1],
  10. mean = 0.0,stddev= 2.0) # @表示矩阵乘法,增加正态扰动
  11. ## 建立模型
  12. tf.keras.backend.clear_session()
  13. inputs = layers.Input(shape = (2,),name ="inputs") #设置输入名字为inputs
  14. outputs = layers.Dense(1, name = "outputs")(inputs) #设置输出名字为outputs
  15. linear = models.Model(inputs = inputs,outputs = outputs)
  16. linear.summary()
  17. ## 使用fit方法进行训练
  18. linear.compile(optimizer="rmsprop",loss="mse",metrics=["mae"])
  19. linear.fit(X,Y,batch_size = 8,epochs = 100)
  20. tf.print("w = ",linear.layers[1].kernel)
  21. tf.print("b = ",linear.layers[1].bias)
  22. ## 将模型保存成pb格式文件
  23. export_path = "./data/linear_model/"
  24. version = "1" #后续可以通过版本号进行模型版本迭代与管理
  25. linear.save(export_path+version, save_format="tf")
  1. #查看保存的模型文件
  2. !ls {export_path+version}
  1. assets saved_model.pb variables
  1. # 查看模型文件相关信息
  2. !saved_model_cli show --dir {export_path+str(version)} --all
  1. MetaGraphDef with tag-set: 'serve' contains the following SignatureDefs:
  2. signature_def['__saved_model_init_op']:
  3. The given SavedModel SignatureDef contains the following input(s):
  4. The given SavedModel SignatureDef contains the following output(s):
  5. outputs['__saved_model_init_op'] tensor_info:
  6. dtype: DT_INVALID
  7. shape: unknown_rank
  8. name: NoOp
  9. Method name is:
  10. signature_def['serving_default']:
  11. The given SavedModel SignatureDef contains the following input(s):
  12. inputs['inputs'] tensor_info:
  13. dtype: DT_FLOAT
  14. shape: (-1, 2)
  15. name: serving_default_inputs:0
  16. The given SavedModel SignatureDef contains the following output(s):
  17. outputs['outputs'] tensor_info:
  18. dtype: DT_FLOAT
  19. shape: (-1, 1)
  20. name: StatefulPartitionedCall:0
  21. Method name is: tensorflow/serving/predict
  22. WARNING:tensorflow:From /tensorflow-2.1.0/python3.6/tensorflow_core/python/ops/resource_variable_ops.py:1786: calling BaseResourceVariable.__init__ (from tensorflow.python.ops.resource_variable_ops) with constraint is deprecated and will be removed in a future version.
  23. Instructions for updating:
  24. If using Keras pass *_constraint arguments to layers.
  25. Defined Functions:
  26. Function Name: '__call__'
  27. Option #1
  28. Callable with:
  29. Argument #1
  30. inputs: TensorSpec(shape=(None, 2), dtype=tf.float32, name='inputs')
  31. Argument #2
  32. DType: bool
  33. Value: False
  34. Argument #3
  35. DType: NoneType
  36. Value: None
  37. Option #2
  38. Callable with:
  39. Argument #1
  40. inputs: TensorSpec(shape=(None, 2), dtype=tf.float32, name='inputs')
  41. Argument #2
  42. DType: bool
  43. Value: True
  44. Argument #3
  45. DType: NoneType
  46. Value: None
  47. Function Name: '_default_save_signature'
  48. Option #1
  49. Callable with:
  50. Argument #1
  51. inputs: TensorSpec(shape=(None, 2), dtype=tf.float32, name='inputs')
  52. Function Name: 'call_and_return_all_conditional_losses'
  53. Option #1
  54. Callable with:
  55. Argument #1
  56. inputs: TensorSpec(shape=(None, 2), dtype=tf.float32, name='inputs')
  57. Argument #2
  58. DType: bool
  59. Value: True
  60. Argument #3
  61. DType: NoneType
  62. Value: None
  63. Option #2
  64. Callable with:
  65. Argument #1
  66. inputs: TensorSpec(shape=(None, 2), dtype=tf.float32, name='inputs')
  67. Argument #2
  68. DType: bool
  69. Value: False
  70. Argument #3
  71. DType: NoneType
  72. Value: None

二,安装 tensorflow serving

安装 tensorflow serving 有2种主要方法:通过Docker镜像安装,通过apt安装。

通过Docker镜像安装是最简单,最直接的方法,推荐采用。

Docker可以理解成一种容器,其上面可以给各种不同的程序提供独立的运行环境。

一般业务中用到tensorflow的企业都会有运维同学通过Docker 搭建 tensorflow serving.

无需算法工程师同学动手安装,以下安装过程仅供参考。

不同操作系统机器上安装Docker的方法可以参照以下链接。

Windows: https://www.runoob.com/docker/windows-docker-install.html

MacOs: https://www.runoob.com/docker/macos-docker-install.html

CentOS: https://www.runoob.com/docker/centos-docker-install.html

安装Docker成功后,使用如下命令加载 tensorflow/serving 镜像到Docker中

docker pull tensorflow/serving

三,启动 tensorflow serving 服务

  1. !docker run -t --rm -p 8501:8501 \
  2. -v "/Users/.../data/linear_model/" \
  3. -e MODEL_NAME=linear_model \
  4. tensorflow/serving & >server.log 2>&1

四,向API服务发送请求

可以使用任何编程语言的http功能发送请求,下面示范linux的 curl 命令发送请求,以及Python的requests库发送请求。

  1. !curl -d '{"instances": [1.0, 2.0, 5.0]}' \
  2. -X POST http://localhost:8501/v1/models/linear_model:predict
  1. {
  2. "predictions": [[3.06546211], [5.01313448]
  3. ]
  4. }
  1. import json,requests
  2. data = json.dumps({"signature_name": "serving_default", "instances": [[1.0, 2.0], [5.0,7.0]]})
  3. headers = {"content-type": "application/json"}
  4. json_response = requests.post('http://localhost:8501/v1/models/linear_model:predict',
  5. data=data, headers=headers)
  6. predictions = json.loads(json_response.text)["predictions"]
  7. print(predictions)
  1. [[3.06546211], [6.02843142]]

如果对本书内容理解上有需要进一步和作者交流的地方,欢迎在公众号”Python与算法之美”下留言。作者时间和精力有限,会酌情予以回复。

也可以在公众号后台回复关键字:加群,加入读者交流群和大家讨论。

image.png