PaddleLite使用X86预测部署

一、Docker或者Linux环境

Paddle-Lite 支持在Docker或Linux环境编译x86预测库。环境搭建参考编译环境准备

编译

1、 下载代码

  1. # 下载Paddle-Lite源码
  2. git clone https://github.com/PaddlePaddle/Paddle-Lite.git
  3. # 切换到release分支
  4. git checkout release/v2.6.0

2、 源码编译

  1. cd Paddle-Lite
  2. # 请在Paddle-Lite当前目录下执行脚本
  3. ./lite/tools/build.sh --build_python=ON x86
  4. # 其他可选择编译选项
  5. --with_log=ON/OFF # 编译支持LOG信息输出的预测库,默认值 ON
  6. --build_python=ON/OFF # 编译支持Python API的预测库,默认值 OFF
  7. --with_extra=ON/OFF # 编译支持全量算子的预测库,当Python打开时默认打开,否则为 OFF
  8. --with_static_mkl=ON/OFF # 编译静态链接的MKL库,否则为动态链接,默认值为 OFF

编译结果说明

x86编译结果位于 build.lite.x86/inference_lite_lib

  1. build.lite.x86/inference_lite_lib/
  2. ├── bin
  3. └── test_model_bin 可执行工具文件
  4. ├── cxx C++ 预测库和头文件
  5. ├── include C++ 头文件
  6. ├── paddle_api.h
  7. └── ...
  8. └── lib C++ 预测库
  9. ├── libpaddle_api_full_bundled.a C++ full_api 静态库
  10. ├── libpaddle_api_light_bundled.a C++ light_api 静态库
  11. ├── libpaddle_full_api_shared.so C++ full_api 动态库
  12. └── libpaddle_light_api_shared.so C++ light_api 动态库
  13. ├── demo
  14. ├── cxx
  15. ├── mobilenetv1_full 使用full_api 执行预测的C++ demo
  16. └── mobilenetv1_light 使用light_api 执行预测的C++ demo
  17. └── python
  18. ├── mobilenetv1_full_api.py 使用full_api 执行预测的Python demo
  19. └── mobilenetv1_light_api.py 使用light_api 执行预测的Python demo
  20. ├── python Python 预测库和whl
  21. ├── install
  22. ├── dist
  23. └── paddlelite-*.whl
  24. └── lib Python whl包依赖的库文件
  25. └── lite.so
  26. └── third_party
  27. └── mklml 依赖的第三方加速库Intel(R) MKL
  28. └── lib
  29. ├── libiomp5.so
  30. ├── libmklml_gnu.so
  31. └── libmklml_intel.so

x86预测API使用示例

1、mobilenetv1_full目录结构

  1. mobilenetv1_full/
  2. |-- CMakeLists.txt
  3. |-- build.sh
  4. |-- build.bat
  5. -- mobilenet_full_api.cc

本demo使用cmake构建CMakeLists.txt为cmake脚本,mobilenet_full_api.cc是x86示例的源代码、build.sh为编译的脚本。

2、demo使用方法

  1. # 1、编译
  2. cd mobilenetv1_full
  3. sh build.sh

编译结果为当前目录下的 mobilenet_full_api

  1. # 2、执行预测
  2. ./mobilenet_full_api ./mobilenet_v1

下载并解压模型mobilenet_v1到当前目录,执行以上命令进行预测。

  1. # 3、执行demo后输出结果如下,全一输入下mobilenet_v1的预测结果
  2. Output shape 1000
  3. Output[0]: 0.000191312
  4. Output[100]: 0.000159713
  5. Output[200]: 0.000264313
  6. Output[300]: 0.000210793
  7. Output[400]: 0.00103236
  8. Output[500]: 0.000110071
  9. Output[600]: 0.00482924
  10. Output[700]: 0.00184533
  11. Output[800]: 0.000202116
  12. Output[900]: 0.000585591

3、示例源码mobilenet_full_api.cc

  1. #include <iostream>
  2. #include <vector>
  3. #include "paddle_api.h"
  4. using namespace paddle::lite_api; // NOLINT
  5. int64_t ShapeProduction(const shape_t& shape) {
  6. int64_t res = 1;
  7. for (auto i : shape) res *= i;
  8. return res;
  9. }
  10. void RunModel(std::string model_dir) {
  11. // 1. Create CxxConfig
  12. CxxConfig config;
  13. config.set_model_dir(model_dir);
  14. config.set_valid_places({
  15. Place{TARGET(kX86), PRECISION(kFloat)},
  16. Place{TARGET(kHost), PRECISION(kFloat)}
  17. });
  18. // 2. Create PaddlePredictor by CxxConfig
  19. std::shared_ptr<PaddlePredictor> predictor =
  20. CreatePaddlePredictor<CxxConfig>(config);
  21. // 3. Prepare input data
  22. std::unique_ptr<Tensor> input_tensor(std::move(predictor->GetInput(0)));
  23. input_tensor->Resize({1, 3, 224, 224});
  24. auto* data = input_tensor->mutable_data<float>();
  25. for (int i = 0; i < ShapeProduction(input_tensor->shape()); ++i) {
  26. data[i] = 1;
  27. }
  28. // 4. Run predictor
  29. predictor->Run();
  30. // 5. Get output
  31. std::unique_ptr<const Tensor> output_tensor(
  32. std::move(predictor->GetOutput(0)));
  33. std::cout << "Output shape " << output_tensor->shape()[1] << std::endl;
  34. for (int i = 0; i < ShapeProduction(output_tensor->shape()); i += 100) {
  35. std::cout << "Output[" << i << "]: " << output_tensor->data<float>()[i]
  36. << std::endl;
  37. }
  38. }
  39. int main(int argc, char** argv) {
  40. if (argc < 2) {
  41. std::cerr << "[ERROR] usage: ./" << argv[0] << " naive_buffer_model_dir\n";
  42. exit(1);
  43. }
  44. std::string model_dir = argv[1];
  45. RunModel(model_dir);
  46. return 0;
  47. }

二、Windows环境

环境准备

编译环境需求

  • Windows 10 专业版
    • 目前Windows暂不支持GPU编译
  • Python 版本 2.7/3.5.1+ (64 bit)
  • pip 或 pip3 版本 9.0.1+ (64 bit)
  • Visual Studio 2015 Update3

安装步骤

  1. cmake 需要3.15版本, 可在官网下载,并添加到环境变量中。
  2. python 需要2.7 及以上版本, 可在官网下载
  3. git可以在官网下载,并添加到环境变量中

编译

1、 下载代码

  1. git clone https://github.com/PaddlePaddle/Paddle-Lite.git
  2. # 切换到release分支
  3. git checkout release/v2.7

2、 源码编译(需要按照提示输入对应的参数)

  1. cd Paddle-Lite
  2. lite\tools\build_windows.bat with_extra with_profile
  3. # 注意默认编译Windows X64平台,如果需要编译X86平台,需要加入build_x86选项
  4. lite\tools\build_windows.bat build_x86
  5. # 如果需要根据模型裁剪预测库,则需要在with_strip之后输入opt model dir的路径
  6. lite\tools\build_windows.bat with_strip D:\Paddle-Lite\opt_model_dir

编译脚本build_windows.bat,追加参数说明:

参数介绍
without_log可选,是否编译带日志的预测库(默认为ON,即日志打开)ONOFF
without_python可选,是否编译python预测库(默认为ON,即编译Python)ONOFF
with_extra可选,是否编译全量预测库(当Python打开时默认打开,否则为OFF),详情可参考预测库说明ONOFF
with_profile可选,是否支持分析器模式(默认为OFF)ONOFF
with_strip可选,是否根据模型裁剪预测库(默认为OFF),详情可参考裁剪预测库ONOFF
build_x86可选,是否编译X86平台预测库(默认为OFF,即编译X64平台)ONOFF
with_static_mkl可选,是否静态链接Intel(R) MKL加速库(默认为OFF,即动态链接)ONOFF
with_dynamic_crt可选,是否动态链接MSVC Rumtime即MD_DynamicRelease(默认为OFF,即静态链接)ONOFF

编译结果说明

x86编译结果位于 build.lite.x86/inference_lite_lib

具体内容说明:

1、 cxx文件夹:包含c++的库文件与相应的头文件

  • include : 头文件
  • lib : 库文件
    • 静态库文件:
      • libpaddle_api_full_bundled.lib :full_api 静态库
      • libpaddle_api_light_bundled.lib :light_api 静态库

2、 third_party 文件夹:依赖的第三方预测库mklml

  • mklml : Paddle-Lite预测库依赖的mklml数学库

3、 demo/cxx文件夹:x86预测库的C++ 示例demo

  • mobilenetv1_full :使用full_api 执行mobilenet_v1预测的C++ demo
  • mobilenetv1_light :使用light_api 执行mobilenet_v1预测的C++ demo

4、 demo/python: x86预测库的Python示例demo

  • mobilenetv1_full_api.py:使用full_api 执行mobilenet_v1预测的Python demo
  • mobilenetv1_light_api.py:使用full_api 执行mobilenet_v1预测的Python demo

5、 python文件夹:包含python的库文件和对应的.whl包

  • install文件夹:编译成功的.whl包位于install/dist/*.whl
  • lib文件夹:.whl包依赖的库文件

x86预测API使用示例

1、mobilenetv1_full目录结构

  1. mobilenetv1_full/
  2. |-- CMakeLists.txt
  3. |-- build.sh
  4. |-- build.bat
  5. `-- mobilenet_full_api.cc

本demo使用cmake构建CMakeLists.txt为cmake脚本,mobilenet_full_api.cc是x86示例的源代码、build.sh为Linux x86编译的脚本,build.bat为windows x86编译脚本。

2、demo使用方法

  1. # 1、编译
  2. cd mobilenetv1_full
  3. build.bat
  4. cd build

编译结果为当前目录下的 Release\mobilenet_full_api.exe

注意:当前示例为预测库在默认编译选项下编译,即基于 “X64平台” 和 “静态MSVC Rumtime”。如果预测库是基于 “X86平台” 或者 “动态MSVC Rumtime” 编译,请参照build_windows.batPaddle-Lite\CMakeList.txt,相应修改 build.batCMakeList.txt 中的相关配置使其预测库保持一致。

  1. # 2、执行预测
  2. Release\mobilenet_full_api.exe mobilenet_v1

下载并解压模型 mobilenet_v1 到当前build目录,执行以上命令进行预测。