3.6 检测MPI的并行环境

NOTE:此示例代码可以在 https://github.com/dev-cafe/cmake-cookbook/tree/v1.0/chapter-03/recipe-06 中找到,包含一个C++和一个C的示例。该示例在CMake 3.9版(或更高版本)中是有效的,并且已经在GNU/Linux、macOS和Windows上进行过测试。https://github.com/dev-cafe/cmake-cookbook/tree/v1.0/chapter-03/recipe-06 中也有一个适用于CMake 3.5的C示例。

消息传递接口(Message Passing Interface, MPI),可以作为OpenMP(共享内存并行方式)的补充,它也是分布式系统上并行程序的实际标准。尽管,最新的MPI实现也允许共享内存并行,但高性能计算中的一种典型方法就是,在计算节点上OpenMP与MPI结合使用。MPI标准的实施包括:

  1. 运行时库
  2. 头文件和Fortran 90模块
  3. 编译器的包装器,用来调用编译器,使用额外的参数来构建MPI库,以处理目录和库。通常,包装器mpic++/mpiCC/mpicxx用于C++,mpicc用于C,mpifort用于Fortran。
  4. 启动MPI:应该启动程序,以编译代码的并行执行。它的名称依赖于实现,可以使用这几个命令启动:mpirunmpiexecorterun

本示例,将展示如何在系统上找到合适的MPI实现,从而编译一个简单的“Hello, World”MPI例程。

准备工作

示例代码(hello-mpi.cpp,可从http://www.mpitutorial.com 下载)将在本示例中进行编译,它将初始化MPI库,让每个进程打印其名称:

  1. #include <iostream>
  2. #include <mpi.h>
  3. int main(int argc, char **argv)
  4. {
  5. // Initialize the MPI environment. The two arguments to MPI Init are not
  6. // currently used by MPI implementations, but are there in case future
  7. // implementations might need the arguments.
  8. MPI_Init(NULL, NULL);
  9. // Get the number of processes
  10. int world_size;
  11. MPI_Comm_size(MPI_COMM_WORLD, &world_size);
  12. // Get the rank of the process
  13. int world_rank;
  14. MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);
  15. // Get the name of the processor
  16. char processor_name[MPI_MAX_PROCESSOR_NAME];
  17. int name_len;
  18. MPI_Get_processor_name(processor_name, &name_len);
  19. // Print off a hello world message
  20. std::cout << "Hello world from processor " << processor_name << ", rank "
  21. << world_rank << " out of " << world_size << " processors" << std::endl;
  22. // Finalize the MPI environment. No more MPI calls can be made after this
  23. MPI_Finalize();
  24. }

具体实施

这个示例中,我们先查找MPI实现:库、头文件、编译器包装器和启动器。为此,我们将用到FindMPI.cmake标准CMake模块:

  1. 首先,定义了CMake最低版本、项目名称、支持的语言和语言标准:

    1. cmake_minimum_required(VERSION 3.9 FATAL_ERROR)
    2. project(recipe-06 LANGUAGES CXX)
    3. set(CMAKE_CXX_STANDARD 11)
    4. set(CMAKE_CXX_EXTENSIONS OFF)
    5. set(CMAKE_CXX_STANDARD_REQUIRED ON)
  2. 然后,调用find_package来定位MPI:

    1. find_package(MPI REQUIRED)
  3. 与前面的配置类似,定义了可执行文件的的名称和相关源码,并链接到目标:

    1. add_executable(hello-mpi hello-mpi.cpp)
    2. target_link_libraries(hello-mpi
    3. PUBLIC
    4. MPI::MPI_CXX
    5. )
  4. 配置和构建可执行文件:

    1. $ mkdir -p build
    2. $ cd build
    3. $ cmake .. # -D CMAKE_CXX_COMPILER=mpicxx C++例子中可加,加与不加对于构建结果没有影响╭(╯^╰)╮
    4. -- ...
    5. -- Found MPI_CXX: /usr/lib/openmpi/libmpi_cxx.so (found version "3.1")
    6. -- Found MPI: TRUE (found version "3.1")
    7. -- ...
    8. $ cmake --build .
  5. 为了并行执行这个程序,我们使用mpirun启动器(本例中,启动了两个任务):

    1. $ mpirun -np 2 ./hello-mpi
    2. Hello world from processor larry, rank 1 out of 2 processors
    3. Hello world from processor larry, rank 0 out of 2 processors

工作原理

请记住,编译包装器是对MPI库编译器的封装。底层实现中,将会调用相同的编译器,并使用额外的参数(如成功构建并行程序所需的头文件包含路径和库)来扩充它。

编译和链接源文件时,包装器用了哪些标志?我们可以使用--showme选项来查看。要找出编译器的标志,我们可以这样使用:

  1. $ mpicxx --showme:compile
  2. -pthread

为了找出链接器标志,我们可以这样:

  1. $ mpicxx --showme:link
  2. -pthread -Wl,-rpath -Wl,/usr/lib/openmpi -Wl,--enable-new-dtags -L/usr/lib/openmpi -lmpi_cxx -lmpi

与之前的OpenMP配置类似,我们发现到MPI的链接非常简单,这要归功于FindMPI模块提供的目标:

正如在前面的配方中所讨论的,对于CMake版本低于3.9,需要更多的工作量:

  1. add_executable(hello-mpi hello-mpi.c)
  2. target_compile_options(hello-mpi
  3. PUBLIC
  4. ${MPI_CXX_COMPILE_FLAGS}
  5. )
  6. target_include_directories(hello-mpi
  7. PUBLIC
  8. ${MPI_CXX_INCLUDE_PATH}
  9. )
  10. target_link_libraries(hello-mpi
  11. PUBLIC
  12. ${MPI_CXX_LIBRARIES}
  13. )

本示例中,我们讨论了C++项目。其中的参数和方法对于C或Fortran项目同样有效。