练习29:库和链接

原文:Exercise 29: Libraries And Linking

译者:飞龙

C语言编程的核心能力之一就是链接OS所提供的库。链接是一种为你的程序添加额外特性的方法,这些特性由其它人在系统中创建并打包。你已经使用了一些自动包含的标准库,但是我打算对库的不同类型和它们的作用做个解释。

首先,库在每个语言中都没有良好的设计。我不知道为什么,但是似乎语言的设计者都将链接视为不是特别重要的东西。它们通常令人混乱,难以使用,不能正确进行版本控制,并以不同的方式链接到各种地方。

C没有什么不同,但是C中的库和链接是Unix操作系统的组件,并且可执行的格式在很多年前就设计好了。学习C如何链接库有助于理解OS如何工作,以及它如何运行你的程序。

C中的库有两种基本类型:

静态

你可以使用arranlib来构建它,就像上个练习中的libYOUR_LIBRARY.a那样(Windows下后缀为.lib)。这种库可以当做一系列.o对象文件和函数的容器,以及当你构建程序时,可以当做是一个大型的.o文件。

动态

它们通常以.so(Linux)或.dll(Windows)结尾。在OSX中,差不多有一百万种后缀,取决于版本和编写它的人。严格来讲,OSX中的.dylib.bundleframework这三个之间没什么不同。这些文件都被构建好并且放置到指定的地方。当你运行程序时,OS会动态加载这些文件并且“凭空”链接到你的程序中。

我倾向于对小型或中型项目使用静态的库,因为它们易于使用,并且工作在在更多操作系统上。我也喜欢将所有代码放入静态库中,之后链接它来执行单元测试,或者链接到所需的程序中。

动态库适用于大型系统,它的空间十分有限,或者其中大量程序都使用相同的功能。这种情况下不应该为每个程序的共同特性静态链接所有代码,而是应该将它放到动态库中,这样它仅仅会为所有程序加载一份。

在上一个练习中,我讲解了如何构建静态库(.a),我会在本书的剩余部分用到它。这个练习中我打算向你展示如何构建一个简单的.so库,并且如何使用Unix系统的dlopen动态加载它。我会手动执行它,以便你可以理解每件实际发生的事情。之后,附加题这部分会使用c项目框架来创建它。

动态加载动态库

我创建了两个源文件来完成它。一个用于构建libex29.so库,另一个是个叫做ex29的程序,它可以加载这个库并运行其中的程序:

  1. #include <stdio.h>
  2. #include <ctype.h>
  3. #include "dbg.h"
  4. int print_a_message(const char *msg)
  5. {
  6. printf("A STRING: %s\n", msg);
  7. return 0;
  8. }
  9. int uppercase(const char *msg)
  10. {
  11. int i = 0;
  12. // BUG: \0 termination problems
  13. for(i = 0; msg[i] != '\0'; i++) {
  14. printf("%c", toupper(msg[i]));
  15. }
  16. printf("\n");
  17. return 0;
  18. }
  19. int lowercase(const char *msg)
  20. {
  21. int i = 0;
  22. // BUG: \0 termination problems
  23. for(i = 0; msg[i] != '\0'; i++) {
  24. printf("%c", tolower(msg[i]));
  25. }
  26. printf("\n");
  27. return 0;
  28. }
  29. int fail_on_purpose(const char *msg)
  30. {
  31. return 1;
  32. }

这里面没什么神奇之处。其中故意留了一些bug,看你是否注意到了。你需要在随后修复它们。

我们将要使用dlopendlsym,和dlclose函数来处理上面的函数。

  1. #include <stdio.h>
  2. #include "dbg.h"
  3. #include <dlfcn.h>
  4. typedef int (*lib_function)(const char *data);
  5. int main(int argc, char *argv[])
  6. {
  7. int rc = 0;
  8. check(argc == 4, "USAGE: ex29 libex29.so function data");
  9. char *lib_file = argv[1];
  10. char *func_to_run = argv[2];
  11. char *data = argv[3];
  12. void *lib = dlopen(lib_file, RTLD_NOW);
  13. check(lib != NULL, "Failed to open the library %s: %s", lib_file, dlerror());
  14. lib_function func = dlsym(lib, func_to_run);
  15. check(func != NULL, "Did not find %s function in the library %s: %s", func_to_run, lib_file, dlerror());
  16. rc = func(data);
  17. check(rc == 0, "Function %s return %d for data: %s", func_to_run, rc, data);
  18. rc = dlclose(lib);
  19. check(rc == 0, "Failed to close %s", lib_file);
  20. return 0;
  21. error:
  22. return 1;
  23. }

我现在会拆分这个程序,便于你理解这一小段代码其中的原理。

ex29.c:5

我随后会使用这个函数指针定义,来调用库中的函数。这没什么新东西,确保你理解了它的作用。

ex29.c:17

在为一个小型程序做必要的初始化后,我使用了dlopen函数来加载由lib_file表示的库。这个函数返回一个句柄,我们随后会用到它,就像来打开文件那样。

ex29.c:18

如果出现错误,我执行了通常的检查并退出,但是要注意最后我使用了dlerror来查明发生了什么错误。

ex29.c:20

我使用了dlsym来获取lib中的函数,通过它的字面名称func_to_run。这是最强大的部分,因为我动态获取了一个函数指针,基于我从命令行argv获得的字符串。

ex29.c:23

接着我调用func函数,获得返回值并进行检查。

ex29.c:26

最后,我像关闭文件那样关闭了库。通常你需要在程序的整个运行期间保证它们打开,所以关闭操作并不非常实用,我只是在这里演示它。

译者注:由于能够使用系统调用加载,动态库可以被多种语言的程序调用,而静态库只能被C及兼容C的程序调用。

你会看到什么

既然你已经知道这些文件做什么了,下面是我的shell会话,用于构建libex29.soex29并随后运行它。下面的代码中你可以学到如何手动构建:

  1. # compile the lib file and make the .so
  2. # you may need -fPIC here on some platforms. add that if you get an error
  3. $ cc -c libex29.c -o libex29.o
  4. $ cc -shared -o libex29.so libex29.o
  5. # make the loader program
  6. $ cc -Wall -g -DNDEBUG ex29.c -ldl -o ex29
  7. # try it out with some things that work
  8. $ ex29 ./libex29.so print_a_message "hello there"
  9. -bash: ex29: command not found
  10. $ ./ex29 ./libex29.so print_a_message "hello there"
  11. A STRING: hello there
  12. $ ./ex29 ./libex29.so uppercase "hello there"
  13. HELLO THERE
  14. $ ./ex29 ./libex29.so lowercase "HELLO tHeRe"
  15. hello there
  16. $ ./ex29 ./libex29.so fail_on_purpose "i fail"
  17. [ERROR] (ex29.c:23: errno: None) Function fail_on_purpose return 1 for data: i fail
  18. # try to give it bad args
  19. $ ./ex29 ./libex29.so fail_on_purpose
  20. [ERROR] (ex29.c:11: errno: None) USAGE: ex29 libex29.so function data
  21. # try calling a function that is not there
  22. $ ./ex29 ./libex29.so adfasfasdf asdfadff
  23. [ERROR] (ex29.c:20: errno: None) Did not find adfasfasdf
  24. function in the library libex29.so: dlsym(0x1076009b0, adfasfasdf): symbol not found
  25. # try loading a .so that is not there
  26. $ ./ex29 ./libex.so adfasfasdf asdfadfas
  27. [ERROR] (ex29.c:17: errno: No such file or directory) Failed to open
  28. the library libex.so: dlopen(libex.so, 2): image not found
  29. $

需要注意,你可能需要在不同OS、不同OS的不同版本,以及不同OS的不同版本的不同编译器上执行构建,则需要修改构建共享库的方式。如果我构建libex29.so的方式在你的平台上不起作用,请告诉我,我会为其它平台添加一些注解。

译者注:到处编写、到处调试、到处编译、到处发布。—vczh

有时候你像往常一样运行cc -Wall -g -DNDEBUG -ldl ex29.c -o ex29,并且认为它能够正常工作,但是没有。在一些平台上,参数的顺序会影响到它是否生效,这也没什么理由。在Debian或者Ubuntu中你需要执行cc -Wall -g -DNDEBUG ex29.c -ldl -o ex29,这是唯一的方式。所以虽然我在这里使用了OSX,但是以后如果你链接动态库的时候它找不到某个函数,要试着自己解决问题。

这里面比较麻烦的事情是,实际平台的不同会影响到命令参数的顺序。将-ldl放到某个位置没有理由与其它位置不同。它只是一个选项,还需要了解这些简直是太气人了。

如何使它崩溃

打开lbex29.so,并且使用能够处理二进制的编辑器编辑它。修改一些字节,然后关闭。看看你是否能使用dlopen函数来打开它,即使你修改了它。

附加题

  • 你注意到我在libex29.c中写的不良代码了吗?我使用了一个for循环来检查'\0'的结尾,修改它们使这些函数总是接收字符串长度,并在函数内部使用。
  • 使用项目框架目录,来为这个练习创建新的项目。将libex29.c放入src/目录,修改Makefile使它能够构建build/libex29.so
  • ex29.c改为tests/ex29_tests.c,使它做为单元测试执行。使它能够正常工作,意思是你需要修改它让它加载build/libex29.so文件,并且运行上面我手写的测试。
  • 阅读man dlopen文档,并且查询所有有关函数。尝试dlopen的其它选项,比如RTLD_NOW