4.3 GCC 编译参数解析

GCC

  1. $ wget -c http://www.mirrorservice.org/sites/sourceware.org/pub/gcc/releases/gcc-4.4.0/gcc-4.4.0.tar.bz2
  2. $ tar -xjvf gcc-4.4.0.tar.bz2
  3. $ ./configure
  4. $ make && sudo make install

常用选项

使用 gcc -v 可以查看默认开启的选项:

  1. $ gcc -v
  2. Using built-in specs.
  3. COLLECT_GCC=gcc
  4. COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/5/lto-wrapper
  5. Target: x86_64-linux-gnu
  6. Configured with: ../src/configure -v --with-pkgversion='Ubuntu 5.4.0-6ubuntu1~16.04.9' --with-bugurl=file:///usr/share/doc/gcc-5/README.Bugs --enable-languages=c,ada,c++,java,go,d,fortran,objc,obj-c++ --prefix=/usr --program-suffix=-5 --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --enable-plugin --with-system-zlib --disable-browser-plugin --enable-java-awt=gtk --enable-gtk-cairo --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-5-amd64/jre --enable-java-home --with-jvm-root-dir=/usr/lib/jvm/java-1.5.0-gcj-5-amd64 --with-jvm-jar-dir=/usr/lib/jvm-exports/java-1.5.0-gcj-5-amd64 --with-arch-directory=amd64 --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --enable-objc-gc --enable-multiarch --disable-werror --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
  7. Thread model: posix
  8. gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.9)

控制标准版本的编译选项

  • -ansi:告诉编译器遵守 C 语言的 ISO C90 标准。
  • -std=:通过使用一个参数来设置需要的标准。
    • c89:支持 C89 标准。
    • iso9899:1999:支持 ISO C90 标准。
    • gnu89:支持 C89 标准。

控制标准版本的常量

这些常量(#define)可以通过编译器的命令行选项来设置,或者通过源代码总的 #define 语句来定义。

  • __STRICT_ANSI__:强制使用 C 语言的 ISO 标准。这个常量通过命令行选项 -ansi 来定义。
  • _POSIX_C_SOURCE=2:启用由 IEEE Std1003.1 和 1003.2 标准定义的特性。
  • _BSD_SOURCE:启用 BSD 类型的特性。
  • _GNU_SOURCE:启用大量特性,其中包括 GNU 扩展。

编译器的警告选项

  • -pedantic:除了启用用于检查代码是否遵守 C 语言标准的选项外,还关闭了一些不被标准允许的传统 C 语言结构,并且禁用所有的 GNU 扩展。
  • -Wformat:检查 printf 系列函数所使用的参数类型是否正确。
  • Wparentheses:检查是否总是提供了需要的圆括号。当想要检查一个复杂结构的初始化是否按照预期进行时,这个选项就很有用。
  • Wswitch-default:检查是否所有的 switch 语句都包含一个 default case。
  • Wunused:检查诸如声明静态函数但没有定义、未使用的参数和丢弃返回结果等情况。
  • Wall:启用绝大多数 gcc 的警告选项,包括所有以 -W 为前缀的选项。

Address sanitizer

Address sanitizer 是一种用于检测内存错误的技术,GCC 从 4.8 版本开始支持了这一技术。ASan 在编译时插入额外指令到内存访问操作中,同时通过 Shadow memory 来记录和检测内存的有效性。ASan 其实只是 Sanitizer 一系列工具中的一员,其他工具比如 memory leak 检测在 LeakSanitizer 中,uninitialized memory read 检测在 MemorySanitizer 中等等。

举个例子,很明显下面这个程序存在栈溢出:

  1. #include<stdio.h>
  2. void main() {
  3. int a[10] = {0};
  4. int b = a[11];
  5. }

编译时加上参数 -fsanitize=address,如果使用 Makefile,则将参数加入到 CFLAGS 中:

  1. $ gcc -fsanitize=address santest.c

然后运行:

  1. $ ./a.out
  2. =================================================================
  3. ==9399==ERROR: AddressSanitizer: stack-buffer-overflow on address 0x7ffc03f4d64c at pc 0x565515082ad6 bp 0x7ffc03f4d5e0 sp 0x7ffc03f4d5d0
  4. READ of size 4 at 0x7ffc03f4d64c thread T0
  5. #0 0x565515082ad5 in main (/home/firmy/a.out+0xad5)
  6. #1 0x7fb4c04c0f69 in __libc_start_main (/usr/lib/libc.so.6+0x20f69)
  7. #2 0x565515082899 in _start (/home/firmy/a.out+0x899)
  8. Address 0x7ffc03f4d64c is located in stack of thread T0 at offset 76 in frame
  9. #0 0x565515082989 in main (/home/firmy/a.out+0x989)
  10. This frame has 1 object(s):
  11. [32, 72) 'a' <== Memory access at offset 76 overflows this variable
  12. HINT: this may be a false positive if your program uses some custom stack unwind mechanism or swapcontext
  13. (longjmp and C++ exceptions *are* supported)
  14. SUMMARY: AddressSanitizer: stack-buffer-overflow (/home/firmy/a.out+0xad5) in main
  15. Shadow bytes around the buggy address:
  16. 0x1000007e1a70: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  17. 0x1000007e1a80: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  18. 0x1000007e1a90: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  19. 0x1000007e1aa0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  20. 0x1000007e1ab0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  21. =>0x1000007e1ac0: f1 f1 f1 f1 00 00 00 00 00[f2]f2 f2 00 00 00 00
  22. 0x1000007e1ad0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  23. 0x1000007e1ae0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  24. 0x1000007e1af0: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  25. 0x1000007e1b00: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  26. 0x1000007e1b10: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
  27. Shadow byte legend (one shadow byte represents 8 application bytes):
  28. Addressable: 00
  29. Partially addressable: 01 02 03 04 05 06 07
  30. Heap left redzone: fa
  31. Freed heap region: fd
  32. Stack left redzone: f1
  33. Stack mid redzone: f2
  34. Stack right redzone: f3
  35. Stack after return: f5
  36. Stack use after scope: f8
  37. Global redzone: f9
  38. Global init order: f6
  39. Poisoned by user: f7
  40. Container overflow: fc
  41. Array cookie: ac
  42. Intra object redzone: bb
  43. ASan internal: fe
  44. Left alloca redzone: ca
  45. Right alloca redzone: cb
  46. ==9399==ABORTING

确实检测出了问题。在实战篇中,为了更好地分析软件漏洞,我们可能会经常用到这个选项。

参考:https://en.wikipedia.org/wiki/AddressSanitizer

mcheck

利用 mcheck 可以实现堆内存的一致性状态检查。其定义在 /usr/include/mcheck.h,是一个 GNU 扩展函数,原型如下:

  1. #include <mcheck.h>
  2. int mcheck(void (*abortfunc)(enum mcheck_status mstatus));

可以看到参数是一个函数指针,但检查到堆内存异常时,通过该指针调用 abortfunc 函数,同时传入一个 mcheck_status 类型的参数。

举个例子,下面的程序存在 double-free 的问题:

  1. #include <stdlib.h>
  2. #include <stdio.h>
  3. void main() {
  4. char *p;
  5. p = malloc(1000);
  6. fprintf(stderr, "About to free\n");
  7. free(p);
  8. fprintf(stderr, "About to free a second time\n");
  9. free(p);
  10. fprintf(stderr, "Finish\n");
  11. }

通过设置参数 -lmcheck 来链接 mcheck 函数:

  1. $ gcc -lmcheck t_mcheck.c
  2. $ ./a.out
  3. About to free
  4. About to free a second time
  5. block freed twice
  6. Aborted (core dumped)

还可以通过设置环境变量 MALLOC_CHECK_ 来实现,这样就不需要重新编译程序。

  1. $ gcc mcheck.c
  2. $ #检查到错误时不作任何提示
  3. $ MALLOC_CHECK_=0 ./a.out
  4. About to free
  5. About to free a second time
  6. Finish
  7. $ #检查到错误时打印一条信息到标准输出
  8. $ MALLOC_CHECK_=1 ./a.out
  9. About to free
  10. About to free a second time
  11. *** Error in `./a.out': free(): invalid pointer: 0x0000000001fb9010 ***
  12. Finish
  13. $ #检查到错误时直接中止程序
  14. $ MALLOC_CHECK_=2 ./a.out
  15. About to free
  16. About to free a second time
  17. Aborted (core dumped)

具体参考 man 3 mcheckman 3 mallopt

glibc 还提供了 mtrace()muntrace() 函数分别在程序中打开和关闭对内存分配调用进行跟踪的功能。这些函数需要与环境变量 MALLOC_TRACE 配合使用,该变量定义了写入跟踪信息的文件名。在被调用时,mtrace() 会检查是否定义了该文件,又是否可以读写该文件。如果一切正常,那么会在文件里跟踪和记录所有对 malloc 系列函数的调用。由于生成的文件不易于理解,还提供了脚本(mtrace)用于分析文件,并生成易于理解的汇总报告。

将上面的例子修改一下:

  1. #include <stdlib.h>
  2. #include <stdio.h>
  3. #include <mcheck.h>
  4. void main() {
  5. char *p;
  6. mtrace();
  7. calloc(16, 16);
  8. fprintf(stderr, "calloc some chunks that will not be freed\n");
  9. p = malloc(1000);
  10. fprintf(stderr, "About to free\n");
  11. free(p);
  12. fprintf(stderr, "About to free a second time\n");
  13. free(p);
  14. fprintf(stderr, "Finish\n");
  15. muntrace();
  16. }
  1. $ gcc t_mtrace.c
  2. $ export MALLOC_TRACE=/tmp/t
  3. $ ./a.out
  4. calloc some chunks that will not be freed
  5. About to free
  6. About to free a second time
  7. Finish
  8. $ mtrace /tmp/t
  9. - 0x000055e427cde7b0 Free 5 was never alloc'd 0x55e425da287c
  10. Memory not freed:
  11. -----------------
  12. Address Size Caller
  13. 0x000055e427cde6a0 0x100 at 0x55e425da27f6

于是 double-free 和内存泄漏被检测出来了。

参考资料