iconv

转换文件的编码方式

补充说明

iconv命令 是用来转换文件的编码方式的,比如它可以将UTF8编码的转换成GB18030的编码,反过来也行。JDK中也提供了类似的工具native2ascii。Linux下的iconv开发库包括iconv_open,iconv_close,iconv等C函数,可以用来在C/C++程序中很方便的转换字符编码,这在抓取网页的程序中很有用处,而iconv命令在调试此类程序时用得着。

语法

  1. iconv -f encoding [-t encoding] [inputfile]...

选项

  1. -f encoding :把字符从encoding编码开始转换。
  2. -t encoding :把字符转换到encoding编码。
  3. -l :列出已知的编码字符集合
  4. -o file :指定输出文件
  5. -c :忽略输出的非法字符
  6. -s :禁止警告信息,但不是错误信息
  7. --verbose :显示进度信息
  8. -f和-t所能指定的合法字符在-l选项的命令里面都列出来了。

实例

列出当前支持的字符编码:

  1. iconv -l

将文件file1转码,转后文件输出到fil2中:

  1. iconv file1 -f EUC-JP-MS -t UTF-8 -o file2

这里,没-o那么会输出到标准输出。