Punycode

Node.js 自 v0.6.2 版本加入了 Punycode.js,通过 require('punycode') 的方式访问。

punycode.decode(string)

将一个纯 ASCII 的 Punycode 字符串转换为 Unicode 字符串:

  1. // decode domain name parts
  2. punycode.decode('maana-pta'); // 'mañana'
  3. punycode.decode('--dqo34k'); // '☃-⌘'

punycode.encode(string)

将一个 Unicode 字符串转换为纯 ASCII 的 Punycode 字符串:

  1. // encode domain name parts
  2. punycode.encode('mañana'); // 'maana-pta'
  3. punycode.encode('☃-⌘'); // '--dqo34k'

punycode.toASCII(domain)

将一个 Unicode 域名字符串转换为 Punycode 字符串,域名中只有非 ASCII 的部分会被转换:

  1. // encode domain names
  2. punycode.toASCII('mañana.com'); // 'xn--maana-pta.com'
  3. punycode.toASCII('☃-⌘.com'); // 'xn----dqo34k.com'

punycode.toUnicode(domain)

将一个 Punycode 的域名字符串转换为 Unicode 字符串,域名中只有 Punycode 的部分会被转换:

  1. // decode domain names
  2. punycode.toUnicode('xn--maana-pta.com'); // 'mañana.com'
  3. punycode.toUnicode('xn----dqo34k.com'); // '☃-⌘.com'

punycode.ucs2

punycode.ucs2.decode(string)

根据传入的 string 参数创建一个数值形式的编码数组。由于 JavaScript 内部使用 UCS-2,所以该函数会根据 UTF-16 将一对 surrogate halves 转换为一个编码:

  1. punycode.ucs2.decode('abc'); // [0x61, 0x62, 0x63]
  2. // surrogate pair for U+1D306 tetragram for centre:
  3. punycode.ucs2.decode('\uD834\uDF06'); // [0x1D306]

punycode.ucs2.encode(codePoints)

将编码数组转换为字符串:

  1. punycode.ucs2.encode([0x61, 0x62, 0x63]); // 'abc'
  2. punycode.ucs2.encode([0x1D306]); // '\uD834\uDF06'

punycode.version

返回字符串形式的 Punycode 版本号。