Punycode是根据RFC 3492标准定义的字符编码方案,主要用于把域名从地方语言所采用的Unicode编码转换成为可用于DNS系统的编码。
Punycode.js从Node.js v0.6.2+开始内置. 使用require('punycode')来访问。 (要在其他Node.js版本中访问,先用npm来punycode安装)。
将一个纯ASCII的Punycode字符串转换为Unicode字符串。
// decode domain name parts
punycode.decode('maana-pta'); // 'mañana'
punycode.decode('--dqo34k'); // '☃-⌘'
将一个纯Unicode Punycode字符串转换为纯ASCII字符串。
// encode domain name parts
punycode.encode('mañana'); // 'maana-pta'
punycode.encode('☃-⌘'); // '--dqo34k'
将一个表示域名的Punycode字符串转换为Unicode。只有域名中的Punycode部分会被转换,也就是说你也可以在一个已经转换为Unicode的字符串上调用它。
// decode domain names
punycode.toUnicode('xn--maana-pta.com'); // 'mañana.com'
punycode.toUnicode('xn----dqo34k.com'); // '☃-⌘.com'
将一个表示域名的Unicode字符串转换为Punycode。只有域名中的非ASCII部分会被转换,也就是说你也可以在一个已经转换为ASCII的字符串上调用它。
// encode domain names
punycode.toASCII('mañana.com'); // 'xn--maana-pta.com'
punycode.toASCII('☃-⌘.com'); // 'xn----dqo34k.com'
创建一个包含字符串中每个Unicode符号的数字编码点的数组。由于JavaScript在内部使用UCS-2, 该函数会按照UTF-16将一对代半数(UCS-2暴露的单独的字符)转换为单独一个编码点。
punycode.ucs2.decode('abc'); // [0x61, 0x62, 0x63]
// surrogate pair for U+1D306 tetragram for centre:
punycode.ucs2.decode('\uD834\uDF06'); // [0x1D306]
创建以一组数字编码点为基础一个字符串。
punycode.ucs2.encode([0x61, 0x62, 0x63]); // 'abc'
punycode.ucs2.encode([0x1D306]); // '\uD834\uDF06'
表示当前Punycode.js版本数字的字符串。