ISO-10646-UCS-4 |
ISO 10646 |
El juego de caracteres universal (Universal Character Set ),
con 31 bits por caracter, al estándar UCS-4
por ISO/IEC 10646 . Está sincronizado con
la última versión de Unicode.
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
intenta reconocer el texto a partir del último BOM
(byte order mark ), para conocer el orden
de los bits.
|
ISO-10646-UCS-4 |
UCS-4 |
Ver arriba.
|
A diferencia de UCS-4 , las cadenas se suponen
estar en formato big endian.
|
ISO-10646-UCS-4 |
UCS-4 |
Ver arriba.
|
A diferencia de UCS-2 , las cadenas se suponen
estar en formato little endian.
|
ISO-10646-UCS-2 |
UCS-2 |
El juego de caracteres universal (Universal Character Set ),
con 16 bits por caracter, al estándar UCS-2
por ISO/IEC 10646 . Está sincronizado con
la última versión de Unicode.
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
intenta reconocer el texto a partir del último BOM
(byte order mark ), para conocer el orden
de los bits.
|
ISO-10646-UCS-2 |
UCS-2 |
Ver arriba.
|
A diferencia de UCS-4 , las cadenas se suponen
estar en formato big endian.
|
UTF-32 |
Unicode |
Formato de transformación de Unicode, de 32 bits, cuyas cartas
corresponden al juego estándar Unicode. Este juego no es idéntico
a UCS-4 porque los caracteres Unicode estaban limitados
a valores de 21 bits.
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
intenta reconocer el texto a partir del último BOM
(byte order mark ), para conocer el orden
de los bits.
|
UTF-32BE |
Unicode |
Ver arriba.
|
A diferencia de UTF-32 , las cadenas se suponen
estar en formato big endian.
|
UTF-32LE |
Unicode |
Ver arriba.
|
A diferencia de UTF-32 , las cadenas se suponen
estar en formato little endian.
|
UTF-16 |
Unicode |
Formato de transformación de Unicode sobre 16 bits. Se debe notar
que UTF-16 ya no es idéntico a UCS-2
porque un mecanismo fue introducido en Unicode 2.0 y
UTF-16 ahora hace referencia a un
codificación de 21 bits.
|
Si este nombre es utilizado en la herramienta de conversión, el convertidor
intenta reconocer el texto a partir del último BOM
(byte order mark ), para conocer el orden
de los bits.
|
UTF-16BE |
Unicode |
Ver arriba.
|
A diferencia de UTF-16 , las cadenas se suponen
estar en formato big endian.
|
UTF-16LE |
Unicode |
Ver arriba.
|
A diferencia de UTF-16 , las cadenas se suponen
estar en formato little endian.
|
UTF-8 |
Unicode / UCS |
Formato de transformación Unicode de 8 bits.
|
ninguno |
UTF-7 |
Unicode |
Un formato compatible con el correo electrónico de Unicode,
especificado en » RFC2152.
|
ninguno |
ninguno |
Unicode |
Una variante de UTF-7 que es especialmente utilizada en el
» protocolo IMAP.
|
ninguno |
US-ASCII (recomendado) / iso-ir-6 / ANSI_X3.4-1986 /
ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII
|
ASCII / ISO 646 |
ASCII, American Standard Code for Information Interchange
es un formato clásico de 7 bits. También está normalizado internacionalmente,
bajo el nombre ISO 646 .
|
(ninguno) |
EUC-JP (recomendado) /
Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese
|
Compuesto de US-ASCII / JIS X0201:1997 (hankaku kana) /
JIS X0208:1990 / JIS X0212:1990
|
Como se puede ver, el nombre deriva de la abreviatura de
Extended UNIX Code Packed Format for Japanese ,
este juego es esencialmente utilizado en plataformas Unix.
El juego original, Extended UNIX Code ,
está diseñado sobre la base de ISO 2022 .
|
El juego identificado por EUC-JP es diferente
de IBM932 / CP932 , que es utilizado por
OS/2® y Microsoft® Windows®.
Para intercambiar información con estas plataformas,
utilice EUCJP-WIN .
|
Shift_JIS (recomendado) / MS_Kanji / csShift_JIS |
Compuesto de JIS X0201:1997 / JIS X0208:1997 |
Shift_JIS fue desarrollado a principios de los años 80,
y, al mismo tiempo, los primeros procesadores de texto estaban
en el mercado. Fue hecho para conservar la compatibilidad con
el juego JIS X 0201:1976 . Según la definición de
IANA, el juego de caracteres Shift_JIS es ligeramente
diferente de IBM932 / CP932 . Sin embargo, los nombres
"SJIS" y "Shift_JIS" son
a menudo utilizados erróneamente, para estos juegos.
|
Para CP932 , utilice SJIS-WIN . |
(ninguno) |
Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
|
Aunque este "juego de caracteres" utiliza el mismo juego que
EUC-JP , en realidad es diferente. Solo tiene
algunos caracteres de diferencia.
|
ninguno |
Windows-31J / csWindows31J |
Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions
|
Aunque este "juego de caracteres" utiliza el mismo juego que
Shift_JIS , en realidad es diferente. Solo tiene
algunos caracteres de diferencia.
|
(ninguno) |
ISO-2022-JP (recomendado) / csISO2022JP |
US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983
|
» RFC1468 |
ninguno |
JIS |
|
|
|
ISO-8859-1 |
|
|
|
ISO-8859-2 |
|
|
|
ISO-8859-3 |
|
|
|
ISO-8859-4 |
|
|
|
ISO-8859-5 |
|
|
|
ISO-8859-6 |
|
|
|
ISO-8859-7 |
|
|
|
ISO-8859-8 |
|
|
|
ISO-8859-9 |
|
|
|
ISO-8859-10 |
|
|
|
ISO-8859-13 |
|
|
|
ISO-8859-14 |
|
|
|
ISO-8859-15 |
|
|
|
ISO-8859-16 |
|
|
|
byte2be |
|
|
|
byte2le |
|
|
|
byte4be |
|
|
|
byte4le |
|
|
|
BASE64 |
|
|
|
HTML-ENTITIES |
|
|
|
7bit |
|
|
|
8bit |
|
|
|
EUC-CN |
|
|
|
CP936 |
|
|
|
HZ |
|
|
|
EUC-TW |
|
|
|
CP950 |
|
|
|
BIG-5 |
|
|
|
EUC-KR |
|
|
|
UHC (CP949) |
|
|
|
ISO-2022-KR |
|
|
|
Windows-1251 (CP1251) |
|
|
|
Windows-1252 (CP1252) |
|
|
|
CP866 (IBM866) |
|
|
|
KOI8-R |
|
|
|
KOI8-U |
|
|
|