PHP 8.4.6 Released!

Juegos de caracteres soportados

Juegos de caracteres soportados
Nombre en el registro IANA Juegos de caracteres Descripción Notas
ISO-10646-UCS-4 ISO 10646 El juego de caracteres universal (Universal Character Set), con 31 bits por caracter, al estándar UCS-4 por ISO/IEC 10646. Está sincronizado con la última versión de Unicode. Si este nombre es utilizado en la herramienta de conversión, el convertidor intenta reconocer el texto a partir del último BOM (byte order mark), para conocer el orden de los bits.
ISO-10646-UCS-4 UCS-4 Ver arriba. A diferencia de UCS-4, las cadenas se suponen estar en formato big endian.
ISO-10646-UCS-4 UCS-4 Ver arriba. A diferencia de UCS-2, las cadenas se suponen estar en formato little endian.
ISO-10646-UCS-2 UCS-2 El juego de caracteres universal (Universal Character Set), con 16 bits por caracter, al estándar UCS-2 por ISO/IEC 10646. Está sincronizado con la última versión de Unicode. Si este nombre es utilizado en la herramienta de conversión, el convertidor intenta reconocer el texto a partir del último BOM (byte order mark), para conocer el orden de los bits.
ISO-10646-UCS-2 UCS-2 Ver arriba. A diferencia de UCS-4, las cadenas se suponen estar en formato big endian.
UTF-32 Unicode Formato de transformación de Unicode, de 32 bits, cuyas cartas corresponden al juego estándar Unicode. Este juego no es idéntico a UCS-4 porque los caracteres Unicode estaban limitados a valores de 21 bits. Si este nombre es utilizado en la herramienta de conversión, el convertidor intenta reconocer el texto a partir del último BOM (byte order mark), para conocer el orden de los bits.
UTF-32BE Unicode Ver arriba. A diferencia de UTF-32, las cadenas se suponen estar en formato big endian.
UTF-32LE Unicode Ver arriba. A diferencia de UTF-32, las cadenas se suponen estar en formato little endian.
UTF-16 Unicode Formato de transformación de Unicode sobre 16 bits. Se debe notar que UTF-16 ya no es idéntico a UCS-2 porque un mecanismo fue introducido en Unicode 2.0 y UTF-16 ahora hace referencia a un codificación de 21 bits. Si este nombre es utilizado en la herramienta de conversión, el convertidor intenta reconocer el texto a partir del último BOM (byte order mark), para conocer el orden de los bits.
UTF-16BE Unicode Ver arriba. A diferencia de UTF-16, las cadenas se suponen estar en formato big endian.
UTF-16LE Unicode Ver arriba. A diferencia de UTF-16, las cadenas se suponen estar en formato little endian.
UTF-8 Unicode / UCS Formato de transformación Unicode de 8 bits. ninguno
UTF-7 Unicode Un formato compatible con el correo electrónico de Unicode, especificado en » RFC2152. ninguno
ninguno Unicode Una variante de UTF-7 que es especialmente utilizada en el » protocolo IMAP. ninguno
US-ASCII (recomendado) / iso-ir-6 / ANSI_X3.4-1986 / ISO_646.irv:1991 / ASCII / ISO646-US / us / IBM367 / CP367 / csASCII ASCII / ISO 646 ASCII, American Standard Code for Information Interchange es un formato clásico de 7 bits. También está normalizado internacionalmente, bajo el nombre ISO 646. (ninguno)
EUC-JP (recomendado) / Extended_UNIX_Code_Packed_Format_for_Japanese / csEUCPkdFmtJapanese Compuesto de US-ASCII / JIS X0201:1997 (hankaku kana) / JIS X0208:1990 / JIS X0212:1990 Como se puede ver, el nombre deriva de la abreviatura de Extended UNIX Code Packed Format for Japanese, este juego es esencialmente utilizado en plataformas Unix. El juego original, Extended UNIX Code, está diseñado sobre la base de ISO 2022. El juego identificado por EUC-JP es diferente de IBM932 / CP932, que es utilizado por OS/2® y Microsoft® Windows®. Para intercambiar información con estas plataformas, utilice EUCJP-WIN.
Shift_JIS (recomendado) / MS_Kanji / csShift_JIS Compuesto de JIS X0201:1997 / JIS X0208:1997 Shift_JIS fue desarrollado a principios de los años 80, y, al mismo tiempo, los primeros procesadores de texto estaban en el mercado. Fue hecho para conservar la compatibilidad con el juego JIS X 0201:1976. Según la definición de IANA, el juego de caracteres Shift_JIS es ligeramente diferente de IBM932 / CP932. Sin embargo, los nombres "SJIS" y "Shift_JIS" son a menudo utilizados erróneamente, para estos juegos. Para CP932, utilice SJIS-WIN.
(ninguno) Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions Aunque este "juego de caracteres" utiliza el mismo juego que EUC-JP, en realidad es diferente. Solo tiene algunos caracteres de diferencia. ninguno
Windows-31J / csWindows31J Compuesto de JIS X0201:1997 / JIS X0208:1997 / IBM extensions / NEC extensions Aunque este "juego de caracteres" utiliza el mismo juego que Shift_JIS, en realidad es diferente. Solo tiene algunos caracteres de diferencia. (ninguno)
ISO-2022-JP (recomendado) / csISO2022JP US-ASCII / JIS X0201:1976 / JIS X0208:1978 / JIS X0208:1983 » RFC1468 ninguno
JIS
ISO-8859-1
ISO-8859-2
ISO-8859-3
ISO-8859-4
ISO-8859-5
ISO-8859-6
ISO-8859-7
ISO-8859-8
ISO-8859-9
ISO-8859-10
ISO-8859-13
ISO-8859-14
ISO-8859-15
ISO-8859-16
byte2be
byte2le
byte4be
byte4le
BASE64
HTML-ENTITIES
7bit
8bit
EUC-CN
CP936
HZ
EUC-TW
CP950
BIG-5
EUC-KR
UHC (CP949)
ISO-2022-KR
Windows-1251 (CP1251)
Windows-1252 (CP1252)
CP866 (IBM866)
KOI8-R
KOI8-U
add a note

User Contributed Notes

There are no user contributed notes for this page.
To Top